随着容器、微服务、分布式架构、无服务器等新型云计算技术的引入,基于云原生平台承载的应用系统在运维过程中出现的故障越来越变幻莫测,传统运维监控系统不足以支撑故障的快速定位需求,给运维支撑人员带来了非常大的挑战。
宝兰德全景可观测平台解决方案(BES WebGate Observability,简称WG Observe)作为一套针对云原生平台进行全面指标采集、日志收集、调用链追踪能力整合的综合性观测平台。通过业务无侵扰部署、全栈链路追踪、数据自动化关联、大规模数据分析帮助客户快速诊断云原生应用的故障。为平台支撑团队在全面监控数据的支撑下提供深度的云原生基础设施问题剖析;帮助业务开发团队无需修改应用代码即可掌握微服务调用关系和业务级调用链路,助力业务快速上线;利用灵活缩放的可观测地图技术实现不同运营维度的数据承载,指导技术运营团队基于可观测地图进行业务创新。
全景可观测平台解决方案,由各种观测数据采集探针和监控分析平台构成。平台通过多种观测数据采集探针使用专用管理协议、命令行、API等方式获取应用系统全栈的软硬件设备的运行时指标信息、日志信息、调用链信息,统一汇总到可观测平台平台进行关联处理、融合分析、智能化观测剖析,并进行统一的数据存储和展示。
国产化兼容 — 支持对国产化CPU、操作系统、主机、网络、存储、数据库、中间件等基础设施的平台性能及告警数据的监控采集及运行部署。
可观测地图 — 提供多种视角可观测地图,支持可观测地图编辑。自动构建资源、应用、业务系统不同层级分层组织的静态关联和动态关联关系,以观测地图图层方式展现被监控对象数据和拓扑关系,同时支持不同类型观测数据的快速叠加。
全栈数据采集能力 — 对基础设施层、应用层、业务层的性能指标数据、追踪数据以及日志数据的全量采集,支持多种采集方式,包括Agent、JMX、SDK、API、SNMP、EBPF、DPDK、JDBC、WMI等。
无侵入数据采集方式 — 无需应用插码,无需主机或网络设备镜像流量,不用部署sidecar容器,就可以实现业务调用数据的快速采集。占用主机极低的资源,对开发语言透明,运维团队完全可掌握,随需安装随时使用。
全景观测能力 — 展示任意系统、应用、服务、接口、资源之间的部署、依赖及调用关系,结合不同场景展示相应的指标,动态关联监控数据的资源属性、服务属性、业务属性、变更事件等信息。
全栈调用链追踪能力 — 从进程到板卡、从容器到主机服务器,微服务访问链路全栈可追踪。快速定位应用故障,缩短故障恢复时间;快速发现链路瓶颈,提升应用整体性能。
内置智能运维能力 — 内置基于DataOps的异常检测技术、告警收敛技术,有效降低运维团队工作强度,提升云原生故障观测效率。
服务器硬件问题剖析 — 深度剖析服务器设备CPU资源消耗热点,实现函数级的详细分析,找到对应的瓶颈指导代码优化工作。
组件问题剖析 — 全面采集云原生平台公共服务组件如Ngnix、Redis、Zookeeper等软件的性能指标数据,结合组件工作机制、性能表现、问题特征进行集群剖析、深粒度监控,从而快速定位问题的根因和解决思路。
宝兰德全景可观测平台是一款针对企业级云原生环境下快速整合现有监控运维数据,打破数据壁垒,拉通观测场景需求,实现业务及应用的运营、运维、稳定性保障、故障支撑等多种观测需求的综合性可观测平台,主要有以下特性:
● 协议开放,支持通用的标准数据接口规范,可快速接入第三方数据
● 基于自动发现技术和开放的标准实现数据的自动关联,构建全景可观测地图
● 智能化观测点配置,灵活生效,满足观测数据的灵活采集需求
● 运维经验场景化沉淀,降低人员能力需求
● 深度剖析问题根因,全天候专家在线
● 端到端精准跟踪,仿真用户体验,提升重要用户业务体验
● 人工智能加持,让观测轻松便捷
企业级云平台运维能力整合 — 帮助企业汇总已有监控数据,完成能力补齐,提升云原生环境下的运维支撑效能,奠定AIOPS的应用基础。
微服务应用端到端性能分析 — 针对基于微服务架构构建的应用系统运行过程中的调用关系复杂,灵活多变的情况,为支撑团队提供清洗可见的业务请求级调用过程展现。并结合人工智能技术辅助快速识别异常,对告警进行压缩,提升支撑团队故障恢复效能。
基于容器的云原生平台可观测能力搭建 — 为企业提供面向容器技术搭建云原生平台时所需的全栈可观测产品,提供从可观测数据采集、加工、处理、分析、到展现的全套解决方案。
可观测能力框架内生— 提供上千种资源模型,内生支持容器平台资源场景,可观测数据关联规则内生;内生观察数据上报能力,实现动态挂载的观测探针,支持不同集成粒度的技术方案。
可观测地图 — 以“分层分级”为主线思考,将容器云平台的关键概念对象分为资源、应用、服务三层,构建各层对象间,以及跨层对象间的关系,并维护视图,直观呈现给运营维护人员,将云原生全域全流程的黑箱开箱。实现动态资源发现、智能关系生成、可配置可视化视图。基于数据地图、支持数据缩放和数据挂载。
深度剖析工具整合全天候专家在线 — 深度整合专项问题的剖析能力,从性能、资源、组件等角度为系统进行画像,为系统提供断层扫描分析,展示不同场景下系统不同切面,便于针对性问题处置或系统优化。实时剖析基础设施、技术组件问题。
咨询反馈