首页

/

嘉为蓝鲸全栈智能可观测中心V5.0正式上线!构建更智能、更精准、更闭环的企业级可观测新范式

发布日期:2026-03-27 10:49:03

作者:嘉为蓝鲸

分享到

01 前言

在数字化转型纵深推进的今天,企业IT系统正面临前所未有的复杂性挑战——微服务架构普及、多云混合部署、业务与技术深度耦合,使得传统监控手段愈发难以应对高频、隐匿、跨域的故障场景。如何实现从“被动响应”到“主动预判”,从“碎片观测”到“全局掌控”,成为企业保障业务连续性的核心命题。


嘉为蓝鲸全栈智能可观测中心·鲸眼始终以“让运维更智能、让业务更稳定”为使命,持续打磨产品能力。本次 V5.0 版本全面升级,围绕 “智能驱动、精准感知、闭环处置” 三大方向,打造覆盖 “采集-检测-分析-处置-优化” 全链路的智能可观测闭环,助力企业构建面向未来的可观测体系。


02 发布总览

嘉为蓝鲸全栈智能可观测中心·鲸眼V5.0版本聚焦 “更智能的检测、更丰富的上下文、更闭环的联动、更精细的健康度”,推出五大能力升级。


1) 全景观测:

1. 业务架构全景拓扑:一屏掌控全栈依赖

你是否经历过这样的崩溃时刻?点开一个业务拓扑,像打开一张藏宝图——节点密密麻麻铺满屏幕,服务名缩成“...”,IP藏在角落。找个异常节点?靠滚动条+放大镜+运气?

可观测中心V5.0版本彻底终结这种低效体验!

一屏尽收眼底,上下游依赖清晰可溯!

  • 智能分层布局:按照应用、服务、组件、基础资源、硬件资源等八大层级展示业务下所有监控对象的架构脉络,分层呈现完整依赖链路,让拓扑成为业务稳定的导航仪,实现从碎片化排查到全景式洞察



  • 多维节点聚合:面对海量节点,拓扑提供三种聚合策略(自定义聚合,CMDB聚合,集群聚合),复杂架构从容驾驭,点击任意聚合节点,子节点瞬间以高密度蜂窝阵列展开,空间利用率提升 300%,关键信息一目了然!



2. 异构环境的“天然屏障”

在以往的业务全景观测拓扑中,由 APM 自动发现的组件集群节点常与数据库、中间件等 CMDB 实例混排在同一层级,水平连线交错复杂,连线横跨多列,导致服务调用链与监控数据源的关系难以一眼识别。


可观测中心V5.0版本重构拓扑层级逻辑:APM自动发现的集群节点独立展示,连线方向垂直化呈现“实例 → 组件集群 → 服务 → 应用”的数据流向,实现异常发生时从故障实例快速上溯至所属 APM 服务与业务应用,根因路径清晰可见。



3. 业务全景观测模型拓展:“网站服务”正式入驻资源概览,拨测告警一图尽显

你不再需要在多个系统间切换查证——用户访问异常?现在,它就“挂”在业务全景最显眼的位置!


「网站服务」作为独立资源模型纳入业务全景体系,为网站配置的 HTTP/HTTPS拨测和主机层TCP/UDP/ICMP拨测任务,其概览与告警直接渲染在节点上,拨测告警不再孤立,直接融入业务上下文。



2) 监控:多维融合,精准定义异常:

1. 多指标组合:让检测回归业务本质

你是否也曾被这样的告警深夜惊醒?——磁盘使用率95%,冲过去却发现还有500GB空间,业务安然无恙;这不是监控失灵,而是单一指标阈值在复杂业务场景中的时代局限。


可观测中心V5.0版本检测引擎全新进化,实现从“单点阈值”到“业务状态”的智能跃迁,支持多指标逻辑组合检测,让告警真正反映业务真实健康状态,实现更贴近业务真实状态的复合告警,有效减少误报漏报,构建更全面的异常判断条件。



2. 硬件监控全面进化:原生支持 Redfish 与 SMI-S,深度掌控新一代基础设施

在云原生与超融合架构加速普及的今天,传统IPMI与SNMP协议已陷入“看得见设备,却看不清健康”的困局——温度、风扇转速等基础指标触手可及,但RAID卡缓存电池老化、磁盘阵列降级、存储控制器隐性故障等致命隐患却深藏不露,直到服务中断才暴露真相。


可观测中心V5.0版本重磅引入Redfish与SMI-S两大新一代硬件管理标准,让基础设施监控从“表面体温”深入“器官级诊断”:

  • Redfish:服务器硬件的"全息透视镜"

基于RESTful API + JSON架构,天然适配DevOps与云原生体系,全面兼容2015年后Dell iDRAC9+、HPE iLO5+等主流服务器,实时监控存储控制器健康状态、磁盘驱动器预测性失效、RAID卡运行异常等隐性风险,实现服务器硬件状态可视化呈现、全流程可追溯,大幅提升运维效率。

  • SMI-S 协议支持:存储设备的"统一语言"

严格遵循SNIA国际标准,凭借一套标准化接口即可纳管Dell EMC、华为OceanStor等多品牌存储设备,有效打破厂商技术壁垒,推动存储运维从“经验驱动”向“数据驱动”转型,降低运维复杂度与成本。


Redfish + SMI-S + SNMP + IPMI 四协议深度融合,全面升级硬件可观测能力,为企业开启智能硬件监控新时代,筑牢基础设施运维安全防线。


3. Blackbox黑盒监控

内置基于Prometheus Blackbox Exporter的探测能力,支持TCP、ICMP探测协议,主动探测Web 服务、API接口、中间件等组件的可用性,有效补齐“外部视角”下的可用性监控盲区,第一时间发现服务假死、防火墙拦截或网络隔离等“看似正常实则不可用”的隐蔽故障,真正以用户视角保障业务连续性。



4. 智能生效,懂交易的监控

检测策略支持多段生效时间与日历联动——不仅可灵活配置多个交易时段(早盘、午盘、夜盘),更能关联自定义日历(如沪深交易所日历),在交易日精准开启、非交易日静默休眠。从此,告警不再“打扰”,只在关键时刻发声,真正让监控系统理解证券、期货等高敏业务的脉搏。



5. 开箱即用:内置 Cluster/ Node / Pod三级全景仪表盘

无需配置、无需导入模板——内置Kubernetes核心资源监控视图:从单个 Pod 的 CPU/内存/网络使用,到 Node 资源水位与驱逐风险,再到 Cluster 级别资源调度健康度,一屏纵览全栈运行状态,让运维从“拼图式排查”迈向“全景式洞察”。



3) 告警:智能关联,闭环驱动处置:

1. 变更上下文与知识库双轮驱动,智能辅助决策

告警详情页一键查看关联“变更单+知识库”,打破信息孤岛,为每一条告警自动注入双重智能上下文,让每一次解决都沉淀为下一次预防的依据。


客户价值:

  • 提速根因分析:变更类故障定位从小时级缩短至分钟级。
  • 降低重复处置:同类问题解决效率提升60%,避免"重复踩坑"。
  • 强化变更闭环:通过故障反向验证变更质量,驱动运维持续改进。




2.  CMDB关联丰富:告警自带业务拓扑地图

自动注入告警对象在CMDB中的依赖链路业务上下文,包括其上游依赖、下游影响、所属业务系统、运维责任人、环境标签等关键属性,将静态配置数据转化为动态诊断线索。每条告警不再孤立,而是“自带业务拓扑地图”,帮助运维人员秒级定位故障根因,从“救火式响应”转向“精准化治理”。



3. 告警智能合并:精准聚合 + 灵活触发,告别告警风暴

当故障发生,运维人员最怕的不是告警本身,而是被淹没在告警洪流中——数百条相似告警刷屏,关键信息被碎片化稀释,处置时机在翻找中悄然流逝。


可观测中心V5.0版本告警智能合并能力,让海量告警回归有序:

  • 精准聚合:支持按告警对象、CMDB业务、集群、云区域等任意字段智能分组,同类告警精准归堆,差异信息完整保留——避免“混杂打包”导致的定位失焦,故障影响范围一目了然。
  • 时效触发:高优先级故障触发立即合并,通知秒级触达,抢占处置黄金时间;低优先级异常采用周期聚合,信息完整汇总后统一推送,避免碎片化干扰。时效与完整性的平衡,交由业务场景自主定义。




4. 告警治理再升级:屏蔽策略精准生效

在复杂的 IT 环境中,告警屏蔽策略是抑制噪音、聚焦关键问题的重要手段。然而,传统屏蔽规则“配置即生效”的模式,常因规则误配导致关键告警被意外屏蔽,或需反复调试才能达到预期效果。


为此,可观测中心V5.0版本正式推出告警屏蔽预览能力——在策略正式生效前,实时模拟屏蔽效果,让您清晰看到“哪些告警会被屏蔽、哪些仍会触发”,大幅提升配置准确率与运维信心。



5. 告警丰富在线调试:字段级实时预览,所见即所得

你是否曾经历过这样的场景?写了一条告警丰富规则,满怀期待地保存上线,结果收到的告警里关键字段还是空的——是表达式写错了?CMDB 数据没同步?还是匹配逻辑有偏差?只能删了重试、反复触发、翻日志……一次调试,耗掉半天。


可观测中心V5.0版本全新上线告警丰富在线调试功能,让每一次告警配置都精准无误。支持字段级别丰富前后对比 与 实时效果预览,实现 “所配即所见,所见即所得” 的高效配置体验,每一步丰富逻辑清晰可见,关键字段一一对齐,差异高亮呈现。



4) APM:健康可视,服务自治

1. 智能接口治理:让健康评分更真实,让观测视图更清晰

在复杂业务场景中,某些特殊接口(如高频探活、压测入口、调试端点)若纳入全局健康评分,会严重扭曲应用真实状态;而大量动态路径(如 /api/user/123、/api/user/456)本质属于同一逻辑接口,却导致指标碎片化、告警噪音激增。为此,我们提供面向业务语义的接口治理能力,两大核心场景,一键解决:

  1. 精准屏蔽干扰接口,屏蔽指定接口的 Span 数据,不计入健康评分计算,避免其高频率或异常波动拉低整体健康分。
  2. 多个接口路径智能混淆为单一逻辑接口,健康评分基于业务逻辑单元计算,不再被 ID 爆炸干扰,既呈现真实服务性能,又让告警策略可作用于“逻辑接口”,大幅降低噪音。这不是简单的“隐藏数据”,而是对观测体系的深度校准。
  • 对运维:健康评分 = 真实业务可用性,不再被“噪声接口”误导;
  • 对SRE:指标聚合 = 业务语义视角,告别碎片化视图;
  • 对产品:故障定位 = 秒级聚焦核心链路,提升MTTR。




2. 健康评分体系升级

从“统一权重、统一标准”升级为可配置的服务级权重与差异化健康度标准模型,运维人员可根据业务重要性灵活配置应用内各微服务的健康权重,并为每个服务独立定义其健康度判定标准。系统将基于各服务的实时健康状态、自定义健康标准及其权重,动态加权计算整体应用健康评分——核心服务异常对总分影响显著,非关键服务波动影响可控,使评估结果更贴合业务实际,为容量规划、资源调度与故障优先级判断提供精细化、场景化的数据支撑。



3. Trace/Span可视化洞察

Trace/Span检索可视化增强,在Trace/Span检索页面新增三大核心图表:

  • 请求量统计图:实时展示服务/接口的调用量趋势。
  • 错误数统计图:直观呈现异常请求分布,快速定位故障时段。
  • 耗时分布热力图:以颜色深浅展示不同时间段、不同接口的响应延迟分布,一眼识别性能瓶颈。

帮助用户从海量Span中快速建立全局认知,让调用链分析从“文本列表”升级为“可视化洞察”。



4. 精细化控制Trace数据存储策略

为满足企业对APM数据存储成本、性能与高可用的差异化需求,新增应用级存储配置能力,支持按应用隔离存储集群,指定APM应用的Trace数据写入的ES存储集群,实现资源隔离与成本优化,灵活配置索引分片与副本。



5) 日志:可靠归档,洞察即防:

1. 日志归档重试:数据不丢失,追溯有保障

在复杂生产环境中,网络抖动、存储瞬时不可用或权限临时异常等偶发问题,可能导致日志归档任务失败,造成关键审计或排障数据丢失,严重影响故障复盘与合规追溯。


我们全新推出智能日志归档重试机制,在归档失败时自动按采集项进行多轮重试,并记录详细失败原因,确保日志数据最终一致性写入,筑牢可观测数据底座,为企业的日志可靠性与数据治理提供坚不可摧的保障

  • 对运维:再也不用在凌晨三点手动补日志,告别“数据黑洞”焦虑。
  • 对安全:关键操作日志100%可追溯,审计检查从容过关。对业务:故障复盘有据可依,MTTR直接砍半。
  • 对企业:筑牢可观测数据底座,让“数据驱动运维”真正落地。


2. 日志检索一键监控:从发现到预防的无缝跃迁

在日志检索页面发现关键异常时,无需跳转配置界面——点击"添加为监控策略",即可将当前检索关键字一键转化为监控策略,让每一次日志洞察都成为预防未来的哨兵。从"事后排查"进化为"事前预防"。让日志不再只是历史记录,而是实时预警的智能哨兵。



3. 日志主题联合检索:一查贯通

当故障发生,最耗时的往往不是修复,而是追溯——实时日志里线索中断,历史归档中数据沉睡,运维人员被迫在“当前”与“过去”之间反复横跳,根因在时间断层中悄然隐匿。

可观测中心V5.0版本日志主题联合检索,打破时间壁垒:

  • 一次检索,同时覆盖未归档的实时日志与已归档的历史日志。
  • 无需切换数据源、无需记忆归档时间点,跨分钟级到数月前无缝关联。
  • 异常传播链完整呈现:从“此刻告警”回溯至“数小时前的首次征兆”。


03 结语

嘉为蓝鲸全栈智能可观测中心V5.0版本以业务价值为锚点,以智能技术为引擎,助力企业:

  • 从“被动救火”转向“主动预见”
  • 从“数据堆砌”升维“决策洞察”
  • 从“运维工具”进化为“业务增长伙伴”

春启新程,智见未来。嘉为蓝鲸将持续深化 “可观测 × AIOps × 业务” 三位一体融合,推动大模型在根因推理、故障管理、异常预测等场景深度落地,让可观测体系真正成为企业数字化转型的智能神经中枢——感知业务脉搏,预见风险先机,驱动持续增长。


可观测产品选型推荐

嘉为蓝鲸全栈智能可观测中心·鲸眼(简称:可观测中心)基于腾讯蓝鲸平台深度打造,具有全栈一体化、云原生与信创生态适配、智能告警与运维闭环等多项产品能力亮点。


本产品凭借在运维监控与可观测性领域的持续创新与成熟实践,已多次获得国际权威机构Gartner的推荐与认可,如2025 年日志中心与 APM 获《中国智能 IT 监控与日志分析工具市场指南》收录;2024 年入选《中国基础设施战略成熟度曲线》报告;还荣获“信创先进单位”等称号,技术实力与实践价值备受行业认可。


目前,该产品已广泛应用于运营商、政务、金融、交通物流、制造等多个行业,服务包括北京移动、云南电信、华夏银行、大兴机场、苏州市信息中心等多个重点客户,切实满足企业运维可观测建设需求。

免费申请演示

联系我们

服务热线:

020-38847288

QQ咨询:

3593213400

在线沟通:

立即咨询
查看更多联系方式

申请演示

请登录后在查看!