01 前言
在数字化转型纵深推进的今天,企业IT系统正面临前所未有的复杂性挑战——微服务架构普及、多云混合部署、业务与技术深度耦合,使得传统监控手段愈发难以应对高频、隐匿、跨域的故障场景。如何实现从“被动响应”到“主动预判”,从“碎片观测”到“全局掌控”,成为企业保障业务连续性的核心命题。
嘉为蓝鲸全栈智能可观测中心·鲸眼始终以“让运维更智能、让业务更稳定”为使命,持续打磨产品能力。本次 V5.0 版本全面升级,围绕 “智能驱动、精准感知、闭环处置” 三大方向,打造覆盖 “采集-检测-分析-处置-优化” 全链路的智能可观测闭环,助力企业构建面向未来的可观测体系。

02 发布总览
嘉为蓝鲸全栈智能可观测中心·鲸眼V5.0版本聚焦 “更智能的检测、更丰富的上下文、更闭环的联动、更精细的健康度”,推出五大能力升级。
1) 全景观测:
1. 业务架构全景拓扑:一屏掌控全栈依赖
你是否经历过这样的崩溃时刻?点开一个业务拓扑,像打开一张藏宝图——节点密密麻麻铺满屏幕,服务名缩成“...”,IP藏在角落。找个异常节点?靠滚动条+放大镜+运气?
可观测中心V5.0版本彻底终结这种低效体验!
一屏尽收眼底,上下游依赖清晰可溯!


2. 异构环境的“天然屏障”
在以往的业务全景观测拓扑中,由 APM 自动发现的组件集群节点常与数据库、中间件等 CMDB 实例混排在同一层级,水平连线交错复杂,连线横跨多列,导致服务调用链与监控数据源的关系难以一眼识别。
可观测中心V5.0版本重构拓扑层级逻辑:APM自动发现的集群节点独立展示,连线方向垂直化呈现“实例 → 组件集群 → 服务 → 应用”的数据流向,实现异常发生时从故障实例快速上溯至所属 APM 服务与业务应用,根因路径清晰可见。

3. 业务全景观测模型拓展:“网站服务”正式入驻资源概览,拨测告警一图尽显
你不再需要在多个系统间切换查证——用户访问异常?现在,它就“挂”在业务全景最显眼的位置!
「网站服务」作为独立资源模型纳入业务全景体系,为网站配置的 HTTP/HTTPS拨测和主机层TCP/UDP/ICMP拨测任务,其概览与告警直接渲染在节点上,拨测告警不再孤立,直接融入业务上下文。

2) 监控:多维融合,精准定义异常:
1. 多指标组合:让检测回归业务本质
你是否也曾被这样的告警深夜惊醒?——磁盘使用率95%,冲过去却发现还有500GB空间,业务安然无恙;这不是监控失灵,而是单一指标阈值在复杂业务场景中的时代局限。
可观测中心V5.0版本检测引擎全新进化,实现从“单点阈值”到“业务状态”的智能跃迁,支持多指标逻辑组合检测,让告警真正反映业务真实健康状态,实现更贴近业务真实状态的复合告警,有效减少误报漏报,构建更全面的异常判断条件。

2. 硬件监控全面进化:原生支持 Redfish 与 SMI-S,深度掌控新一代基础设施
在云原生与超融合架构加速普及的今天,传统IPMI与SNMP协议已陷入“看得见设备,却看不清健康”的困局——温度、风扇转速等基础指标触手可及,但RAID卡缓存电池老化、磁盘阵列降级、存储控制器隐性故障等致命隐患却深藏不露,直到服务中断才暴露真相。
可观测中心V5.0版本重磅引入Redfish与SMI-S两大新一代硬件管理标准,让基础设施监控从“表面体温”深入“器官级诊断”:
基于RESTful API + JSON架构,天然适配DevOps与云原生体系,全面兼容2015年后Dell iDRAC9+、HPE iLO5+等主流服务器,实时监控存储控制器健康状态、磁盘驱动器预测性失效、RAID卡运行异常等隐性风险,实现服务器硬件状态可视化呈现、全流程可追溯,大幅提升运维效率。
严格遵循SNIA国际标准,凭借一套标准化接口即可纳管Dell EMC、华为OceanStor等多品牌存储设备,有效打破厂商技术壁垒,推动存储运维从“经验驱动”向“数据驱动”转型,降低运维复杂度与成本。
Redfish + SMI-S + SNMP + IPMI 四协议深度融合,全面升级硬件可观测能力,为企业开启智能硬件监控新时代,筑牢基础设施运维安全防线。
3. Blackbox黑盒监控
内置基于Prometheus Blackbox Exporter的探测能力,支持TCP、ICMP探测协议,主动探测Web 服务、API接口、中间件等组件的可用性,有效补齐“外部视角”下的可用性监控盲区,第一时间发现服务假死、防火墙拦截或网络隔离等“看似正常实则不可用”的隐蔽故障,真正以用户视角保障业务连续性。

4. 智能生效,懂交易的监控
检测策略支持多段生效时间与日历联动——不仅可灵活配置多个交易时段(早盘、午盘、夜盘),更能关联自定义日历(如沪深交易所日历),在交易日精准开启、非交易日静默休眠。从此,告警不再“打扰”,只在关键时刻发声,真正让监控系统理解证券、期货等高敏业务的脉搏。

5. 开箱即用:内置 Cluster/ Node / Pod三级全景仪表盘
无需配置、无需导入模板——内置Kubernetes核心资源监控视图:从单个 Pod 的 CPU/内存/网络使用,到 Node 资源水位与驱逐风险,再到 Cluster 级别资源调度健康度,一屏纵览全栈运行状态,让运维从“拼图式排查”迈向“全景式洞察”。



3) 告警:智能关联,闭环驱动处置:
1. 变更上下文与知识库双轮驱动,智能辅助决策
告警详情页一键查看关联“变更单+知识库”,打破信息孤岛,为每一条告警自动注入双重智能上下文,让每一次解决都沉淀为下一次预防的依据。
客户价值:

2. CMDB关联丰富:告警自带业务拓扑地图
自动注入告警对象在CMDB中的依赖链路业务上下文,包括其上游依赖、下游影响、所属业务系统、运维责任人、环境标签等关键属性,将静态配置数据转化为动态诊断线索。每条告警不再孤立,而是“自带业务拓扑地图”,帮助运维人员秒级定位故障根因,从“救火式响应”转向“精准化治理”。

3. 告警智能合并:精准聚合 + 灵活触发,告别告警风暴
当故障发生,运维人员最怕的不是告警本身,而是被淹没在告警洪流中——数百条相似告警刷屏,关键信息被碎片化稀释,处置时机在翻找中悄然流逝。
可观测中心V5.0版本告警智能合并能力,让海量告警回归有序:

4. 告警治理再升级:屏蔽策略精准生效
在复杂的 IT 环境中,告警屏蔽策略是抑制噪音、聚焦关键问题的重要手段。然而,传统屏蔽规则“配置即生效”的模式,常因规则误配导致关键告警被意外屏蔽,或需反复调试才能达到预期效果。
为此,可观测中心V5.0版本正式推出告警屏蔽预览能力——在策略正式生效前,实时模拟屏蔽效果,让您清晰看到“哪些告警会被屏蔽、哪些仍会触发”,大幅提升配置准确率与运维信心。

5. 告警丰富在线调试:字段级实时预览,所见即所得
你是否曾经历过这样的场景?写了一条告警丰富规则,满怀期待地保存上线,结果收到的告警里关键字段还是空的——是表达式写错了?CMDB 数据没同步?还是匹配逻辑有偏差?只能删了重试、反复触发、翻日志……一次调试,耗掉半天。
可观测中心V5.0版本全新上线告警丰富在线调试功能,让每一次告警配置都精准无误。支持字段级别丰富前后对比 与 实时效果预览,实现 “所配即所见,所见即所得” 的高效配置体验,每一步丰富逻辑清晰可见,关键字段一一对齐,差异高亮呈现。

4) APM:健康可视,服务自治
1. 智能接口治理:让健康评分更真实,让观测视图更清晰
在复杂业务场景中,某些特殊接口(如高频探活、压测入口、调试端点)若纳入全局健康评分,会严重扭曲应用真实状态;而大量动态路径(如 /api/user/123、/api/user/456)本质属于同一逻辑接口,却导致指标碎片化、告警噪音激增。为此,我们提供面向业务语义的接口治理能力,两大核心场景,一键解决:

2. 健康评分体系升级
从“统一权重、统一标准”升级为可配置的服务级权重与差异化健康度标准模型,运维人员可根据业务重要性灵活配置应用内各微服务的健康权重,并为每个服务独立定义其健康度判定标准。系统将基于各服务的实时健康状态、自定义健康标准及其权重,动态加权计算整体应用健康评分——核心服务异常对总分影响显著,非关键服务波动影响可控,使评估结果更贴合业务实际,为容量规划、资源调度与故障优先级判断提供精细化、场景化的数据支撑。

3. Trace/Span可视化洞察
Trace/Span检索可视化增强,在Trace/Span检索页面新增三大核心图表:
帮助用户从海量Span中快速建立全局认知,让调用链分析从“文本列表”升级为“可视化洞察”。

4. 精细化控制Trace数据存储策略
为满足企业对APM数据存储成本、性能与高可用的差异化需求,新增应用级存储配置能力,支持按应用隔离存储集群,指定APM应用的Trace数据写入的ES存储集群,实现资源隔离与成本优化,灵活配置索引分片与副本。

5) 日志:可靠归档,洞察即防:
1. 日志归档重试:数据不丢失,追溯有保障
在复杂生产环境中,网络抖动、存储瞬时不可用或权限临时异常等偶发问题,可能导致日志归档任务失败,造成关键审计或排障数据丢失,严重影响故障复盘与合规追溯。
我们全新推出智能日志归档重试机制,在归档失败时自动按采集项进行多轮重试,并记录详细失败原因,确保日志数据最终一致性写入,筑牢可观测数据底座,为企业的日志可靠性与数据治理提供坚不可摧的保障

2. 日志检索一键监控:从发现到预防的无缝跃迁
在日志检索页面发现关键异常时,无需跳转配置界面——点击"添加为监控策略",即可将当前检索关键字一键转化为监控策略,让每一次日志洞察都成为预防未来的哨兵。从"事后排查"进化为"事前预防"。让日志不再只是历史记录,而是实时预警的智能哨兵。

3. 日志主题联合检索:一查贯通
当故障发生,最耗时的往往不是修复,而是追溯——实时日志里线索中断,历史归档中数据沉睡,运维人员被迫在“当前”与“过去”之间反复横跳,根因在时间断层中悄然隐匿。
可观测中心V5.0版本日志主题联合检索,打破时间壁垒:

03 结语
嘉为蓝鲸全栈智能可观测中心V5.0版本以业务价值为锚点,以智能技术为引擎,助力企业:
春启新程,智见未来。嘉为蓝鲸将持续深化 “可观测 × AIOps × 业务” 三位一体融合,推动大模型在根因推理、故障管理、异常预测等场景深度落地,让可观测体系真正成为企业数字化转型的智能神经中枢——感知业务脉搏,预见风险先机,驱动持续增长。
可观测产品选型推荐
嘉为蓝鲸全栈智能可观测中心·鲸眼(简称:可观测中心)基于腾讯蓝鲸平台深度打造,具有全栈一体化、云原生与信创生态适配、智能告警与运维闭环等多项产品能力亮点。
本产品凭借在运维监控与可观测性领域的持续创新与成熟实践,已多次获得国际权威机构Gartner的推荐与认可,如2025 年日志中心与 APM 获《中国智能 IT 监控与日志分析工具市场指南》收录;2024 年入选《中国基础设施战略成熟度曲线》报告;还荣获“信创先进单位”等称号,技术实力与实践价值备受行业认可。
目前,该产品已广泛应用于运营商、政务、金融、交通物流、制造等多个行业,服务包括北京移动、云南电信、华夏银行、大兴机场、苏州市信息中心等多个重点客户,切实满足企业运维可观测建设需求。
100+案例淬炼:应用投产变更管理最佳实践
2026-02-09
查看详细
嘉为蓝鲸DevOps|业务人员跨界修缺陷?AI 打通DevOps全链路,提效超乎想象!
2026-02-09
查看详细
【运维自动化规划】自动化作业设计:从原子操作到流程编排的工程化实践
2026-01-09
查看详细
嘉为蓝鲸DevOps研发测试一体化:从信息孤岛到双向穿透,构建高效协同新范式
2026-01-09
查看详细
嘉为蓝鲸DevOps缺陷管理协同中枢:破解 “单测多研” 质量困局,打造高效协同新范式
2025-12-26
查看详细
【运维自动化规划】自动化场景设计:从组件级到混合场景的全链路自动化构建
2025-12-26
查看详细
申请演示