联系我们

加入社区

微信扫码
加入官方交流群

立即体验

在线开通,按量计费,真正的云服务!

立即开始

选择观测云版本

代码托管平台

Alerting / Anomaly Detection

监控告警

观测云监控告警将指标、日志、链路、事件、可用性和业务数据转化为可响应的异常检测规则,通过分级告警、事件聚合和多渠道通知,帮助 SRE、运维和研发团队减少告警噪音并更快处理真正影响业务的问题。

联系我们

监控告警解决什么问题

把异常检测、通知触达和事件分析连成闭环

告警的价值不只是提醒,而是帮助团队更早发现问题、判断优先级并进入处理流程。观测云监控告警支持阈值、突变、日志、DQL 和多数据源检测,并把告警事件与日志、链路、资源和事件中心关联,减少无效通知和重复排查。

不知道该监控什么?用内置检测库先覆盖核心风险
观测云内置主机 CPU、内存、磁盘、端口、容器、应用、日志和可用性等常见检测模板。团队可以快速启用基础规则,再根据业务服务、关键接口、日志字段和 SLO 目标补充自定义检测。
不知道该监控什么?用内置检测库先覆盖核心风险
告警要触达正确的人,而不是把所有人都吵醒
告警要触达正确的人,而不是把所有人都吵醒
监控告警支持多级别告警、恢复通知、静默策略和多渠道触达,可通过邮件、短信、飞书、钉钉、企业微信等方式通知相关团队。告警规则可以按业务、环境、服务和负责人配置,减少无关人员被打扰。
收到告警之后,继续看日志、链路、资源和变更上下文
告警触发后会沉淀为事件,团队可以在事件详情中继续查看相关日志、APM Trace、基础设施指标、网络数据和变更记录。对于重复告警和事件风暴,也可以通过聚合分析判断是否属于同一影响面。
收到告警之后,继续看日志、链路、资源和变更上下文

常见问题

什么是监控告警?

监控告警用于把指标、日志、链路、可用性和业务数据中的异常转化为通知和事件,帮助团队及时发现问题并进入响应流程。

观测云支持哪些告警规则?

观测云支持阈值检测、突变检测、日志检测、DQL 查询、自定义查询和多类内置检测模板,适合基础设施、应用、日志、网络、可用性和业务数据等场景。

如何减少告警噪音?

可以通过告警级别、静默策略、恢复通知、事件聚合、责任人路由和业务标签来减少重复通知,让告警更准确地触达需要处理的人。

告警触发后如何继续排查?

告警会进入事件中心,并可关联日志、Trace、指标、基础设施、网络和变更上下文,帮助团队从异常现象继续定位影响范围和可能根因。

相关阅读

想看监控告警如何落到你的业务系统?

预约演示