SRE 与开发的自动化协同 -- 生产环境出现 bug 自动生成异常追踪

    最佳实践.png

    简介

    生产环境 bug 的定义:RUM 应用和 APM 应用的 error_stack 信息被捕捉后成为 bug。
    以 APM 新增错误巡检为例,当出现新错误时,在观测云控制台的「事件」模块下生成新的事件报告,捕捉为 bug。同时利用 Dataflux Func 创建异常追踪,调用观测云 OpenAPI ,在观测云控制台的「异常追踪」模块下新建 Issue,当重复出现 bug,合并至已有异常追踪。

    实现流程

    1.在观测云新建一个应用

    根据接入的应用类型可分别查看对应文档

    2.在 Dataflux Func 中安装APM 新增错误脚本或RUM 新增错误脚本。

    3.根据 OpenAPI 接口在巡检 example 脚本中添加创建 issue 动作。
    示例代码如下:

    4.查看观测云控制台的「异常追踪」模块,可看到:

    总结

    对于智能巡检的所有脚本,都可以在生成事件报告时新建 issue。但因为在事件列表和异常追踪列表有重复的信息上报,所以往往不会有新建 issue 的动作。利用本篇最佳实践,用户可根据创建的 issue 在异常追踪列表对巡检事件进行修复跟踪,不需要再单独到事件列表寻找独立上报的事件进行跟踪。

    联系我们

    加入社区

    微信扫码
    加入官方交流群

    立即体验

    在线开通,按量计费,真正的云服务!

    立即开始

    选择观测云版本

    代码托管平台