我们是如何构建自己的可观测性的
系统一定会有故障,相信作为用户都能理解,但用户需要在故障发生后,能尽快知晓造成故障的根本原因和修复计划,以便有效调整受影响的业务来降低损失;也需要在一次故障解决后,开发运维团队可以总结出经验教训,来提升自己管理运营能力,和提出之后的预防措施。
Elasticsearch SQL的基本使用
通过Elasticsearch SQL功能,使用类SQL语句,可以更便捷查询数据。下文将介绍Elasticsearch SQL常用语法。
排查 log4j2 安全漏洞的一次经历
最近,技术圈被 log4j2 漏洞掀起巨浪,各大安全公司纷纷发文介绍该漏洞的危害,并给出了各种临时解决方案。前不久,我们也发现了一起由 log4j2 漏洞引发的挖矿事件。看我们如何去快速发现问题。
如何通过pipeline实现文本处理
Pipeline又称为文本处理,用户可通过定义文本的解析规则,可以将格式各异的数据切割成符合我们要求的结构化数据,方便我们进行数据查询与关联分析。
跨工作空间授权数据汇总分析实践
通过数据授权管理,实现跨工作空间的数据查看和分析。
如何快速开启网络站点可用性监测
创建基于HTTP、TCP、ICMP、WEBSOCKET等不同协议的拨测任务,全面监测不同地区、不同运营商到各个服务的网络性能、网络质量、网络数据传输稳定性等状况。
如何快速开启异常监控
观测云不仅提供了开箱即用的监控模版,还支持自定义监控器,告警通知功能。支持SLO监控,精准把控服务水准和目标。
如何使用 CI 可视化
在观测云看到Gitlab和Jenkins 的CI全过程,让你从此不再畏惧版本迭代。
如何通过 DataFlux Func 上报自定义数据
通过 DataKit API 和 DataFlux Func 来上报自定义对象数据。
观测云采集 AWS OpenSearch logs 解决方案
通过观测云 Func 将 AWS OpenSearch 日志采集,更好地构建可观测性体系。
DDtrace 自定义 Instrumentation
通过修改dd-trace-java 代码,新增自定义 Instrumentation来实现对内部一些框架埋点的支持,从而丰富调用链细节。
使用 CRD 开启您的 Ingress 可观测之路
观测云支持CRD配置管理采集器,实现了 DataKit 与待采集 Pod 之间的解耦
基于观测云,使用 SkyWalking 实现 RUM、APM 和日志联动分析
SkyWalking 在国内使用比较广泛,观测云支持SkyWalking,并扩展了它的功能,打通前后端实现了联动分析的能力
腾讯云产品可观测最佳实践 (Function)
观测云使用 DataFlux Func 脚本市场可以非常快速的接入腾讯云数据 (腾讯云-云监控 API + 腾讯云产品 API ),更为丰富的指标数据,为系统稳定、定位问题提供技术支撑。
内网场景 Dubbo 微服务接入观测云
内网环境如何通过代理部署 DataKit,实现RUM、APM、日志的联动分析。
使用 velero 备份 Kubernetes 集群方案
Velero 是一款云原生时代的灾难恢复和迁移工具, 利用 velero 用户可以安全的备份、恢复和迁移 Kubernetes 集群资源和持久卷。
当Kubernetes遇见Macvlan—实现CNI路由插件
上次我们使得Pod和Host网络互通,现在我们实现一个CNI插件,通过链式执行自动完成上面的事情。
当Kubernetes遇见Macvlan—网络互通
最近在研究KubeVirt和Virtink两个项目,计划做一个Operator管理虚拟机。Kubernetes API有望成为云计算基础设施管理的事实标准,IaaS关注计算、存储和网络,相比OpenStack,Kubernetes是一个可塑性更强的项目。
DataKit 日志采集系统的设计和实现(二)—— 数据处理
日志采集系统的执行过程,从 “定位日志” 开始,然后是 “数据采集和处理”,最后则是 “同步采集状态”。本文主要介绍第二项,即数据的采集和解析.
DataKit 日志采集系统的设计和实现(一)定位日志
日志采集(logging)是观测云 Datakit 重要的一项,它将主动采集或被动接收的日志数据加以处理,最终上传到观测云中心。日志采集的执行过程可大致分为三段,分别是“定位日志”、“数据处理” 和 “状态同步” 。本文将介绍第一段 “定位日志”。