联系我们

加入社区

微信扫码
加入官方交流群

立即体验

在线开通,按量计费,真正的云服务!

立即开始

选择观测云版本

代码托管平台

Infrastructure Monitoring

基础设施监测

观测云基础设施监测统一观测主机、容器、进程、网络和云资源,关联指标、日志、链路、事件和告警,帮助运维、SRE 和平台团队快速看清资源状态、容量风险和故障影响范围。

联系我们

基础设施监测解决什么问题

把分散资源变成可观测、可关联、可响应的基础设施视图

当主机、容器、网络和云资源分散在不同平台时,排障往往先卡在“资源在哪里、谁受影响、该看哪个指标”。观测云基础设施监测通过 DataKit 采集、统一标签和资源关系视图,把资源运行状态与日志、链路、告警和事件关联起来,帮助团队更快判断问题边界。

资源太分散?先把主机、容器、进程和云资源放到一个视图
基础设施监测覆盖主机、云环境、容器、进程和网络对象,支持标签分组、搜索筛选和自定义基础设施对象。团队可以按环境、业务、地域或负责人快速收敛资源范围,不必在多个控制台之间来回切换。
资源太分散?先把主机、容器、进程和云资源放到一个视图
容量是否吃紧?持续观察 CPU、内存、磁盘和网络指标
容量是否吃紧?持续观察 CPU、内存、磁盘和网络指标
通过主机负载、CPU、内存、磁盘 IO、文件系统、网络吞吐和进程状态等关键指标,持续判断资源是否健康、容量是否接近瓶颈。对于扩容、迁移、硬件更新或稳定性治理,团队可以用真实趋势做判断。
故障影响多大?用拓扑看清主机、容器和网络关系
资源分布图和网络拓扑可以把服务器、容器、网络连接和流量关系可视化呈现。当某台主机、某个节点或某段网络出现异常时,团队能先判断影响范围,再继续定位到相关服务、日志和告警。
故障影响多大?用拓扑看清主机、容器和网络关系
不要只看资源,把指标、日志、链路和告警关联起来
不要只看资源,把指标、日志、链路和告警关联起来
从基础设施对象可以继续查看相关指标、日志、应用链路、网络数据、事件和告警。遇到 CPU 飙高、磁盘空间不足、容器重启或主机离线时,团队可以沿着上下文继续排查,减少重复查询和信息拼接。

常见问题

什么是基础设施监测?

基础设施监测用于持续观测主机、容器、进程、网络和云资源的运行状态,帮助团队发现容量、性能、可用性和资源依赖问题。观测云会把这些资源与日志、链路、事件和告警关联,方便排障时快速定位影响范围。

基础设施监测应该关注哪些指标?

常见指标包括 CPU、内存、磁盘、文件系统、网络流量、进程状态、主机负载、容器资源、重启次数和资源在线状态。不同业务还可以通过标签、分组和自定义视图关注关键环境或核心服务。

基础设施监测如何帮助故障排查?

当资源异常时,观测云可以从指标趋势跳转到相关日志、应用 Trace、网络拓扑、事件和告警,帮助团队判断问题来自资源瓶颈、网络连接、容器调度还是应用依赖。

观测云基础设施监测适合哪些团队?

它适合运维、SRE、平台工程、云基础设施和研发团队使用,尤其适合多云、混合云、容器化和微服务环境,需要统一观察资源健康与业务影响的场景。

相关阅读

想看基础设施监测如何落到你的业务系统?

预约演示