IT基础设施监控-主机容器与云资源监控平台｜观测云

联系我们

加入社区

微信扫码
加入官方交流群

立即体验

在线开通，按量计费，真正的云服务！

立即开始

选择观测云版本

免费版商业版企业版

代码托管平台

GitHub Gitee

基础设施监控解决什么问题

把分散资源变成可观测、可关联、可响应的基础设施视图

当主机、容器、网络和云资源分散在不同平台时，排障往往先卡在“资源在哪里、谁受影响、该看哪个指标”。观测云基础设施监控通过 DataKit 采集、统一标签、指标监控和资源关系视图，把资源运行状态与日志、链路、告警和事件关联起来，帮助团队更快判断问题边界。

01统一资源入口集中查看主机、容器、进程、网络和云资源状态
02容量性能分析持续观察 CPU、内存、磁盘、网络和负载趋势
03拓扑关系定位通过资源分布和依赖关系判断故障影响范围
04上下文关联从指标跳转到日志、链路、事件和告警继续分析

资源太分散？先把主机、容器、进程和云资源放到一个视图

基础设施监控覆盖主机、云环境、容器、进程和网络对象，支持标签分组、搜索筛选、指标监控仪表板和自定义基础设施对象。团队可以按环境、业务、地域或负责人快速收敛资源范围，不必在多个控制台之间来回切换。

预约演示查看文档

资源太分散？先把主机、容器、进程和云资源放到一个视图

容量是否吃紧？持续观察 CPU、内存、磁盘和网络指标

容量是否吃紧？持续观察 CPU、内存、磁盘和网络指标

通过主机负载、CPU、内存、磁盘 IO、文件系统、网络吞吐和进程状态等关键指标，持续判断资源是否健康、容量是否接近瓶颈。对于扩容、迁移、硬件更新或稳定性治理，团队可以用真实趋势做判断。

预约演示查看文档

故障影响多大？用拓扑看清主机、容器和网络关系

资源分布图和网络拓扑可以把服务器、容器、网络连接和流量关系可视化呈现。当某台主机、某个节点或某段网络出现异常时，团队能先判断影响范围，再继续定位到相关服务、日志和告警。

预约演示查看文档

故障影响多大？用拓扑看清主机、容器和网络关系

不要只看资源，把指标、日志、链路和告警关联起来

不要只看资源，把指标、日志、链路和告警关联起来

从基础设施对象可以继续查看相关指标、日志、应用链路、网络数据、事件和告警。遇到 CPU 飙高、磁盘空间不足、容器重启或主机离线时，团队可以沿着上下文继续排查，减少重复查询和信息拼接。

预约演示查看文档

常见问题

什么是基础设施监控？

基础设施监控用于持续观测主机、容器、进程、网络和云资源的运行状态。观测云会把指标监控、仪表板、日志、链路、事件和告警关联起来，方便排障时快速定位影响范围。

基础设施监控应该关注哪些指标？

常见指标包括 CPU、内存、磁盘、文件系统、网络流量、进程状态、主机负载、容器资源、重启次数和资源在线状态。不同业务还可以通过标签、分组和自定义视图关注关键环境或核心服务。

基础设施监控如何帮助故障排查？

当资源异常时，观测云可以从指标趋势跳转到相关日志、应用 Trace、网络拓扑、事件和告警，帮助团队判断问题来自资源瓶颈、网络连接、容器调度还是应用依赖。

观测云基础设施监控适合哪些团队？

它适合运维、SRE、平台工程、云基础设施和研发团队使用，尤其适合多云、混合云、容器化和微服务环境，需要统一观察资源健康与业务影响的场景。

继续探索

资源与延伸阅读

从产品文档、相关方案到技术实践，按当前问题选择下一步。

相关阅读

来自产品实践、故障排查与技术方案的精选内容

Kubernetes 可观测最佳实践

Kubernetes 可观测最佳实践

本实践通过观测云提供的监控解决方案，简化 Kubernetes 监控的复杂性，通过直观的监控界面，帮助用户更好地管理和优化 Kubernetes 集群。

Docker Container 可观测性最佳实践

Docker Container 可观测性最佳实践

本文介绍如何通过观测云构建 Docker 可观测性。

Kubelet 可观测性最佳实践

Kubelet 可观测性最佳实践

本文介绍如何通过观测云采集 Kubelet 的指标数据，有效地监控 Kubelet 的性能，提高 Kubernetes 集群的整体可靠性和性能。

AWS ECS On Fargate 监控可观测最佳实践

AWS ECS On Fargate 监控可观测最佳实践

观测云全面支持在 Amazon ECS on Fargate 上的可观测能力，提供包括对基础资源的监控、应用程序链路跟踪和日志监控等。文章将对在该环境上如何实现可观测进行说明和展示。