常见问题
什么是基础设施监测?
基础设施监测用于持续观测主机、容器、进程、网络和云资源的运行状态,帮助团队发现容量、性能、可用性和资源依赖问题。观测云会把这些资源与日志、链路、事件和告警关联,方便排障时快速定位影响范围。
基础设施监测应该关注哪些指标?
常见指标包括 CPU、内存、磁盘、文件系统、网络流量、进程状态、主机负载、容器资源、重启次数和资源在线状态。不同业务还可以通过标签、分组和自定义视图关注关键环境或核心服务。
基础设施监测如何帮助故障排查?
当资源异常时,观测云可以从指标趋势跳转到相关日志、应用 Trace、网络拓扑、事件和告警,帮助团队判断问题来自资源瓶颈、网络连接、容器调度还是应用依赖。
观测云基础设施监测适合哪些团队?
它适合运维、SRE、平台工程、云基础设施和研发团队使用,尤其适合多云、混合云、容器化和微服务环境,需要统一观察资源健康与业务影响的场景。