KubeCost 可观测最佳实践

    FinOps 背景需求

    在典型的互联网公司的成本组成中,IT 成本占比并不低,技术成本与人力成本的比例差不多在 1:2 ~ 1:2.5 左右, 降低 IT 成本显然能带来立竿见影的效果。

    近 10 年来云计算、云原生、容器、Kubernetes、DevOps 等技术的高速发展,使得 IT 成本的管理变得更加复杂,也给成本的管理带来了更多的挑战。目前大多数互联网公司,都基于 Kubernetes 实现资源的统一管控,实现统一的大池子,基于此的统一调度、分配、混合云等都是过去降本增效的重要手段。

    但是,随着成本治理的深入,用户会发现资源治理团队的压力会越来越大。因为资源获取途径的简化,会导致资源使用方很容易的开出大量资源,导致资源成本快速上升或剧烈波动,并且这个过程在流程上缺乏管控。

    在云原生时代,随着资源池化之后,成本默认归属到了技术中心部门,业务部门对成本没有感知,同时缺乏有效的手段针将成本拆分到业务线,即典型的大账问题 ,导致无法有效评估业务 ROI。

    Kubecost 简介

    为了解决“大帐问题”,分大帐为细账,Kubecost 成本计量工具应运而生。Kubecost 是一款专为 Kubernetes 环境设计的成本监控与优化工具,是开源工具 OpenCost 的商业化版本。通过提供详尽的资源使用情况报告,帮助用户深入了解其 Kubernetes 集群的运行成本。Kubecost 的核心价值在于它能够为用户提供一个直观且易于理解的界面,让用户能够轻松地追踪和管理云资源的成本。无论是对于初创企业还是大型组织,Kubecost 都能帮助它们实现更高效的资源利用和成本控制。

    Kubecost 的设计理念是基于这样的认识:随着 Kubernetes 在现代云原生架构中的广泛应用,越来越多的企业开始面临如何有效管理和优化云成本的问题。Kubecost 通过集成多种云服务提供商的数据,为用户提供了一个统一的视图,使得成本管理变得更加简单直接。此外,Kubecost 还支持自定义成本分配规则,这意味着用户可以根据自身业务需求灵活调整成本计算方式,进一步提升成本管理的精准度。

    核心功能

    Kubecost 提供了一系列强大的功能,旨在帮助用户更好地理解和控制 Kubernetes 环境下的云成本。以下是 Kubecost 的几个关键特性:

    • 成本可视化:Kubecost 通过图表和仪表板的形式,为用户提供了一个清晰的成本概览。用户可以查看不同时间范围内的成本趋势,以及按命名空间、工作负载等维度细分的成本详情。
    • 成本预测:基于历史数据,Kubecost 可以预测未来的成本趋势,帮助用户提前规划预算并做出相应的成本优化决策。
    • 成本分配:Kubecost 支持自定义成本分配规则,允许用户根据实际业务场景调整成本分摊方式,确保成本计算更加符合实际情况。
    • 成本优化建议:Kubecost 不仅提供成本数据,还会根据用户的使用情况给出具体的优化建议,比如推荐更适合的工作负载配置或资源利用率改进方案。
    • 多云支持:Kubecost 支持多种云服务提供商,包括 AWS、Azure 和 Google Cloud 等,使得用户可以在不同的云环境中统一管理成本。

    通过这些功能,Kubecost 成为了 Kubernetes 用户不可或缺的工具之一,帮助他们在享受云原生技术带来的便利的同时,也能够有效地控制和优化成本。

    观测云集成

    观测云提供了集成 KubeCost 的能力,通过 ServiceMonitor 方式获取。

    前置条件

    • 安装 K8S 环境
    • 安装 KubeCost
    • 安装 DataKit
    • 安装 Prometheus Operator

    CRD 配置

    KubeCost 已暴露了指标,只需要让 DataKit 能够发现指标并上报。

    • 新增 kubecost-serverMonitor.yaml
    apiVersion: monitoring.coreos.com/v1
    kind: ServiceMonitor
    metadata:
      name: kubecost-metrics
      labels:
        app.kubernetes.io/name: cost-analyzer
      namespace: kubecost
    spec:
      selector:
        matchLabels:
          app.kubernetes.io/name: cost-analyzer
      endpoints:
        - interval: 30s
          path: /metrics
          port: tcp-model
          params:
            measurement:
              - kubecost-cost-analyzer
    
    • 执行
    kubectl apply -f kubecost-serverMonitor.yaml
    

    DataKit 配置

    如已开启,请忽略。

    • 开启 DataKit Service Monitor 自动发现

    添加 env : ENV_INPUT_CONTAINER_ENABLE_AUTO_DISCOVERY_OF_PROMETHEUS_SERVICE_MONITORS

    apiVersion: apps/v1
    kind: DaemonSet
    metadata:
      labels:
        app: daemonset-datakit
      name: datakit
      namespace: datakit
    spec:
      ...
      template:
        ...
        spec:
          ...
          containers:
          - env:
            ...
            - name: ENV_INPUT_CONTAINER_ENABLE_AUTO_DISCOVERY_OF_PROMETHEUS_SERVICE_MONITORS
              value: "true"
            ...
    

    场景视图

    登录观测云控制台,点击「场景」 -「新建仪表板」,输入 “KubeCost”, 选择 “KUBECOST”监控视图,点击 “确定” 即可添加视图。

    关键指标

    以下是 KubeCost 关键指标的描述信息。

    Metric 描述
    container_cpu_allocation container cpu 分配
    container_gpu_allocation container gpu 分配
    container_memory_allocation_bytes container 内存分配
    pv_hourly_cost PersistentVolume 每小时成本
    node_total_hourly_cost 节点每小时总成本
    node_cpu_hourly_cost 节点 cpu 每小时成本
    node_ram_hourly_cost 节点 ram 每小时成本
    node_gpu_hourly_cost 节点 gpu 每小时成本

    总结

    观测云可以集成 KubeCost,获取 KubeCost 的指标并基于相关指标定制成本使用的相关视图,从而通过关注成本视图采取一些列的成本控制与优化策略,为企业的 FinOps 建设赋能。

    联系我们

    加入社区

    微信扫码
    加入官方交流群

    立即体验

    在线开通,按量计费,真正的云服务!

    立即开始

    选择观测云版本

    代码托管平台