AWS RDS PostgreSQL可观测性最佳实践

    banner.jpg

    AWS RDS PostgreSQL 介绍

    AWS RDS PostgreSQL 是亚马逊云服务(AWS)提供的托管型 PostgreSQL 数据库服务。

    • 托管服务:AWS 管理数据库的底层基础设施,包括硬件、操作系统、数据库引擎等,用户无需自行维护。
    • 高性能:支持多种实例类型,可以根据需求选择合适的计算和存储资源。
    • 安全性:提供网络隔离(VPC)、加密、访问控制等功能,确保数据安全。
    • 兼容 PostgreSQL:完全兼容开源 PostgreSQL,支持其所有功能,包括扩展、分区等。

    观测云

    观测云是一款专为 IT 工程师打造的全链路可观测产品,它集成了基础设施监控、应用程序性能监控和日志管理,为整个技术栈提供实时可观察性。这款产品能够帮助工程师全面了解端到端的用户体验追踪,了解应用内函数的每一次调用,以及全面监控云时代的基础设施。此外,观测云还具备快速发现系统安全风险的能力,为数字化时代提供安全保障。

    采集器配置

    安装脚本

    1. 登陆观测云控制台
    2. 点击【集成】菜单,选择【云账号管理】
    3. 点击【添加云账号】,选择【AWS】,填写界面所需的信息,如之前已配置过云账号信息,则忽略此步骤
    4. 点击【测试】,测试成功后点击【保存】,如果测试失败,请检查相关配置信息是否正确,并重新测试
    5. 点击【云账号管理】列表上可以看到已添加的云账号,点击相应的云账号,进入详情页
    6. 点击云账号详情页的【集成】按钮,在未安装列表下,找到 AWS RDS PostgreSQL,点击【安装】按钮,弹出安装界面安装即可,点击【安装】按钮,弹出安装界面安装即可。

    关键指标

    指标名称 指标说明 单位
    BinLogDiskUsage 二进制日志磁盘使用情况 (MB) Bytes
    BurstBalance 突发余额(百分比) %
    CheckpointLag 检查点滞后(毫秒) ms
    ConnectionAttempts Connection Attempts (Count) Count
    CPUUtilization CPU 利用率(百分比) %
    FailedSQLServerAgentJobsCount 过去 1 分钟内失败的 Microsoft SQL Server Agent 作业的数量 Count/s
    FreeableMemory 可用内存 (MB) Bytes
    FreeLocalStorage 可用本地存储 (MB) Bytes
    FreeStorageSpace 可用存储空间 (MB) Bytes
    MaximumUsedTransactionIDs 最大已用事务 ID(计数) Count
    NetworkTransmitThroughput 网络传输吞吐量 Bytes/s
    NetworkReceiveThroughput 网络接收吞吐量 Bytes/s
    ReadIOPS 读取 IOPS Count/s
    ReadIOPSLocalStorage 读取 IOPS 本地存储 Count/s
    ReadLatency 读取延迟 ms
    ReplicaLag 副本滞后 ms
    WriteThroughput 写入吞吐量 Bytes/s
    WriteThroughputLocalStorage 写入吞吐量本存储 Bytes/s

    场景视图

    登录观测云控制台,点击「场景」 -「新建仪表板」,输入 “AWS RDS PostgreSQL”, 选择 “AWS RDS PostgreSQL”,点击 “确定” 即可添加视图。

    监控器(告警)

    观测云内置了监控器模板,可以选择从模版创建监控器,并开启适合业务的监控器以及时通知相关成员关注问题,触发条件、频率等信息可以依据实际业务进行调整。

    登录观测云控制台,点击「监控」 -「新建监控器」,输入 “AWS RDS PostgreSQL”, 选择对应的监控器,点击 “确定” 即可添加。

    AWS RDS PostgreSQL 实例连接数过多告警

    AWS RDS PostgreSQL 实例读取操作延迟过高告警

    AWS RDS PostgreSQL 实例CPU使用率过高告警

    总结

    AWS RDS PostgreSQL 提供了一种高效、可扩展且易于管理的数据库解决方案,广泛应用于各种应用程序中。通过利用 RDS 提供的监控工具和指标,开发者和运维人员可以全面了解数据库的运行状态,从而优化数据库性能并确保其在高并发场景下的高效运行。

    联系我们

    加入社区

    微信扫码
    加入官方交流群

    立即体验

    在线开通,按量计费,真正的云服务!

    立即开始

    选择观测云版本

    代码托管平台