联系我们

加入社区

微信扫码
加入官方交流群

立即体验

在线开通,按量计费,真正的云服务!

免费开启

支持私有云环境部署

代码托管平台

面向游戏开发团队的观测云

游戏行业可观测方案 - 极速响应,无限扩展,全面监测端到端

游戏行业可观测痛点

01

开发速度快:开源可观测平台构建周期长,与游戏开发节奏不符,无法满足观测需求

02

数据激增:海量玩家产生的数据让开源方案力不从心,难以有效处理庞大的数据规模

03

客户端至关重要:开源解决方案未能满足游戏行业对端能力的高要求

04

项目组压力:需要即时可用的解决方案,但缺乏专业团队支持

05

数据分散,监测覆盖不足:开源解决方案无法全面监测游戏运营环节,缺乏数据关联分析能力

游戏行业可观测方案

全面的观测能力

从基础设施到服务端到游戏终端,可以对所有方面进行详尽观测和监控

支持主流的云平台的监控统一

确保您可以在一个平台上监控和管理各种云服务

提供超过 400+ 技术栈的支持

无论您使用哪种技术栈,都能得到支持

提供各种服务端技术的追踪支持

让您能够深入了解服务端的运行情况

支持 HTML/android/IOS 等多端

无论您的游戏在哪个平台上运行,都能得到支持

灵活的仪表板组织分析所有数据

让您可以轻松地分析和理解收集到的数据

更多的功能和扩展,让您可以深入了解游戏的各个方面并做出相应的优化和改进

强大的日志能力

统一收集服务端日志与客户端日志,确保您能够全面了解游戏的运行情况

  • 提供强大的日志搜索和分析能力,让您可以快速找到需要的日志信息并进行分析
  • 提供标准工具收集服务端日志,让您可以方便地收集和管理服务端的日志数据
  • 端 SDK 也可以请求收集客户端日志,让您可以全面了解客户端的运行情况和用户行为
更多的日志功能和扩展,让您可以深入了解游戏的各个环节和细节

强大的端体验观测分析能力

让您可以全面了解游戏玩家的体验和行为

自动化埋点

支持 HTML/IOS/Android/Unity 自动化埋点,让您能够自动化收集和分析玩家的行为数据

提升用户体验

通过观测提升整个客户端的稳定性和体验,让您能够优化游戏的运行和用户体验

追踪全生命周期

支持追踪分析每一个玩家的全生命周期的体验,让您能够深入了解玩家的行为和需求

强大的扩展能力,让您可以更好地跟踪和分析游戏玩家的行为和偏好

全球化接入

让您的游戏在全球范围内能够快速接入观测云

无论游戏发行在哪里,都可以快速接入观测云,确保您的游戏能够在全球范围内得到观测和监控

全球化合规,确保数据符合当地的法规和要求,保护用户隐私和数据安全

极具性价比

让您在观测和监控方面获得更大的价值和效益

更多的功能和服务,让您可以更好地满足游戏观测和监控的需求,并提升游戏的运营和用户体验

客户案例

极致游戏 某游戏公司

客户挑战

  • 基础设施使用Zabbix,UI 交互比较原始,不易使用,不便于分析数据;
  • 日志管理曾使用阿里云SLS,前端观测使用 Ugly 收集的信息不准确;
  • 监控告警不及时,仅收集崩溃等错误信息,无法做用户行为分析。

解决方案

针对监控平台对于性能、采集、实时监控告警的诉求,观测云提供了相应解决方案帮助客户解决上线后的数据采集、查询、分析和监控告警等问题。

  • 观测云的日志服务提供日志提取,聚合,可视化,异常检测和告警等能力,帮助极致游戏实现异常业务日志分析,快速识别登录异常,玩家掉线,操作报错等错误,并提供实时电话告警能力;
  • 观测云前端 SDK 兼容 Unity,实时收集游戏用户行为数据,包括崩溃,Error,前端日志,Action等信息。

客户价值

  • 通过强大的日志字段提取和监测能力,实现故障及时告警,降低对业务的影响;
  • 通过对用户行为数据追踪和分析,持续优化游戏用户体验,增加用户留存,减少流失率;
  • 在新开服期间,通过观测云赋能压力测试,快速识别压测期间性能瓶颈,定位根因,确保新服上线成功。

客户挑战

  • 为了应对可能成为爆款的游戏会存在瞬间出现大量的登录请求的情况,客户尝试通过服务的容器化部署,并利用 HPA(Horizontal Pod Autoscaling)的功能,在请求量突增的情况下,通过快速的弹性自动扩容来提高系统的承载能力。 IT 人员亦是如此,甚至开发与运维间相互看不懂数据;
  • 使用公有云上 Kubernetes 集群,期望通过容器服务的自动弹性扩容功能,让业务相关服务能达到瞬时 5W RPS 的承载能力。通过压力测试,发现 6 个 Pod 的情况下,RPS 的承载峰值为 2W 左右。增加到 12 个 Pod(相同资源配置),RPS 的承载峰值为 2.4W 左右,继续扩展性能几乎不再提高。

解决方案

  • 在容器服务环境中部署 DataKit,接入链路和日志数据;
  • 在压测的过程中通过观测云应用性能监测的服务概览页面,可以快速定位疑似性能瓶颈的服务和相关资源。结合云上 Redis 的分析,对 Redis 的使用请求基本达到了配置规格能支持量的峰值;
  • 在观测云中开启 Profile 的采集功能,结合应用链路进行性能分析,主要关注在“Lock Wait Time” 和 “Socket I/O Read Time” 的指标上,从而定位到代码中通过不同的实现方法频繁调用Redis来完成相关的操作。将其反馈给研发人员,进行代码的调优。

客户价值

  • 代码迭代上线新版本后,在新一轮的压测中,不改变原有资源配置的情况下,RPS 峰值达到 8W 左右,超出客户原来的预期。