logo
logo
腾讯游戏基于 DeepFlow 的零侵扰可观测性进阶实战
腾讯不仅致力于开发广受欢迎的自研游戏,还与世界各地的知名游戏开发商合作,负责将这些游戏推向市场,让更多玩家享受游戏的乐趣。这些合作伙伴来自全球各地,使用多种多样的技术栈,这为游戏的稳定性维护提出了复杂的挑战。本文旨在探讨腾讯互娱如何利用 DeepFlow 的 eBPF 技术实现无侵入式的可观测性,这一策略不仅确保了游戏渐进式发布过程中的流畅用户体验,还加快了问题的诊断与解决,有效预防了潜在的性能问题。
Unlock All-in-One Observability for APISIX with DeepFlow
This article aims to elucidate how to leverage DeepFlow's zero-code feature based on eBPF to construct an observability solution for APISIX. On this basis, it integrates the rich data sources of existing APISIX plugins to eliminate data silos and build an all-in-one platform for comprehensive observability of the APISIX gateway. Through DeepFlow, APISIX can achieve comprehensive observability from traffic monitoring and tracing analysis to performance optimization, eliminating data dispersion and providing a centralized view. This accelerates fault diagnosis and performance tuning, making the work of DevOps and SRE teams more efficient. This article will focus on how APISIX's tracing data, metric data, access logs, and performance profiling data can be integrated with DeepFlow.
民生银行云原生业务的 eBPF 可观测性建设实践
民生银行通过 DeepFlow 构建了容器/云全路径网络观测能力、eBPF 零侵扰应用观测能力、应用函数监控能力、容器系统指标观测能力,并借助 WebAssembly 技术探索业务观测能力的建设。通过应用、系统、网络的全栈统一观测,民生银行的网络运维团队从网络监控时代迈向全栈主动观测时代,有效提升运维监控能力,提供更加全面、精准、有效、安全的监控服务能力,整体提升了故障定位和根因分析水平。本文讲述了**民生银行的网络运维团队的工程师们在企业全面拥抱云原生的过程中,如何与云杉 DeepFlow 团队携手以 vTap 流量分发为起点**,逐步改变传统网络运维思路,**拥抱分布式流量采集方案,引入 eBPF 零侵扰应用追踪技术**,并积极探索更多观测能力的发展历程。
基于 DeepFlow 构建 APISIX 的统一可观测性能力
本文旨在阐述如何利用 DeepFlow 基于 eBPF 的零侵扰特性构建 APISIX 可观测性解决方案,在此基础上统一集成 APISIX 插件已有的丰富数据源,消除孤岛、构建统一的可观测性平台,以全面监控和分析 APISIX 网关。通过 DeepFlow,APISIX 可以实现从流量监控、追踪分析、到性能优化的全面可观测性,消除数据分散并提供中心化的监控视图,加速故障排查和性能调优,让 DevOps 和 SRE 团队的工作更加高效。本文将重点梳理 APISIX 的追踪数据、指标数据、访日日志及性能剖析数据如何对接 DeepFlow。
DeepFlow 零侵扰实现分布式数据库 TDSQL 的全链路可观测性
分布式数据库市场发展迅速,TDSQL、GuassDB、OceanBase、GoldenDB、TiDB 等各类分布式数据库产品纷纷涌现,尤其在金融行业的落地越来越多。提高分布式数据库的可观测性,提升用户对产品稳定性、可靠性的信心,是金融核心业务云原生化的重要保障。DeepFlow 通过 eBPF 技术零侵扰实现的全景图、分布式追踪和持续剖析等能力为分布式数据库的可观测性建设提供了开创性的新思路。本篇文章以某国有银行分布式核心交易系统为例,介绍 DeepFlow 如何实现 TDSQL 的全链路可观测性,分享如何在客户实践中通过应用、网络、数据库的全栈、全链路统一观测,真实做到 2 至 3 步操作、5 分钟以内的业务异常定界定位。
DeepFlow 扩展协议解析实践
DeepFlow 对于云原生应用来说,完全具备零侵扰的形式提供应用可观测能力,这个能力得益于其基于 eBPF 以零侵扰的方式采集应用数据,并通过解析多种应用及业务协议来实现应用可观测能力,本文通过深入剖析代码流程,用实战的方法介绍 DeepFlow 中两种常见的协议扩展方法:如何从零开始增加支持一种全新的协议(MongoDB),以及如何利用 DeepFlow 的 Wasm Plugin 机制对已有协议(Kafka)的解析能力进行增强,此次分享的 MongoDB 协议及 Kafka 增加的字段都已经合 DeepFlow 6.4 版本,欢迎大家试用。
微拍堂基于 DeepFlow 建设零侵扰的可观测平台
微拍堂电商平台面临成本与性能优化瓶颈、问题定位困难以及业务流梳理困难等挑战,公司运维团队决定构建对业务零侵扰的可观测性平台。评估众多开源解决方案后,选择了基于 eBPF 的 DeepFlow 开源项目作为数据底座,在此基础上针对公司业务需求进行二次开发,实现了完整的用户界面。可观测性平台在试运行过程中得到了研发团队及 SRE 团队的充分认可,开始推进全面上线基于 DeepFlow 二开的零侵扰可观测性平台。
中国移动磐基PaaS平台基于eBPF的应用可观测性建设实践
作为中国移动智慧中台的统一技术底座,磐基 PaaS 平台提供了高效的集群管理和调度功能,满足多元化的业务场景需求。该平台携手 DeepFlow 借助 eBPF 技术,解决了 APM 落地困难和组件追踪断路中的挑战,实现了全栈且无侵扰的应用可观测性。磐基 PaaS 平台将 eBPF 数据与现有的可观测数据整合,提供了**开箱即用的应用可观测性,全栈无盲点的调用链追踪等能力**,大大提升了各业务系统云化的底气,并促进了平台本身的快速推广。未来,平台还针对运营商等特定行业场景,进一步深化可观测性数据的融合,并将创新性地拓展其 AI 能力,以增强市场竞争力。
eBPF: The Key Technology to Observability
Due to its intrusive nature, APM Agent is difficult to deploy in core business systems in finance, telecommunications, and power industries. It is also challenging to instrument into cloud-native infrastructures. The Zero Code advantage of eBPF effectively addresses these pain points, making it a key technology for achieving observability in the cloud-native era. DeepFlow, based on eBPF, has provided universal views, distributed tracing, and continuous performance profiling capabilities to various industries. It has helped achieve Zero Code observability in distributed core transaction systems in the financial industry, 5G core networks in the telecommunications industry, distributed power trading systems in the energy industry, intelligent connected cars, and cloud-native game services, ensuring continuous innovation for the new generation of businesses and infrastructure.
可观测性实战:快速定位 Redis 应用高时延问题
应用连接 Redis 的最佳实践是使用连接池,然而连接池通常会引入很多繁杂的配置。不合理的配置往往会造成性能隐患,并进而导致生产故障。当应用缺乏可观测性时,无法在故障发生前发现隐患,也难以在故障发生时快速定位。本文从一个普通的应用高时延入手,讲述如何使用 DeepFlow 快速定位问题根因。