logo
logo
故障诊断 3 分钟锁定分布式核心数据库,加速金融科技信创开发、测试、迁移
金融行业信创迁移过程中,故障定界困难、定位周期长、开发测试速度缓慢、生产运行风险高等因素正在不断地拖慢相关工作的效率和速度。如何让金融科技部门的业务信创迁移更快、更高效、更平滑?DeepFlow 通过 eBPF 带来的零侵扰、全栈、全链路可观测性技术,可以大幅度提升信创全系统的可观测性,从根本上扫除信创道路的技术阻碍。通过本篇案例您将了解到,某股份制银行在分布式核心交易业务向信创平台迁移的开发测试过程中,如何通过 DeepFlow 平台仅用 3 分钟时间将问题根因锁定到分布式核心数据库,快速消除不同运维技术栈之间的定位分歧,快速解决故障,加速开发测试速度。
eBPF 零侵扰分布式追踪 3 分钟锁定 Java 程序 I/O 线程阻塞
I/O 线程阻塞是Java 程序经常出现的问题之一,此类故障发生时 Java 程序的请求、响应在 I/O 线程向操作系统 Socket Buffer 读/写过程中发生阻塞,由于在业务代码插桩无法观测到 I/O 线程的工作情况和性能表现,因而导致故障非常隐蔽和难以诊断定位。通过本篇案例您将了解到,某银行的开发工程师如何使用 eBPF 技术带来的零侵扰追踪能力,在某次分布式核心交易系统上线信创平台的非功能测试(性能压测)故障诊断中,用 3 分钟时间锁定 Java 程序 I/O 线程阻塞。
使用 DeepFlow 消除 APISIX 故障诊断中的“南辕北辙”
APISIX 被越来越多的用户选择作为 IT 应用系统的入口,由于故障定界能力的缺失,在 IT 业务故障诊断过程中,APISIX 经常成为重点“怀疑对象”,一方面“劳师动众”投入大量运维人力定位,另一方面诊断方向“南辕北辙”,因而业务故障“久拖不决”。通过本篇文章复盘重现某全球领先的智能终端提供商近期对核心业务响应时延劣化故障的处理过程,您将直观了解到“南辕北辙”现象对诊断效率的决定性影响,以及 DeepFlow 可观测性平台如何用数分钟时间、几步简单操作,消除 APISIX 故障诊断中的“南辕北辙”,解决长达两个月悬而未决的问题,为故障处置效率带来飞跃提升。
基于 DeepFlow 构建 Kong 的统一可观测性能力
本文将介绍如何使用 DeepFlow 基于 eBPF 的零侵扰特性构建 Kong 网关的可观测性解决方案,在此基础上统一集成 Kong 插件已有的丰富数据源,消除孤岛、构建统一的可观测性平台,以全面监控和分析 Kong 网关。通过 DeepFlow,Kong 网关可以实现从流量监控、追踪分析、到性能优化的全面可观测性,消除数据分散并提供中心化的监控视图,加速故障排查和性能调优,让 DevOps 和 SRE 团队的工作更加高效。
基于 DeepFlow 的 TiDB 全栈全链路可观测性最佳实践
作为一款优秀的开源分布式数据库软件,TiDB 得到越来越多的用户关注和应用,但在运维保障过程中同样面临着运维孤岛、定界定位难、获取可观测性数据开销大等挑战,本文总结了 TiDB 用户如何基于 DeepFlow 构建全栈可观测性的最佳实践,包括如何用 DeepFlow 高性能、零侵扰的可观测技术消除全链路追踪在 TiDB 侧的盲区,如何在 DeepFlow 中统一观测业务全景、SQL 事务全过程、网络性能、系统资源性能、文件读写性能、应用函数性能,从而为 TiDB 及其上应用构建出统一、立体、全方位的可观测性能力。
eBPF 零侵扰分布式追踪的进展和探索
本文为 DeepFlow 在第 23 期得物技术沙龙上的演讲实录。
全栈!使用 eBPF 轻松解锁 HTTPS 分布式追踪能力
DeepFlow 支持 TLS 握手消息解析以后,HTTPS 的全栈分布式追踪链路更精细了!
基于 DeepFlow 构建 APISIX 的统一可观测性能力
本文旨在阐述如何利用 DeepFlow 基于 eBPF 的零侵扰特性构建 APISIX 可观测性解决方案,在此基础上统一集成 APISIX 插件已有的丰富数据源,消除孤岛、构建统一的可观测性平台,以全面监控和分析 APISIX 网关。通过 DeepFlow,APISIX 可以实现从流量监控、追踪分析、到性能优化的全面可观测性,消除数据分散并提供中心化的监控视图,加速故障排查和性能调优,让 DevOps 和 SRE 团队的工作更加高效。本文将重点梳理 APISIX 的追踪数据、指标数据、访日日志及性能剖析数据如何对接 DeepFlow。
可观测性实战:快速定位 Redis 应用高时延问题
应用连接 Redis 的最佳实践是使用连接池,然而连接池通常会引入很多繁杂的配置。不合理的配置往往会造成性能隐患,并进而导致生产故障。当应用缺乏可观测性时,无法在故障发生前发现隐患,也难以在故障发生时快速定位。本文从一个普通的应用高时延入手,讲述如何使用 DeepFlow 快速定位问题根因。
eBPF 是实现可观测性的关键技术
APM Agent 由于其侵扰性,难以在金融、电信、电力等行业的核心业务系统中落地,难以在云原生基础设施中插桩。eBPF 的零侵扰优势很好的解决了这些痛点,是云原生时代实现可观测性的关键技术。DeepFlow 基于 eBPF 的全景图、分布式追踪、持续性能剖析能力已服务于各行各业,帮助金融行业的分布式核心交易系统、电信行业的 5G 核心网、能源行业的分布式电力交易系统、智能网联汽车、云原生游戏服务等快速实现了零侵扰的可观测性,保障了新一代业务和基础设施的持续创新。
基于 eBPF 的云原生可观测性深度实践
本文由 InfoQ 整理自云杉网络 DeepFlow 产品负责人向阳在 QCon 全球软件开发大会(北京站)2022 上的演讲分享,主题为“基于 eBPF 的云原生可观测性深度实践”。
利用 DeepFlow 为传统 APM 开启全栈追踪能力
传统 APM 聚焦在代码层面,不具备全栈多维度无盲点看问题的能力,同时由于插码的阻碍往往难以覆盖所有微服务,DeepFlow 依靠 eBPF 零代码修改采集全栈追踪数据并聚合生成了调用关系,可以增强传统 APM 的数据,大大缩短问题定界时间。对于已经使用传统 APM 工具的用户,可以考虑使用 DeepFlow 提供的 API 来增强应用依赖拓扑及调用追踪,以获得全栈数据追踪能力。
使用 DeepFlow 开启 Redis 可观测性
基于 DeepFlow 构建 Redis 的可观测 Dashboard,实时监控 Redis 服务的网络状态、吞吐量、异常和错误,实现应用无盲点可观测,快速定位异常原因和排障。
DeepFlow 基于 eBPF 的高度自动化可观测性实践
本文为 DeepFlow 在首届中国 eBPF 大会上的在线演讲实录。
使用 DeepFlow 开启 MySQL 可观测性
我们基于 DeepFlow 构建了一个高效的、无侵入的 MySQL 可观测 Dashboard,可实时监控网络时延、吞吐、异常状况,并快速定位有性能问题的 SQL,快速定位性能瓶颈和排查故障原因。
使用 DeepFlow 开启 Ingress 可观测性
意识到已有 K8s Ingress 监控数据的缺陷以后,我们动手基于 DeepFlow 生成了一个高效的 K8s Ingress 可观测性 Dashboard,粒度精细到域名、API Endpoint、后端服务,指标量覆盖请求、时延、异常、吞吐,以便快速找到性能瓶颈和故障原因。**得益于 DeepFlow 的 AutoTracing、AutoMetrics、AutoTagging、SmartEncoding 核心机制,我们可以从应用角度分析 K8s Ingress 的调用拓扑、性能指标、访问日志、调用链追踪,无需任何插码、配置修改、进程重启。**
使用 DeepFlow 作为 SkyWalking 的后端,消除观测盲点
DeepFlow 作为一个可观测性协作平台,可作为 SkyWalking 的后端快速接入 SkyWalking Agent 及 Instrument SDK 的数据,并利用基于 eBPF 的 AutoTracing 能力补齐网络和系统 Span 来消除分布式链路追踪中的盲点,真正让业务开发团队、框架开发团队、服务网格运维团队、容器运维团队、DBA 团队、云运维团队多部门在一个平台协作起来。同时,结合 DeepFlow 自动生成的应用黄金指标数据(AutoMetrics)、调用日志和流日志(AutoLogging),以及集成并标准化的 Prometheus/Telegraf 指标数据(AutoTagging),可快速构建一个统一的可观测性平台。
基于开源的全栈全链路可观测性建设实践
基于 DeepFlow 的高度自动化特性,结合丰富的开源生态,本文从 Metrics 和 Tracing 两个方面介绍怎样从自动化走向精细化,一步步构建全栈、全链路的可观测性协作平台。
开启高度自动化的可观测性新时代
现有的可观测性解决方案在消耗着开发人员大量的时间和精力,并且不利于团队协同,DeepFlow 希望开启一个高度自动化的可观测性新时代。