logo
logo
eBPF 是实现可观测性的关键技术

eBPF 是实现可观测性的关键技术

APM Agent 由于其侵扰性,难以在金融、电信、电力等行业的核心业务系统中落地,难以在云原生基础设施中插桩。eBPF 的零侵扰优势很好的解决了这些痛点,是云原生时代实现可观测性的关键技术。DeepFlow 基于 eBPF 的全景图、分布式追踪、持续性能剖析能力已服务于各行各业,帮助金融行业的分布式核心交易系统、电信行业的 5G 核心网、能源行业的分布式电力交易系统、智能网联汽车、云原生游戏服务等快速实现了零侵扰的可观测性,保障了新一代业务和基础设施的持续创新。
Posted on 
eBPF: The Key Technology to Observability

eBPF: The Key Technology to Observability

Due to its intrusive nature, APM Agent is difficult to deploy in core business systems in finance, telecommunications, and power industries. It is also challenging to instrument into cloud-native infrastructures. The Zero Code advantage of eBPF effectively addresses these pain points, making it a key technology for achieving observability in the cloud-native era. DeepFlow, based on eBPF, has provided universal views, distributed tracing, and continuous performance profiling capabilities to various industries. It has helped achieve Zero Code observability in distributed core transaction systems in the financial industry, 5G core networks in the telecommunications industry, distributed power trading systems in the energy industry, intelligent connected cars, and cloud-native game services, ensuring continuous innovation for the new generation of businesses and infrastructure.
Posted on 
使用 DeepFlow Wasm 插件实现业务可观测性

使用 DeepFlow Wasm 插件实现业务可观测性

DeepFlow 利用 eBPF 采集并解析应用协议,实现了零侵扰的分布式追踪和指标数据的采集。DeepFlow 已经内置支持了十多种应用协议的解析,并且还在持续增加中。但我们发现实际业务环境中情况会更加复杂,针对这些复杂场景,DeepFlow 实现了一套零侵扰的 WebAssembly 插件机制,使得开发人员可针对自己的业务环境定制化 DeepFlow 的协议解析能力。
Posted on 
可观测性实战:快速定位 K8s CNI 端口冲突问题

可观测性实战:快速定位 K8s CNI 端口冲突问题

某车企的车控业务访问账户系统时无规律偶发连接超时(connection timeout),本案例分享利用 DeepFlow 深度剖析如何分钟级定位 K8s CNI 的 SNAT (Source Network Address Translation) 触发 Node 节点源端口冲突,导致连接服务端异常。
Posted on 
可观测性实战:快速定位云服务时延瓶颈

可观测性实战:快速定位云服务时延瓶颈

本次案例为某智能汽车公司,业务监控告警发现某充电核心服务 SQL 查询时间偶现超过 200ms,对前方用户影响明显。此问题涉及多团队,仅问题定位就持续了将近 1 个星期未有结论,通过 DeepFlow 的调用日志及分布式调用链追踪的能力,快速定位瓶颈点为云网络抖动导致的,进而直接向云厂商提交工单并附带令人信服的证据。
Posted on 
可观测性实战:快速定位 K8s 应用的时延瓶颈

可观测性实战:快速定位 K8s 应用的时延瓶颈

本次案例为某物流公司在今年 4 月份左右,SRE 通过监控 Nginx 日志,发现一个域名在每天晚上 12 点后存在大量持续 1s 的超时情况,这个问题困扰了用户近一个月。通过查看 DeepFlow 的调用日志,立即排除了业务响应慢的可能性,最终发现问题是 Nginx 自身配置问题导致的。这个案例展示了如何快速的定位 7 层网关时延瓶颈点。
Posted on 
Prometheus x DeepFlow:打造零插桩的指标体系

Prometheus x DeepFlow:打造零插桩的指标体系

DeepFlow 增加了 PromQL 支持,可无缝体验 Prometheus 提供的可观测能力,同时,通过 PromQL 结合 DeepFlow 提供的可观测性数据,我们可以打造更有想象力的 Dashboard。
Posted on 
落地 eBPF 可观测性之 DeepFlow Agent 性能揭秘

落地 eBPF 可观测性之 DeepFlow Agent 性能揭秘

DeepFlow 基于 eBPF 实现了零插桩(Zero Code)的云原生应用可观测性,这是一种全新的技术手段,因此不少用户在选型和落地 DeepFlow 的过程中会对它的性能开销存在疑问。到底 Agent 的运行会对业务造成什么样的影响?而 Agent 自身的资源开销又如何?最近我们将 DeepFlow Agent 的自动化测试结果放到了线上 Demo 页面中,本篇文章将结合 Daily Build 的测试数据,系统性的阐述我们的测试方法和测试结果,揭示 Agent 的业务影响和资源开销,帮助大家扫清落地 eBPF 可观测性的最后障碍。
Posted on 
使用 eBPF 零代码修改绘制全景应用拓扑

使用 eBPF 零代码修改绘制全景应用拓扑

本文为 DeepFlow 在首届云原生社区可观测性峰会上的演讲实录。
Posted on 
使用全景拓扑持续跟踪云原生应用的压测性能瓶颈

使用全景拓扑持续跟踪云原生应用的压测性能瓶颈

测试小姐姐正在对云原生的电商应用进行压测,但是如何对压测结果进行持续的观测呢?这一直是比较头痛的事情,本文将介绍如何利用 DeepFlow 的全景拓扑帮助小姐姐快速找到瓶颈点。DeepFlow 全景拓扑无需业务修改代码、配置或者重启服务,利用 BPF/eBPF 技术通过对业务零侵扰的方式构建而来,这是一种很便捷且低成本的方式来观测全链路压测的结果。
Posted on 
14