网络性能指标

创建时间:2024-06-01 最近修改时间:2024-06-24

#1. 服务列表

无需向应用中插入任何代码,DeepFlow 自动生成所有服务的网络性能指标。 数据库表名:flow_metrics.network

#1.1 标签

自动注入的 Tag 列表:IP、协议、端口、采集位置、云资源、K8s 资源、K8s 自定义 Label,详细字段描述如下。

Name DisplayName Description
time 时间
region 区域
az 可用区
host 宿主机 承载虚拟机的宿主机。
chost 云服务器 包括虚拟机、裸金属服务器。
vpc VPC
subnet 子网
router 路由器
dhcpgw DHCP 网关
lb 负载均衡器
lb_listener 负载均衡监听器
natgw NAT 网关
redis Redis
rds RDS
pod_cluster K8s 容器集群
pod_ns K8s 命名空间
pod_node K8s 容器节点
pod_ingress K8s Ingress
pod_service K8s 容器服务
pod_group_type K8s 工作负载类型
pod_group K8s 工作负载 例如 Deployment、StatefulSet、Daemonset 等。
pod K8s 容器 POD
service 服务
resource_gl0_type 自动实例类型 已废弃,请使用 auto_instance_type。
resource_gl0 自动实例标签 已废弃,请使用 auto_instance。
resource_gl1_type 类型-工作负载优先 已废弃,请使用 auto_service_type。
resource_gl1 资源-工作负载优先 已废弃,请使用 auto_service。
resource_gl2_type 自动资源类型 已废弃,请使用 auto_service_type。
resource_gl2 自动资源标签 已废弃,请使用 auto_service。
auto_instance_type 自动实例类型 auto_instance实例对应的类型。
auto_instance 自动实例标签 IP 对应的实例,实例为IP时,auto_instance_id显示为子网ID。
auto_service_type 自动资源类型 auto_service实例对应的类型。
auto_service 自动资源标签 auto_instance基础上,将容器服务的 ClusterIP 与工作负载聚合为服务,实例为IP时,auto_service_id显示为子网ID。
gprocess 进程
host_ip 宿主机 宿主机的管理 IP。
host_hostname 宿主机 宿主机的 Hostname。
chost_ip 云服务器 云服务器的主 IP。
chost_hostname 云服务器 云服务器的 Hostname。
pod_node_ip K8s 容器节点 容器节点的主 IP。
pod_node_hostname K8s 容器节点 容器节点的 Hostname。
k8s.label K8s Label
k8s.annotation K8s Annotation
k8s.env K8s Env
cloud.tag Cloud Tag
os.app OS APP
ip IP 地址
is_ipv4 IPv4 标志
protocol 网络协议
server_port 服务端口
tap 采集点 已废弃,请使用 capture_network_type。
capture_network_type 网络位置 采集流量的网络位置,使用固定值(云网络)表示云内流量,其他值表示传统 IDC 流量(支持最多 254 个自定义值表示镜像分光的位置)。
vtap 采集器 已废弃,请使用 agent。
agent 采集器
signal_source 信号源
role 角色

generate from csv file: network.ch

#1.2 指标

Metrics 列表:吞吐、负载、时延、TCP 异常、重传、零窗,详细字段描述如下。

Field DisplayName Unit Description
byte 字节 字节 发送字节 + 接收字节
byte_tx 发送字节 字节 资源发送的字节数总和(含 Ethernet 头)
byte_rx 接收字节 字节 资源接收的字节数总和(含 Ethernet 头)
packet 包数 发送包数 + 接收包数
packet_tx 发送包数 资源发送的包数总和
packet_rx 接收包数 资源接收的包数总和
l3_byte 网络层载荷 字节 发送网络层载荷 + 接收网络层载荷
l3_byte_tx 发送网络层载荷 字节 资源发送的网络层载荷字节数总和(不含 IP 头)
l3_byte_rx 接收网络层载荷 字节 资源接收的网络层载荷字节数总和(不含 IP 头)
bpp 平均包长 字节 字节 / 包数
bpp_tx 平均发送包长 字节 发送字节 / 发送包数
bpp_rx 平均接收包长 字节 接收字节 / 接收包数
new_flow 新建连接 连接 采集周期内新建的 TCP 连接数,连接的定义详见文档
closed_flow 关闭连接 连接 采集周期内关闭的 TCP 连接数,连接的定义详见文档
flow_load 活跃连接 连接 采集周期内活跃的连接数,包括有数据交互的长连接、无数据交互的长连接、周期内关闭的短连接,连接的定义详见文档
syn_count SYN 包数 SYN 包的总数
synack_count SYN-ACK 包数 SYN-ACK 包的总数
l4_byte 传输层载荷 字节 发送传输层载荷 + 接收传输层载荷
l4_byte_tx 发送传输层载荷 字节 资源发送的包传输层载荷字节数总和(不含 TCP/UDP 头)
l4_byte_rx 接收传输层载荷 字节 资源接收的包传输层载荷字节数总和(不含 TCP/UDP 头)
retrans_syn SYN 重传 SYN 包的重传次数
retrans_synack SYN-ACK 重传 SYN-ACK 包的重传次数
retrans TCP 重传 TCP 客户端重传 + TCP 服务端重传
retrans_tx TCP 客户端重传 资源发送的 TCP 重传包次数
retrans_rx TCP 服务端重传 资源接收的 TCP 重传包次数
zero_win TCP 零窗 TCP 客户端零窗 + TCP 服务端零窗
zero_win_tx TCP 客户端零窗 资源发送的 TCP 零窗包次数
zero_win_rx TCP 服务端零窗 资源接收的 TCP 零窗包次数
retrans_syn_ratio SYN 重传比例 % TCP SYN 重传 / TCP SYN 包数
retrans_synack_ratio SYN-ACK 重传比例 % TCP SYN-ACK 重传 / TCP SYN-ACK 包数
retrans_ratio TCP 重传比例 % TCP 重传 / 包数
retrans_tx_ratio TCP 客户端重传比例 % TCP 客户端重传 / 发送包数
retrans_rx_ratio TCP 服务端重传比例 % TCP 服务端重传 / 接收包数
zero_win_ratio TCP 零窗比例 % TCP 零窗 / 包数
zero_win_tx_ratio TCP 客户端零窗比例 % TCP 客户端零窗 / 发送包数
zero_win_rx_ratio TCP 服务端零窗比例 % TCP 服务端零窗 / 接收包数
tcp_establish_fail 建连-失败次数 建连-客户端失败次数 + 建连-服务端失败次数
client_establish_fail 建连-客户端失败次数 建连-客户端端口复用 + 建连-客户端其他重置 + 建连-客户端 ACK 缺失
server_establish_fail 建连-服务端失败次数 建连-服务端 SYN 缺失 + 建连-服务端直接重置 + 建连-服务端其他重置
tcp_establish_fail_ratio 建连-失败比例 % 建连-失败次数 / 关闭连接
client_establish_fail_ratio 建连-客户端失败比例 % 建连-客户端失败次数 / 关闭连接
server_establish_fail_ratio 建连-服务端失败比例 % 建连-服务端失败次数 / 关闭连接
tcp_transfer_fail 传输-失败次数 传输-客户端重置 + 传输-服务端重置 + 传输-服务端队列溢出 + 传输-TCP 连接超时
tcp_transfer_fail_ratio 传输-失败比例 % 传输-失败次数 / 关闭连接
tcp_rst_fail 重置次数 连接 建连-客户端其他重置 + 建连-服务端直接重置 + 建连-服务端其他重置 + 传输-客户端重置 + 传输-服务端重置
tcp_rst_fail_ratio 重置比例 % 重置次数 / 关闭连接
client_source_port_reuse 建连-客户端端口复用 连接 TCP 建连失败的场景之一,见文档描述
server_syn_miss 建连-服务端 SYN 缺失 连接 TCP 建连失败的场景之一,见文档描述
client_establish_other_rst 建连-客户端其他重置 连接 TCP 建连失败的场景之一,见文档描述
client_ack_miss 建连-客户端 ACK 缺失 连接 TCP 建连失败的场景之一,见文档描述
server_reset 建连-服务端直接重置 连接 TCP 建连失败的场景之一,见文档描述
server_establish_other_rst 建连-服务端其他重置 连接 TCP 建连失败的场景之一,见文档描述
client_rst_flow 传输-客户端重置 连接 TCP 传输失败的场景之一,见文档描述
server_rst_flow 传输-服务端重置 连接 TCP 传输失败的场景之一,见文档描述
server_queue_lack 传输-服务端队列溢出 连接 TCP 传输失败的场景之一,见文档描述
tcp_timeout 传输-TCP 连接超时 连接 TCP 传输失败的场景之一,见文档描述
client_half_close_flow 断连-客户端半关 连接 TCP 断连异常的场景之一,见文档描述
server_half_close_flow 断连-服务端半关 连接 TCP 断连异常的场景之一,见文档描述
rtt 平均 TCP 建连时延 微秒 采集周期内,所有 TCP 建连时延的平均值,单次时延的计算见文档描述
rtt_client 平均 TCP 建连客户端时延 微秒 采集周期内,所有 TCP 建连客户端时延的平均值,单次时延的计算见文档描述
rtt_server 平均 TCP 建连服务端时延 微秒 采集周期内,所有 TCP 建连服务端时延的平均值,单次时延的计算见文档描述
srt 平均 TCP/ICMP 系统时延 微秒 采集周期内,所有 TCP/ICMP 系统时延的平均值,单次时延的计算见文档描述
art 平均数据时延 微秒 采集周期内,所有数据时延的平均值,数据时延包含 TCP/UDP,单次时延的计算见文档描述
cit 平均客户端等待时延 微秒 采集周期内,所有客户端等待时延的平均值,数据时延仅包含 TCP,单次时延的计算见文档描述
rtt_max 最大 TCP 建连时延 微秒 采集周期内,所有 TCP 建连时延的最大值,单次时延的计算见文档描述
rtt_client_max 最大 TCP 建连客户端时延 微秒 采集周期内,所有 TCP 建连客户端时延的最大值,单次时延的计算见文档描述
rtt_server_max 最大 TCP 建连服务端时延 微秒 采集周期内,所有 TCP 建连服务端时延的最大值,单次时延的计算见文档描述
srt_max 最大 TCP/ICMP 系统时延 微秒 采集周期内,所有 TCP/ICMP 系统时延的最大值,单次时延的计算见文档描述
art_max 最大数据时延 微秒 采集周期内,所有数据时延的最大值,数据时延包含 TCP/UDP,单次时延的计算见文档描述
cit_max 最大客户端等待时延 微秒 采集周期内,所有客户端等待时延的最大值,数据时延仅包含 TCP,单次时延的计算见文档描述
l7_request 应用请求 应用层协议请求次数
l7_response 应用响应 应用层协议响应次数
rrt 平均应用时延 微秒 采集周期内,所有应用时延的平均值,单次应用时延等于响应与请求的时间差
rrt_max 最大应用时延 微秒 采集周期内,所有应用时延的最大值,单次应用时延等于响应与请求的时间差
l7_error 应用异常 应用客户端异常 + 应用服务端异常
l7_client_error 应用客户端异常 根据具体应用协议的响应码判断异常,不同协议的定义见 l7_flow_log 中 response_status 字段的说明
l7_server_error 应用服务端异常 根据具体应用协议的响应码判断异常,不同协议的定义见 l7_flow_log 中 response_status 字段的说明
l7_timeout 应用超时 应用超时的统计次数(默认配置下:TCP 类应用在 1800s 内未采集到响应,UDP 类应用在 150s 内未采集到响应)
l7_error_ratio 应用异常比例 % 应用异常 / 应用响应
l7_client_error_ratio 应用客户端异常比例 % 应用客户端异常 / 应用响应
l7_server_error_ratio 应用服务端异常比例 % 应用服务端异常 / 应用响应
row 行数

generate from csv file: network.ch

#1.3 Grafana Dashboard

基于上述数据可通过 Grafana 构建丰富的 Dashboard。我们在 Grafana 中预置了一个 Network - K8s Pod Dashboard,效果图如下:

Network K8s Pod

Network K8s Pod

你也可以访问 DeepFlow Online Demo (opens new window) 查看效果。

#2. 服务全景图

无需向应用中插入任何代码,DeepFlow 自动生成所有服务的全栈访问路径和网络性能指标。 数据库表名:flow_metrics.network_map

#2.1 标签

自动注入的 Tag 列表:IP、协议、端口、采集位置、云资源、K8s 资源、K8s 自定义 Label,详细字段描述如下。

Name DisplayName Description
time 时间
region 区域
az 可用区
host 宿主机 承载虚拟机的宿主机。
chost 云服务器 包括虚拟机、裸金属服务器。
vpc VPC
subnet 子网
router 路由器
dhcpgw DHCP 网关
lb 负载均衡器
lb_listener 负载均衡监听器
natgw NAT 网关
redis Redis
rds RDS
pod_cluster K8s 容器集群
pod_ns K8s 命名空间
pod_node K8s 容器节点
pod_ingress K8s Ingress
pod_service K8s 容器服务
pod_group_type K8s 工作负载类型
pod_group K8s 工作负载 例如 Deployment、StatefulSet、Daemonset 等。
pod K8s 容器 POD
service 服务
resource_gl0_type 自动实例类型 已废弃,请使用 auto_instance_type。
resource_gl0 自动实例标签 已废弃,请使用 auto_instance。
resource_gl1_type 类型-工作负载优先 已废弃,请使用 auto_service_type。
resource_gl1 资源-工作负载优先 已废弃,请使用 auto_service。
resource_gl2_type 自动资源类型 已废弃,请使用 auto_service_type。
resource_gl2 自动资源标签 已废弃,请使用 auto_service。
auto_instance_type 自动实例类型 auto_instance实例对应的类型。
auto_instance 自动实例标签 IP 对应的实例,实例为IP时,auto_instance_id显示为子网ID。
auto_service_type 自动资源类型 auto_service实例对应的类型。
auto_service 自动资源标签 auto_instance基础上,将容器服务的 ClusterIP 与工作负载聚合为服务,实例为IP时,auto_service_id显示为子网ID。
gprocess 进程
tap_port_host 采集网卡所属宿主机 已废弃,请使用 capture_nic_host。
tap_port_chost 采集网卡所属云服务器 已废弃,请使用 capture_nic_chost。
tap_port_pod_node 采集网卡所属容器节点 已废弃,请使用 capture_nic_pod_node。
capture_nic_host 采集网卡所属宿主机
capture_nic_chost 采集网卡所属云服务器
capture_nic_pod_node 采集网卡所属容器节点
host_ip 宿主机 宿主机的管理 IP。
host_hostname 宿主机 宿主机的 Hostname。
chost_ip 云服务器 云服务器的主 IP。
chost_hostname 云服务器 云服务器的 Hostname。
pod_node_ip K8s 容器节点 容器节点的主 IP。
pod_node_hostname K8s 容器节点 容器节点的 Hostname。
k8s.label K8s Label
k8s.annotation K8s Annotation
k8s.env K8s Env
cloud.tag Cloud Tag
os.app OS APP
ip IP 地址
is_ipv4 IPv4 标志
is_internet Internet IP 标志 IP 地址是否为外部 Internet 地址。
protocol 网络协议
tunnel_type 隧道类型
server_port 服务端口
tap 采集点 已废弃,请使用 capture_network_type。
capture_network_type 网络位置 采集流量的网络位置,使用固定值(云网络)表示云内流量,其他值表示传统 IDC 流量(支持最多 254 个自定义值表示镜像分光的位置)。
vtap 采集器
agent 采集器
nat_source NAT 源
tap_port 采集位置标识 已废弃,请使用 capture_nic。
tap_port_name 采集位置名称 已废弃,请使用 capture_nic_name。
tap_port_type 采集位置类型 已废弃,请使用 capture_nic_type。
capture_nic 采集网卡标识 当采集位置类型为本地网卡时,此值表示采集网卡的 MAC 地址后缀(后四字节)。
capture_nic_name 采集网卡名称 当采集位置类型为本地网卡时,此值表示采集网卡的名称。
capture_nic_type 采集网卡类型 表示流量采集位置的类型,包括本地网卡(云内流量)、云网关网卡(云网关流量)、分光镜像(传统 IDC 流量)等。
tap_side 路径统计位置 采集位置在流量路径中所处的逻辑位置,例如客户端网卡、客户端容器节点、服务端容器节点、服务端网卡等。
observation_point 观测点 采集位置在流量路径中所处的逻辑位置,例如客户端网卡、客户端容器节点、服务端容器节点、服务端网卡等。
signal_source 信号源

generate from csv file: network_map.ch

#2.2 指标

Metrics 列表:吞吐、负载、时延、TCP 异常、重传、零窗,详细字段描述如下。

Field DisplayName Unit Description
byte 字节 字节 发送字节 + 接收字节
byte_tx 发送字节 字节 客户端发往服务端的字节数总和(含 Ethernet 头)
byte_rx 接收字节 字节 服务端发往客户端的字节数总和(含 Ethernet 头)
packet 包数 发送包数 + 接收包数
packet_tx 发送包数 客户端发往服务端的包数总和
packet_rx 接收包数 服务端发往客户端的包数总和
l3_byte 网络层载荷 字节 发送网络层载荷 + 接收网络层载荷
l3_byte_tx 发送网络层载荷 字节 客户端发往服务端的网络层载荷字节数总和(不含 IP 头)
l3_byte_rx 接收网络层载荷 字节 服务端发往客户端的网络层载荷字节数总和(不含 IP 头)
bpp 平均包长 字节 字节 / 包数
bpp_tx 平均发送包长 字节 发送字节 / 发送包数
bpp_rx 平均接收包长 字节 接收字节 / 接收包数
new_flow 新建连接 连接 采集周期内新建的 TCP 连接数,连接的定义详见文档
closed_flow 关闭连接 连接 采集周期内关闭的 TCP 连接数,连接的定义详见文档
flow_load 活跃连接 连接 采集周期内活跃的连接数,包括有数据交互的长连接、无数据交互的长连接、周期内关闭的短连接,连接的定义详见文档
syn_count SYN 包数 SYN 包的总数
synack_count SYN-ACK 包数 SYN-ACK 包的总数
l4_byte 传输层载荷 字节 发送传输层载荷 + 接收传输层载荷
l4_byte_tx 发送传输层载荷 字节 客户端发往服务端的包传输层载荷字节数总和(不含 TCP/UDP 头)
l4_byte_rx 接收传输层载荷 字节 服务端发往客户端的包传输层载荷字节数总和(不含 TCP/UDP 头)
direction_score 方向得分 算法推理传输层连接方向(客户端、服务端角色)的准确性得分值,得分越高连接方向的准确性越高,得分最高 255
retrans_syn SYN 重传 SYN 包的重传次数
retrans_synack SYN-ACK 重传 SYN-ACK 包的重传次数
retrans TCP 重传 TCP 客户端重传 + TCP 服务端重传
retrans_tx TCP 客户端重传 TCP 连接客户端发往服务端的重传包次数
retrans_rx TCP 服务端重传 TCP 连接服务端发往客户端的重传包次数
zero_win TCP 零窗 TCP 客户端零窗 + TCP 服务端零窗
zero_win_tx TCP 客户端零窗 TCP 连接客户端发往服务端的零窗包次数
zero_win_rx TCP 服务端零窗 TCP 连接服务端发往客户端的零窗包次数
retrans_syn_ratio SYN 重传比例 % TCP SYN 重传 / TCP SYN 包数
retrans_synack_ratio SYN-ACK 重传比例 % TCP SYN-ACK 重传 / TCP SYN-ACK 包数
retrans_ratio TCP 重传比例 % TCP 重传 / 包数
retrans_tx_ratio TCP 客户端重传比例 % TCP 客户端重传 / 发送包数
retrans_rx_ratio TCP 服务端重传比例 % TCP 服务端重传 / 接收包数
zero_win_ratio TCP 零窗比例 % TCP 零窗 / 包数
zero_win_tx_ratio TCP 客户端零窗比例 % TCP 客户端零窗 / 发送包数
zero_win_rx_ratio TCP 服务端零窗比例 % TCP 服务端零窗 / 接收包数
tcp_establish_fail 建连-失败次数 建连-客户端失败次数 + 建连-服务端失败次数
client_establish_fail 建连-客户端失败次数 建连-客户端端口复用 + 建连-客户端其他重置 + 建连-客户端 ACK 缺失
server_establish_fail 建连-服务端失败次数 建连-服务端 SYN 缺失 + 建连-服务端直接重置 + 建连-服务端其他重置
tcp_establish_fail_ratio 建连-失败比例 % 建连-失败次数 / 关闭连接
client_establish_fail_ratio 建连-客户端失败比例 % 建连-客户端失败次数 / 关闭连接
server_establish_fail_ratio 建连-服务端失败比例 % 建连-服务端失败次数 / 关闭连接
tcp_transfer_fail 传输-失败次数 传输-客户端重置 + 传输-服务端重置 + 传输-服务端队列溢出 + 传输-TCP 连接超时
tcp_transfer_fail_ratio 传输-失败比例 % 传输-失败次数 / 关闭连接
tcp_rst_fail 重置次数 连接 建连-客户端其他重置 + 建连-服务端直接重置 + 建连-服务端其他重置 + 传输-客户端重置 + 传输-服务端重置
tcp_rst_fail_ratio 重置比例 % 重置次数 / 关闭连接
client_source_port_reuse 建连-客户端端口复用 连接 TCP 建连失败的场景之一,见文档描述
server_syn_miss 建连-服务端 SYN 缺失 连接 TCP 建连失败的场景之一,见文档描述
client_establish_other_rst 建连-客户端其他重置 连接 TCP 建连失败的场景之一,见文档描述
client_ack_miss 建连-客户端 ACK 缺失 连接 TCP 建连失败的场景之一,见文档描述
server_reset 建连-服务端直接重置 连接 TCP 建连失败的场景之一,见文档描述
server_establish_other_rst 建连-服务端其他重置 连接 TCP 建连失败的场景之一,见文档描述
client_rst_flow 传输-客户端重置 连接 TCP 传输失败的场景之一,见文档描述
server_rst_flow 传输-服务端重置 连接 TCP 传输失败的场景之一,见文档描述
server_queue_lack 传输-服务端队列溢出 连接 TCP 传输失败的场景之一,见文档描述
tcp_timeout 传输-TCP 连接超时 连接 TCP 传输失败的场景之一,见文档描述
client_half_close_flow 断连-客户端半关 连接 TCP 断连异常的场景之一,见文档描述
server_half_close_flow 断连-服务端半关 连接 TCP 断连异常的场景之一,见文档描述
rtt 平均 TCP 建连时延 微秒 采集周期内,所有 TCP 建连时延的平均值,单次时延的计算见文档描述
rtt_client 平均 TCP 建连客户端时延 微秒 采集周期内,所有 TCP 建连客户端时延的平均值,单次时延的计算见文档描述
rtt_server 平均 TCP 建连服务端时延 微秒 采集周期内,所有 TCP 建连服务端时延的平均值,单次时延的计算见文档描述
srt 平均 TCP/ICMP 系统时延 微秒 采集周期内,所有 TCP/ICMP 系统时延的平均值,单次时延的计算见文档描述
art 平均数据时延 微秒 采集周期内,所有数据时延的平均值,数据时延包含 TCP/UDP,单次时延的计算见文档描述
cit 平均客户端等待时延 微秒 采集周期内,所有客户端等待时延的平均值,数据时延仅包含 TCP,单次时延的计算见文档描述
rtt_max 最大 TCP 建连时延 微秒 采集周期内,所有 TCP 建连时延的最大值,单次时延的计算见文档描述
rtt_client_max 最大 TCP 建连客户端时延 微秒 采集周期内,所有 TCP 建连客户端时延的最大值,单次时延的计算见文档描述
rtt_server_max 最大 TCP 建连服务端时延 微秒 采集周期内,所有 TCP 建连服务端时延的最大值,单次时延的计算见文档描述
srt_max 最大 TCP/ICMP 系统时延 微秒 采集周期内,所有 TCP/ICMP 系统时延的最大值,单次时延的计算见文档描述
art_max 最大数据时延 微秒 采集周期内,所有数据时延的最大值,数据时延包含 TCP/UDP,单次时延的计算见文档描述
cit_max 最大客户端等待时延 微秒 采集周期内,所有客户端等待时延的最大值,数据时延仅包含 TCP,单次时延的计算见文档描述
l7_request 应用请求 应用层协议请求次数
l7_response 应用响应 应用层协议响应次数
rrt 平均应用时延 微秒 采集周期内,所有应用时延的平均值,单次应用时延等于响应与请求的时间差
rrt_max 最大应用时延 微秒 采集周期内,所有应用时延的最大值,单次应用时延等于响应与请求的时间差
l7_error 应用异常 应用客户端异常 + 应用服务端异常
l7_client_error 应用客户端异常 根据具体应用协议的响应码判断异常,不同协议的定义见 l7_flow_log 中 response_status 字段的说明
l7_server_error 应用服务端异常 根据具体应用协议的响应码判断异常,不同协议的定义见 l7_flow_log 中 response_status 字段的说明
l7_timeout 应用超时 应用超时的统计次数(默认配置下:TCP 类应用在 1800s 内未采集到响应,UDP 类应用在 150s 内未采集到响应)
l7_error_ratio 应用异常比例 % 应用异常 / 应用响应
l7_client_error_ratio 应用客户端异常比例 % 应用客户端异常 / 应用响应
l7_server_error_ratio 应用服务端异常比例 % 应用服务端异常 / 应用响应
row 行数

generate from csv file: network_map.ch

#2.3 Grafana Dashboard

基于上述数据可通过 Grafana 构建丰富的 Dashboard。我们在 Grafana 中预置了一个 Network - K8s Pod Map Dashboard,效果图如下:

Network K8s Pod Map

Network K8s Pod Map

你也可以访问 DeepFlow Online Demo (opens new window) 查看效果。