告警策略

创建时间:2024-06-20 最近修改时间:2024-06-24

#1. 告警策略

告警策略的制定用于识别和响应异常情况的程序或服务,以确保系统运行正常和业务流程的稳定性。 告警策略页面中以列表的方式对所有告警策略的信息进行展示。

00-总览.png

00-总览.png

  • 告警数量:展示对应告警策略生效后产生的告警数据数量,支持点击跳转到告警事件页面中进一步查看相关信息
  • 状态:可选择开启或关闭策略
  • 操作:
    • 编辑:编辑对应告警策略,支持修改告警等级以及推送端点,使用详情,请查阅【编辑告警策略】章节
    • 删除:仅支持删除已关闭的告警策略

#1.1 编辑告警策略

告警策略需填写基础信息、监控配置、通知配置三个模块信息配置,生成所需的告警策略。

01-编辑告警策略.png

01-编辑告警策略.png

  • 基础信息
    • 告警名称:必填,填写对应的告警名称
    • 团队:必选,选择可查看策略的团队组织
    • 添加标签:支持对告警策略自行添加标签
    • 等级:告警策略的重要程度

02-编辑告警策略.png

02-编辑告警策略.png

  • 监控配置
    • 监控频率:两次数据监控的时间间隔
    • 监控区间:每次执行策略时,数据查询的时间范围
      • 可选择1 分钟5 分钟15 分钟30 分钟1 小时
    • 监控指标:选择要监控的数据指标
    • 事件等级:根据设定条件,可将监控事件划分为致命错误警告恢复信息无数据六种等级事件
      • 恢复:当连续 X 次监控事件结果不满足【致命、错误、警告、无数据】任一条件时,则生成恢复事件
      • 信息:开启后,若结监控事件结果不满足【致命、错误、警告、恢复、无数据】任一条件时,则生成信息事件
      • 无数据:开启后,若监控事件无数据,则生成无数据事件
    • 通知配置
      • 推送端点:选择要推送的对象,支持选择多个对象,配置详情,请参阅【推送端点】章节