日志服务支持对日志主题设置告警策略,告警策略会周期性执行监控任务,对监控对象中的主题执行检索分析,当查询结果满足触发条件时发送告警通知,方便用户及时发现异常问题。
基本概念
告警策略
监控告警的配置单元,包括监控对象、执行周期、触发条件、告警频率和通知渠道等信息。
监控对象
需要告警的日志主题,告警策略会对该主题执行检索分析语句(例如统计错误日志条数),然后检查结果是否满足触发条件。
监控任务
- 执行语句:对监控对象执行的检索分析语句,语法规则与检索分析一致。
- 触发条件:监控对象的检索分析结果满足指定条件时(例如错误日志数大于100条),则触发告警。检索分析结果不再满足执行条件时,则告警恢复。
- 告警级别:不同的触发条件可触发不同等级的告警,包括提醒、警告和紧急三种等级。
- 执行周期:策略执行周期,支持固定频率(例如每隔5分钟)和固定时间(例如每天12:00)。
多维分析
触发告警时可针对原始日志进行额外的检索分析,将结果附加在告警通知中,以辅助定位告警原因。例如错误日志条数触发告警时,同时查询具体的错误日志,查询告警通知时即可快速了解具体的错误原因。
告警通知
- 告警频率:告警持续未恢复时,每隔多久发送一次告警通知,避免告警通知过于频繁。
- 通知渠道组:支持邮件、短信、微信、电话、企业微信、自定义接口回调等告警通知方式。
产品优势
- 告警策略执行语句 语法规则 与检索分析一致,支持 SQL,并符合 SQL-92规范,可使用灵活的 SQL 语法及400+ SQL 函数对日志进行统计,从日志中获取各种需要告警的指标。
- 使用多维分析功能,可在告警通知中直接查看告警详细原因,提升问题处理效率。
规格与限制
告警功能共享检索分析的规格与限制,请参见 规格与限制。