在某些产品状态改变时,可以创建告警来及时通知您采取措施。告警在一定周期内监控某些特定指标,并根据配置的阈值每隔若干个时间段发送告警。
告警包含以下几个组成部分:
- 告警触发条件(什么条件下发送告警)
- 告警对象(哪个对象发出告警)
- 告警接收组(谁收到告警)
- 告警接收方式(怎么接收告警)
您可以从此部分了解如何对一个或多个对象创建告警,并选择需要接收告警的对象。
- 基本概念
| 术语 | 定义 |
|---|---|
| 告警策略类型 | 策略类型用于标识策略分类,类型与云产品对应,云产品下还有一层粒度区分。例如:当您选择云服务器-基础监控策略,即可自定义 CPU 使用率、磁盘使用率等指标告警;当您选择云服务器-存储监控策略,即可自定义硬盘IO等待时间、硬盘读流量等指标告警。 |
| 告警规则 | 告警规则对应具体监控指标满足的告警触发条件。例如:磁盘利用率每分钟大于80%且持续3分钟时,每1小时告警一次。 |
| 策略类型与告警规则关系 | 策略类型包含多个告警规则,是一系列告警规则的集合。例如:云服务器-基础监控策略包含磁盘利用率告警、ping不可达告警、CPU利用率告警等。 |
- 告警的状态
| 告警状态 | 说明 |
|---|---|
| 未恢复 | 没有被处理或正在被处理但资源仍处异常状态的告警 |
| 已恢复 | 已经恢复正常状态 |
| 数据不足 | - 产生告警的告警策略已被删除 - 云服务器从一个项目迁移至另一个项目 - 未安装或者卸载云监控控件,无数据上报 |
| 已失效 | - 告警策略发生变化 - 告警的最近告警时间超过24小时没有更新 |