监控告警指标
最近更新时间: 2024-10-17 17:10:00
利用云监控能力,您可以按一组有序的时间序列数据(称为指标)来检索统计数据。您可使用这些指标来验证您的系统是否按预期运行,如果超过了阈值,则会进行扩缩容。
AS 监控指标
AS 目前支持以下指标:
CPU 使用率
内存使用率
内网入带宽
外网入带宽
内网出带宽
外网出带宽
每个指标可以支持以下维度:
最大值
最小值
平均值
指标聚合方法
弹性伸缩是对 CVM 集群进行监控,这会涉及到多个 CVM 以及这些 CVM 在时间周期内产生的多个监控数据,这些数据会先进行聚合,再根据用户配置策略进行操作。
统计的基本策略是每个周期对每台云服务器的设定监控项进行1分钟取值(每分钟取一个值),若取到的值连续多个周期都符合设定的规则(周期数用户可自定义),则会触发告警伸缩行为。
例如:某伸缩组中有5台 CVM 实例,定义的告警伸缩策略是“CPU 利用率在5分钟内的最大/最小/平均值大于50%,发生3次”,弹性伸缩采集监控数据和策略判断,步骤如下
系统会每分钟对每台 CVM 取1个值,一个周期(当前设置为5分钟)里取了25个 CPU 使用率的值。
根据配置是最大值 / 最小值 / 平均值结合策略进行判断是否符合告警规则。
最大值:如果这25个值中的最大值有超过阈值(50%)的,该周期符合告警伸缩规则。
最小值:如果这25个值中的最小值有超过阈值(50%)的,该周期符合告警伸缩规则。
平均值:如果这25个值的平均值有超过阈值(50%)的,该周期符合告警伸缩规则。
如果连续3个周期(共15分钟,每5分钟判断当前周期)都符合此规则,则会触发伸缩行为。