实例分组在告警中的应用

最近更新时间: 2024-10-17 17:10:00

本文将为您介绍如何实现按业务分类,对同一产品大批量跨实例、跨地域的项目,统一设置告警策略。

  1. 简介 随着业务的发展,云产品资源不断增加,成为了日常监控与运维的瓶颈。您可以使用云监控实例分组功能,将大批量的云产品资源按业务进行分类。对同一分组下的实例统一设置告警策略,及时了解其使用和运行情况,迅速提升运维效率。 应用场景 假设我们有5台云服务器,其中3台(CVM-1、CVM-2、CVM-3)用于 A 游戏业务,其余2台用于其他业务。

    • CVM-1 位于广州地域、属于 A 项目。

    • CVM-2 位于上海地域、属于 B 项目。

    • CVM-3 位于北京地域、属于 C 项目。

      现需及时了解 A 游戏业务三台云服务器的使用和运行情况。需做如下配置。

    1. 创建实例分组。将 CVM-1、CVM-2、CVM-3 三台云服务器加入同一实例分组。

    2. 创建告警策略。包含 CPU 利用率、内存利用率、磁盘利用率、外网出带宽(监测流量使用情况)等指标。当任一实例指标达到一定阈值后自动发送告警通知。

  2. 实例分组

    1. 进入云平台控制台,单击实例分组。

    2. 单击新建,配置实例分组内容如下所示。

    • 分组名:命名为 “A游戏业务”。

    • 分组类型:选择云服务器—基础监控。

    • 添加至组:将 CVM-1、CVM-2、CVM-3 添加至实例分组。

  1. 配置完成后,单击保存即可。
  1. 创建告警

    1. 进入云平台控制台,单击告警策略。

    2. 单击新建,根据页面提示进行配置。

    • 策略名称:由您自定义。

    • 策略类型:选择云服务器—基础监控。

    • 告警对象:选择实例组—A游戏业务。

    • 告警触发条件。 CPU 利用率 、统计周期1分钟 、>85%、持续1个周期、每天告警一次。 内存 利用率 、统计周期1分钟 、>85%、持续1个周期、每天告警一次。 磁盘 利用率 、统计周期1分钟 、>85%、持续1个周期、每天告警一次。 外网出带宽 、统计周期1分钟 、100Mbps、持续1个周期、每天告警一次。

  • 通知模板:可以选择用户系统默认通知模板,或新建模板。
  1. 配置完成后,单击完成即可。