功能介绍

最近更新时间: 2024-06-12 15:06:00

云顾问的巡检项包含五个维度:安全、可靠、服务限制、成本、性能

安全

通过建议您启用安全功能以及检查权限,提高系统和业务的安全性。

产品 巡检项 巡检说明
云服务器(CVM) 云服务器(CVM)公网访问不受限制 检查 CVM 公网访问安全策略,若 CVM 配置了公网 IP,且安全组放通了对所有 IP 和 Port 的访问权限,会存在被恶意入侵的风险
云服务器(CVM) 云服务器(CVM)公网高危端口 检查 CVM 公网访问安全策略,若 CVM 配置了公网 IP,且放通了高危端口访问权限,会存在被恶意入侵的风险
Elasticsearch Service ES 集群公网访问策略 检查 ES 集群的 Elasticsearch 组件公网访问策略,若未配置任何限制,则告警
Elasticsearch Service ES 集群的 Kibana 组件公网访问策略 检查 ES 集群的 Kibana 组件公网访问策略,若未配置任何限制,则告警
云数据库(Redis) 云数据库(Redis)高危命令检查 检查 Redis 实例禁用命令配置,若高危命令未禁用,容易出现应用阻塞,数据误删等风险

可靠

通过多方位监控,维护实例的运行稳定性。

产品 巡检项 巡检说明
云服务器(CVM) 云服务器(CVM)系统盘快照 检查CVM系统盘快照,若未创建快照,服务器或云硬盘出现问题时数据找回非常困难,易造成较大损失
云硬盘(CBS) 云硬盘(CBS)存储容量 检查云硬盘(CBS)的存储容量使用情况,若已使用容量占总容量比率过高,会导致云硬盘读写受到影响
ElasticsearchService Elasticsearch集群自动快照备份 检查Elasticsearch集群自动快照备份配置,若未配置,则提示风险
负载均衡(CLB) 负载均衡(CLB)健康检查配置 检查CLB是否配置健康检查,若未配置健康检查,CLB将向所有后端服务器转发流量(包括异常的后端服务器)
负载均衡(CLB) 负载均衡(CLB)转发规则配置 检查CLB监听器配置,若未配置转发规则,则无法正常使用CLB功能,产生额外成本
容器服务(TKE) 容器服务(TKE)集群节点跨可用区 集群节点是否都在单一可用区,单一可用区不可用时影响业务,集群无法调度到其他可用区
云服务器(CVM) 云服务器(CVM)实例磁盘空间使用率过高 检查CVM实例磁盘使用情况,若使用率过高,则磁盘读写会受到影响
云服务器(CVM) 云服务器(CVM)实例本地盘类型检查 检查CVM实例使用本地盘的情况,若实例为非IO或大数据类型,且使用了本地盘,则磁盘数据无法通过快照备份,存在容灾风险
云服务器(CVM) 云服务器(CVM)带宽利用率过高 检查CVM实例带宽利用率情况,若带宽利用率过高,则网络性能可能会受到影响
云数据库(MongoDB) 云数据库(MongoDB)oplog保存时间 检查MongoDBoplog保存时间,若保存时间过短,会导致回档失败或影响问题排查
云数据库(MongoDB) 云数据库(MongoDB)备份是否成功 检查MongoDB备份是否成功,如果备份任务失败,可能导致无法恢复数据
云数据库(MariaDB) 云数据库(MariaDB)主从延迟 当主从延迟持续过大时,主从数据一致性将得不到保障,此时如果实例发生了HA主从切换,极端情况下数据可能出现丢失
云数据库(Redis) 云数据库(Redis)跨可用区部署 检查Redis实例是否跨可用区部署,如果实例未跨可用区部署,当实例出现可用区级别的灾难故障时,可能造成实例无法访问风险
消息队列(TDMQ) 消息队列(TDMQ)集群健康状态检查 非健康状态下,集群使用可能面临一定风险
消息队列(TDMQ) 消息队列(TDMQ)备份消费者检查 检查是否只有一个消费者,如果采用单个消费者消费,单点挂了会影响消费业务
消息队列(TDMQ) 消息队列(TDMQ)死信队列检查 如果没有死信队列,消费者可能无法处理一些特殊情况的消息
云硬盘(CBS) 云硬盘(CBS)未创建快照 检查CBS是否有创建快照或定期快照策略,若都没有,服务器或云硬盘出现问题时数据找回非常困难,易造成较大损失
消息队列(CKafka) 消息队列(CKafka)跨可用区部署 如果没有跨可用区部署,单可用区集群出现严重故障的情况下,可能会导致CKafka集群不可用
私有网络(VPC) 私有网络(VPC)网络属性 检查VPC的网络属性,若网络属性为基础网络类型,则云服务器的内网IP地址都由云统一分配,无法自定义网段划分、IP地址,有一定的使用限制
负载均衡(CLB) 负载均衡(CLB)健康检查存在跳变情况 检查CLB监听器的健康检查是否有跳变情况,即是否存在服务器端口状态异常
负载均衡(CLB) 负载均衡(CLB)实例类型 检查CLB实例类型为传统型还是应用型,应用型功能更加丰富,如每个四层监听器可以配置不同的后端服务、支持七层监听器、支持CLS日志、SNI、绑定弹性网卡等多种特性
云数据库(Redis) 云数据库(Redis)使用基础网络 检查Redis是否使用基础网络
云数据库(MongoDB) 云数据库(MongoDB)使用基础网络 检查MongoDB是否使用基础网络
私有网络(VPC) 私有网络(VPC)子网规划 检查子网网段与VPC网段是否一致,如果完全一致,导致不能规划更多子网使用,不利于跨区拓展等长期规划实施
负载均衡(CLB) 负载均衡(CLB)及其绑定的CVM跨区 检查CLB及其绑定的CVM实例是否在同一个可用区,如果不是,跨区转发可能影响服务可靠性,如降低部分转发请求的速度
负载均衡(CLB) 负载均衡(CLB)后端服务单点 检查CLB监听器或转发规则绑定的如CVM、EVM等类型的后端服务实例,如果只有一个,存在单点隐患
负载均衡(CLB) 负载均衡(CLB)转发规则绑定CVM多个端口 检查CLB同一转发规则是否绑定同一台CVM的多个端口,如果是的话,随着业务量的增长,进程间的资源争抢会增加排障难度,同时多个端口可能会降低系统对流量波峰的抵御能力
负载均衡(CLB) 负载均衡(CLB)下的CVM跨子网 检查CLB同一监听器或转发规则绑定的多个CVM实例是否跨VPC子网,如果是的话,在异常发生情况不利于快速排障
负载均衡(CLB) 负载均衡(CLB)下的CVM权重 检查CLB同一监听器或转发规则关联的CVM权重,如果出现相同配置不同权重,或相同权重不同配置的情况,则可能在业务高峰时暴露性能短板的风险,影响业务稳定

服务限制

通过监控可提供的服务资源的最大数量。提醒您按照建议删除资源或请求增加配额。

产品 巡检项 巡检说明
云服务器(CVM) 云服务器(CVM)实例到期 检查CVM到期情况,若付费类型为包年包月的实例即将到期,且未配置自动续费,则在到期后存在实例被销毁的风险
云数据库(MongoDB) 云数据库(MongoDB)实例到期 检查MongoDB实例的到期情况,若类型为包年包月的实例即将到期,且未配置自动续费,过期后可能会导致业务访问受损
云数据库(MongoDB) 云数据库(MongoDB)存储容量 检查MongoDB存储容量的使用情况,当容量使用率达到100%时,将会导致写入失败
云数据库(Redis) 云数据库(Redis)实例到期 检查Redis实例的到期情况,若类型为包年包月的实例即将到期,且未配置自动续费,如果业务继续使用,可能有访问失败风险
云数据库(MariaDB) 云数据库(MariaDB)活跃连接数 当活跃连接数过多时,表明实例目前已经处于较高的压力状态,容易出现请求阻塞的情况
云数据库(MariaDB) 云数据库(MariaDB)连接使用率 当连接数使用率100%的时候,新增请求将无法建立连接,访问失败
云数据库(MariaDB) 云数据库(MariaDB)数据盘使用率 当磁盘使用率达到100%时,写入将会失败
云防火墙(CFW) 云防火墙(CFW)规则配额检查 检查云防火墙规则列表配额,若配额不足,则提示风险
私有网络(VPC) 私有网络(VPC)路由表使用数量 检查VPC路由表的数量,若接近或超过上限值,容易导致无法及时建立新的路由表
私有网络(VPC) 私有网络(VPC)路由表策略用量 检查VPC路由表策略数,若接近或超过上限值,容易导致无法及时建立新的路由策略
云数据库(Redis) 云数据库(Redis)内存接近4T上限 检查Redis实例内存是否接近4T上限
云数据库(Redis) 云数据库(Redis)副本数达到上限5个 检查Redis实例副本数是否达到上限5个

成本

根据运行情况,给出性价比更高的配置建议,降低用户成本花费。

产品 巡检项 巡检说明
负载均衡(CLB) 负载均衡(CLB)实例被闲置 检查CLB后端云资源绑定情况,若未绑定云资源(CVM实例、弹性网卡),则会判定为实例被闲置,产生额外成本
云硬盘(CBS) 云硬盘(CBS)未充分利用 检查CBS的挂载状态及IO读写情况,若CBS在近5天一直处于未挂载状态或近7天每天的IOPS不超过1次,则发出警报。长期闲置的云硬盘会带来不必要的开销
云数据库(MariaDB) 云数据库(MariaDB)利用率不足 检查实例是否闲置,如果业务生命周期已经稳定,长时间的闲置资源对业务成本会造成较多浪费
云数据库(MongoDB) 云数据库(MongoDB)利用率不足 检查MongoDB实例是否闲置,如果业务生命周期已经稳定,长时间的闲置资源对业务成本会造成较多浪费
云数据库(Redis) 云数据库(Redis)利用率不足 检查实例是否闲置,实例长时间业务请求次数小于100次,如果业务生命周期已经稳定,长时间的闲置资源对业务成本会造成较多浪费
负载均衡(CLB) 负载均衡(CLB)低利用率 检查CLB低利用率情况,如果连接数小于配额的10%,可能存在冗余成本

性能

根据监控实例运行中的资源使用情况和最佳实践,为您提供改善性能的建议。

产品 巡检项 巡检说明
云硬盘(CBS) 云硬盘(CBS)IO高负载 检查云硬盘(CBS)IO负载情况,若IO负载过高,则发出警告
云数据库(Redis) 云数据库(Redis)CPU使用率 检查Redis实例CPU使用率,CPU使用率长期过高可能导致请求延迟上升,阻塞等现象
云数据库(MongoDB) 云数据库(MongoDB)Cache脏数据 检查MongoDBCache脏数据情况,若Cache脏数据百分比大于20%,用户线程将参与刷盘,阻塞业务
云数据库(MongoDB) 云数据库(MongoDB)CPU使用率 检查MongoDB实例CPU使用率情况,若使用率过高,可能会出现业务请求延迟增加、等待等风险
云数据库(MariaDB) 云数据库(MariaDB)CPU使用率 当CPU使用率较高时,说明当前实例处理繁忙,容易导致查询变慢、堵塞的问题
云硬盘(CBS) 云硬盘(CBS)IOPS超限 检查CBS的IOPS峰值是否达到该类型CBS的配置上限,若已达到会有受到限流的风险
云硬盘(CBS) 云硬盘(CBS)吞吐量超限 检查CBS的吞吐量峰值是否达到该类型CBS的配置上限,若已达到会有受到限流的风险