功能介绍
最近更新时间: 2024-10-17 17:10:00
云顾问的巡检项包含五个维度:安全、可靠、服务限制、成本、性能
安全
通过建议您启用安全功能以及检查权限,提高系统和业务的安全性。
产品 | 巡检项 | 巡检说明 |
---|---|---|
云服务器(CVM) | 云服务器(CVM)公网访问不受限制 | 检查 CVM 公网访问安全策略,若 CVM 配置了公网 IP,且安全组放通了对所有 IP 和 Port 的访问权限,会存在被恶意入侵的风险 |
云服务器(CVM) | 云服务器(CVM)公网高危端口 | 检查 CVM 公网访问安全策略,若 CVM 配置了公网 IP,且放通了高危端口访问权限,会存在被恶意入侵的风险 |
Elasticsearch Service | ES 集群公网访问策略 | 检查 ES 集群的 Elasticsearch 组件公网访问策略,若未配置任何限制,则告警 |
Elasticsearch Service | ES 集群的 Kibana 组件公网访问策略 | 检查 ES 集群的 Kibana 组件公网访问策略,若未配置任何限制,则告警 |
云数据库(Redis) | 云数据库(Redis)高危命令检查 | 检查 Redis 实例禁用命令配置,若高危命令未禁用,容易出现应用阻塞,数据误删等风险 |
可靠
通过多方位监控,维护实例的运行稳定性。
产品 | 巡检项 | 巡检说明 |
---|---|---|
云服务器(CVM) | 云服务器(CVM)系统盘快照 | 检查CVM系统盘快照,若未创建快照,服务器或云硬盘出现问题时数据找回非常困难,易造成较大损失 |
云硬盘(CBS) | 云硬盘(CBS)存储容量 | 检查云硬盘(CBS)的存储容量使用情况,若已使用容量占总容量比率过高,会导致云硬盘读写受到影响 |
ElasticsearchService | Elasticsearch集群自动快照备份 | 检查Elasticsearch集群自动快照备份配置,若未配置,则提示风险 |
负载均衡(CLB) | 负载均衡(CLB)健康检查配置 | 检查CLB是否配置健康检查,若未配置健康检查,CLB将向所有后端服务器转发流量(包括异常的后端服务器) |
负载均衡(CLB) | 负载均衡(CLB)转发规则配置 | 检查CLB监听器配置,若未配置转发规则,则无法正常使用CLB功能,产生额外成本 |
容器服务(TKE) | 容器服务(TKE)集群节点跨可用区 | 集群节点是否都在单一可用区,单一可用区不可用时影响业务,集群无法调度到其他可用区 |
云服务器(CVM) | 云服务器(CVM)实例磁盘空间使用率过高 | 检查CVM实例磁盘使用情况,若使用率过高,则磁盘读写会受到影响 |
云服务器(CVM) | 云服务器(CVM)实例本地盘类型检查 | 检查CVM实例使用本地盘的情况,若实例为非IO或大数据类型,且使用了本地盘,则磁盘数据无法通过快照备份,存在容灾风险 |
云服务器(CVM) | 云服务器(CVM)带宽利用率过高 | 检查CVM实例带宽利用率情况,若带宽利用率过高,则网络性能可能会受到影响 |
云数据库(MongoDB) | 云数据库(MongoDB)oplog保存时间 | 检查MongoDBoplog保存时间,若保存时间过短,会导致回档失败或影响问题排查 |
云数据库(MongoDB) | 云数据库(MongoDB)备份是否成功 | 检查MongoDB备份是否成功,如果备份任务失败,可能导致无法恢复数据 |
云数据库(MariaDB) | 云数据库(MariaDB)主从延迟 | 当主从延迟持续过大时,主从数据一致性将得不到保障,此时如果实例发生了HA主从切换,极端情况下数据可能出现丢失 |
云数据库(Redis) | 云数据库(Redis)跨可用区部署 | 检查Redis实例是否跨可用区部署,如果实例未跨可用区部署,当实例出现可用区级别的灾难故障时,可能造成实例无法访问风险 |
消息队列(TDMQ) | 消息队列(TDMQ)集群健康状态检查 | 非健康状态下,集群使用可能面临一定风险 |
消息队列(TDMQ) | 消息队列(TDMQ)备份消费者检查 | 检查是否只有一个消费者,如果采用单个消费者消费,单点挂了会影响消费业务 |
消息队列(TDMQ) | 消息队列(TDMQ)死信队列检查 | 如果没有死信队列,消费者可能无法处理一些特殊情况的消息 |
云硬盘(CBS) | 云硬盘(CBS)未创建快照 | 检查CBS是否有创建快照或定期快照策略,若都没有,服务器或云硬盘出现问题时数据找回非常困难,易造成较大损失 |
消息队列(CKafka) | 消息队列(CKafka)跨可用区部署 | 如果没有跨可用区部署,单可用区集群出现严重故障的情况下,可能会导致CKafka集群不可用 |
私有网络(VPC) | 私有网络(VPC)网络属性 | 检查VPC的网络属性,若网络属性为基础网络类型,则云服务器的内网IP地址都由云统一分配,无法自定义网段划分、IP地址,有一定的使用限制 |
负载均衡(CLB) | 负载均衡(CLB)健康检查存在跳变情况 | 检查CLB监听器的健康检查是否有跳变情况,即是否存在服务器端口状态异常 |
负载均衡(CLB) | 负载均衡(CLB)实例类型 | 检查CLB实例类型为传统型还是应用型,应用型功能更加丰富,如每个四层监听器可以配置不同的后端服务、支持七层监听器、支持CLS日志、SNI、绑定弹性网卡等多种特性 |
云数据库(Redis) | 云数据库(Redis)使用基础网络 | 检查Redis是否使用基础网络 |
云数据库(MongoDB) | 云数据库(MongoDB)使用基础网络 | 检查MongoDB是否使用基础网络 |
私有网络(VPC) | 私有网络(VPC)子网规划 | 检查子网网段与VPC网段是否一致,如果完全一致,导致不能规划更多子网使用,不利于跨区拓展等长期规划实施 |
负载均衡(CLB) | 负载均衡(CLB)及其绑定的CVM跨区 | 检查CLB及其绑定的CVM实例是否在同一个可用区,如果不是,跨区转发可能影响服务可靠性,如降低部分转发请求的速度 |
负载均衡(CLB) | 负载均衡(CLB)后端服务单点 | 检查CLB监听器或转发规则绑定的如CVM、EVM等类型的后端服务实例,如果只有一个,存在单点隐患 |
负载均衡(CLB) | 负载均衡(CLB)转发规则绑定CVM多个端口 | 检查CLB同一转发规则是否绑定同一台CVM的多个端口,如果是的话,随着业务量的增长,进程间的资源争抢会增加排障难度,同时多个端口可能会降低系统对流量波峰的抵御能力 |
负载均衡(CLB) | 负载均衡(CLB)下的CVM跨子网 | 检查CLB同一监听器或转发规则绑定的多个CVM实例是否跨VPC子网,如果是的话,在异常发生情况不利于快速排障 |
负载均衡(CLB) | 负载均衡(CLB)下的CVM权重 | 检查CLB同一监听器或转发规则关联的CVM权重,如果出现相同配置不同权重,或相同权重不同配置的情况,则可能在业务高峰时暴露性能短板的风险,影响业务稳定 |
服务限制
通过监控可提供的服务资源的最大数量。提醒您按照建议删除资源或请求增加配额。
产品 | 巡检项 | 巡检说明 |
---|---|---|
云服务器(CVM) | 云服务器(CVM)实例到期 | 检查CVM到期情况,若付费类型为包年包月的实例即将到期,且未配置自动续费,则在到期后存在实例被销毁的风险 |
云数据库(MongoDB) | 云数据库(MongoDB)实例到期 | 检查MongoDB实例的到期情况,若类型为包年包月的实例即将到期,且未配置自动续费,过期后可能会导致业务访问受损 |
云数据库(MongoDB) | 云数据库(MongoDB)存储容量 | 检查MongoDB存储容量的使用情况,当容量使用率达到100%时,将会导致写入失败 |
云数据库(Redis) | 云数据库(Redis)实例到期 | 检查Redis实例的到期情况,若类型为包年包月的实例即将到期,且未配置自动续费,如果业务继续使用,可能有访问失败风险 |
云数据库(MariaDB) | 云数据库(MariaDB)活跃连接数 | 当活跃连接数过多时,表明实例目前已经处于较高的压力状态,容易出现请求阻塞的情况 |
云数据库(MariaDB) | 云数据库(MariaDB)连接使用率 | 当连接数使用率100%的时候,新增请求将无法建立连接,访问失败 |
云数据库(MariaDB) | 云数据库(MariaDB)数据盘使用率 | 当磁盘使用率达到100%时,写入将会失败 |
云防火墙(CFW) | 云防火墙(CFW)规则配额检查 | 检查云防火墙规则列表配额,若配额不足,则提示风险 |
私有网络(VPC) | 私有网络(VPC)路由表使用数量 | 检查VPC路由表的数量,若接近或超过上限值,容易导致无法及时建立新的路由表 |
私有网络(VPC) | 私有网络(VPC)路由表策略用量 | 检查VPC路由表策略数,若接近或超过上限值,容易导致无法及时建立新的路由策略 |
云数据库(Redis) | 云数据库(Redis)内存接近4T上限 | 检查Redis实例内存是否接近4T上限 |
云数据库(Redis) | 云数据库(Redis)副本数达到上限5个 | 检查Redis实例副本数是否达到上限5个 |
成本
根据运行情况,给出性价比更高的配置建议,降低用户成本花费。
产品 | 巡检项 | 巡检说明 |
---|---|---|
负载均衡(CLB) | 负载均衡(CLB)实例被闲置 | 检查CLB后端云资源绑定情况,若未绑定云资源(CVM实例、弹性网卡),则会判定为实例被闲置,产生额外成本 |
云硬盘(CBS) | 云硬盘(CBS)未充分利用 | 检查CBS的挂载状态及IO读写情况,若CBS在近5天一直处于未挂载状态或近7天每天的IOPS不超过1次,则发出警报。长期闲置的云硬盘会带来不必要的开销 |
云数据库(MariaDB) | 云数据库(MariaDB)利用率不足 | 检查实例是否闲置,如果业务生命周期已经稳定,长时间的闲置资源对业务成本会造成较多浪费 |
云数据库(MongoDB) | 云数据库(MongoDB)利用率不足 | 检查MongoDB实例是否闲置,如果业务生命周期已经稳定,长时间的闲置资源对业务成本会造成较多浪费 |
云数据库(Redis) | 云数据库(Redis)利用率不足 | 检查实例是否闲置,实例长时间业务请求次数小于100次,如果业务生命周期已经稳定,长时间的闲置资源对业务成本会造成较多浪费 |
负载均衡(CLB) | 负载均衡(CLB)低利用率 | 检查CLB低利用率情况,如果连接数小于配额的10%,可能存在冗余成本 |
性能
根据监控实例运行中的资源使用情况和最佳实践,为您提供改善性能的建议。
产品 | 巡检项 | 巡检说明 |
---|---|---|
云硬盘(CBS) | 云硬盘(CBS)IO高负载 | 检查云硬盘(CBS)IO负载情况,若IO负载过高,则发出警告 |
云数据库(Redis) | 云数据库(Redis)CPU使用率 | 检查Redis实例CPU使用率,CPU使用率长期过高可能导致请求延迟上升,阻塞等现象 |
云数据库(MongoDB) | 云数据库(MongoDB)Cache脏数据 | 检查MongoDBCache脏数据情况,若Cache脏数据百分比大于20%,用户线程将参与刷盘,阻塞业务 |
云数据库(MongoDB) | 云数据库(MongoDB)CPU使用率 | 检查MongoDB实例CPU使用率情况,若使用率过高,可能会出现业务请求延迟增加、等待等风险 |
云数据库(MariaDB) | 云数据库(MariaDB)CPU使用率 | 当CPU使用率较高时,说明当前实例处理繁忙,容易导致查询变慢、堵塞的问题 |
云硬盘(CBS) | 云硬盘(CBS)IOPS超限 | 检查CBS的IOPS峰值是否达到该类型CBS的配置上限,若已达到会有受到限流的风险 |
云硬盘(CBS) | 云硬盘(CBS)吞吐量超限 | 检查CBS的吞吐量峰值是否达到该类型CBS的配置上限,若已达到会有受到限流的风险 |