故障模拟

最近更新时间: 2026-03-13 09:03:00

操作场景

云数据库 Redis® 提供自动故障切换能力,保障服务的可用性,自动故障切换包括 Proxy 节点的故障切换和 Redis Server(Redis 数据存储节点)的故障切换。
云数据库 Redis® 提供故障模拟功能,便于配合业务做故障模拟测试。您可以在控制台体验故障模拟功能。系统通过向所有的 Redis 主节点发送 shutdown 命令,触发自动的 HA(High Availability)逻辑来实现故障模拟。

Proxy 故障切换

云数据库 Redis® 标准架构和集群架构都有 Proxy 节点,标准架构的 Proxy 节点数量为3个,集群架构的 Proxy 数量随着分片数量线性增长,Proxy 节点的高可用设计如下:

  • 多个 Proxy 节点保证 Proxy 服务的高可用和负载均衡。
  • Proxy 节点会部署到3个物理设备,以保障高可用。
  • Proxy 节点故障后,拨测系统会检测到节点不可用,并自动补充新的节点。

Redis Server 故障切换

Redis 标准架构和集群架构采用的是 Redis Cluster 原生的集群管理机制,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,节点故障判断的时效性取决于 cluster-node-timeout,默认值是15000ms,建议不要更改该参数。节点故障的判断,请参见 Redis Cluster 原生设计

使用须知

  • 仅状态为运行中的实例才能进行故障模拟操作。
  • 仅多可用区部署的实例才能进行故障模拟操作。同一可用区部署的实例不支持。

注意事项

故障模拟将导致 Redis 服务在一定时间范围内不可用,通常故障恢复的时间小于1分钟,如果您正在写入数据,可能会产生数据丢失,请谨慎操作。

前提条件

  • 实例已配置多可用区部署。
  • 数据库版本要求:4.0及其以上。
  • 实例状态运行中。

操作步骤

  1. 登录租户端控制台,在左上角,单击**,在【全部云产品】**的菜单中,选择【云数据库 Redis® 】。
  2. 在右侧实例列表页面上方,选择地域。
  3. 在实例列表中,找到需进行故障模拟的多可用区实例。
  4. 单击实例 ID,进入【实例详情】页面。
  5. 在实例详情页面,单击节点管理页签,在更多操作的下拉列表中,选择【模拟故障】。
  6. 在弹出的【模拟故障】对话框,确认实例的名称及 ID,并了解故障模拟警告信息,在【实例密码】的输入框,输入实例访问密码,单击【确定】。实例状态将变更为处理中。
  7. 在左侧导航,单击任务管理,可等待任务执行完成。实例状态恢复为运行中,即说明模拟成功。

API 接口

API 接口API 含义
KillMasterGroup模拟故障接口
SwitchProxyProxy 模拟故障接口