故障处理

最近更新时间: 2024-10-17 17:10:00

记录数据出现异常(缺失数据),请按以下步骤排查:

  1. 进入tcloud-tcenter-cam-auth容器:
    执行tcpdump -Xnp port 9503,如果没发现数据包传递,请检查cam-auth服务是否异常,具体可查看日志/data/release/cam_swoole/log/,进行问题定位
  2. 进入tcloud-tcenter-cam-log-yunapi容器:
    执行tcpdump -Xnp port 9503,查看是否收到数据包,如果没有,则为收包异常,请排查通信链路
    执行tcpdump -Xnp port 50021,观察通信是否正常,50021端口为HTTP服务,因此留意是否有关键词HTTP/1.1 200
  3. 进入tcloud-cloudaudit-cloudtraillog容器
    1) 观察审计日志/data/release/cloudtrail_log/application/logs/ca,如果日志不存在,请根据detail和req目录的日志进行服务诊断
    2) ps aux观察filebeat进程是否存在(该进程将日志上报到ES),可以查看/usr/local/services/qcloud_filebeat-1.0/logs执行情况
    3) 根据/usr/local/services/qcloud_filebeat-1.0/filebeat.yml 配置的output.elasticsearch,使用curl方式查看es服务是否健康,比如curl 10.10.2.21:9202

如果租户端云审计页面打开异常,请排查:

1) kg tcloud-cloudaudit-cloudtrail,获取容器IP后,用curl检测健康情况,如:curl -v 192.168.254.250:50021,如果异常,可查看容器中的日志:/data/release/cloudtrail/application/logs
2) 检查ES可用性,进入tcloud-cloudaudit-cloudtraillog容器,根据/usr/local/services/qcloud_filebeat-1.0/filebeat.yml 配置的output.elasticsearch,使用curl方式查看es服务是否健康,比如curl 10.10.2.21:9202