故障现象场景描述
标签服务页面报错:
故障影响范围
- 对云平台产品管控的影响:影响标签查询,修改等。
- 对用户生产业务的影响:无影响
故障定位分析
后端服务异常,容器化部署:
- 服务pod状态异常。
- 服务单个接口功能异常。
故障应急处置步骤
检查服务pod状态:检查pod是否正常拉起,pod状态是否正常。
kubectl get pod -n tce | grep tagpod 状态不正常,删除重启pod 。
kubectl delete pod -n tce tcloud-tcenter-platform-tag-xxxxxpod状态正常,通过页面RequestId 查询服务日志排查根因。
kubectl get pod -n tce | grep tcloud-tcenter-platform-tag kubectl exec -it -n tce tcloud-tcenter-platform-tag-xxxx bash cd /data/log/swoole_tag grep -ir "{RequestId}" ./*
故障恢复验证
页面功能恢复。
