故障现象场景描述
通过yunapi调用接口都报错。
故障影响范围
- 对云平台产品管控的影响:管控不可用,所用通过yunapi调用接口不可用。
- 对用户生产业务的影响:不影响客户已有存在的数据业务使用。
故障定位分析
- yunapi pod状态是否正常。
- 环境网络是否正常。
故障应急处置步骤
- 查看pod状态是否正常,pod状态不正常可以先删除重启快速恢复业务。
kubectl get pod -n tce | grep tcenter-yunapi3
kubectl delete pod -n tce xxxx--tcenter-yunapi3-traefik-xxxxx
- 重启不能恢复业务,进到容器内查看yunapi-traefik 到其它服务网络是否正常。网络异常修复网络,网络异常进一步通过查看服务日志排查问题。进一步恢复业务。
kubectl exec -it -n tce tcloud-tcenter-yunapi3-traefik-xxxx bash
cd /usr/local/services/traefik/log
#通过页面reqid过滤日志
grep -ir "reqid" traefik.log
grep -ir "reqid" *
故障恢复验证
页面通过yunapi调用接口成功。