故障处理
最近更新时间: 2026-03-13 09:03:00
页面报错
在请求应用运维平台的前端页面时,可能会遇到报错,如下图:
当发现前端页面报错时,请按 f12 打开浏览器的审查模式,可以看到上面这个例子是作业工具的任务详情页出现了报错。
前端通过 YUNAPI 调用后端服务,每个 YUNAPI 请求都会有一个 RequestId,只需要复制这个 RequestId,然后进入K8s集群 中对应服务的 Pod,利用 RequestId 进行过滤搜索就可以找到报错的上下文信息,然后进行对应解决。
服务 Pod 故障
某些特殊的情况下,应用运维平台进行升级或者集群升级后,会看到应用运维平台 的组件 Pod 不是 Running 状态,出现了 Pod 异常,这个时候可以使用以下命令查看 Pod 的详情或者日志。
kubectl logs -n tap ${POD_NAME}

如果上面的 log 命令无法看到 Pod 的日志,那么可以使用以下命令排查Pod 运行失败的原因。
kubectl describe pod -n tap ${POD_NAME}
