服务监控

最近更新时间: 2024-10-17 17:10:00

操作场景

该任务指导您通过 TSF 控制台,查看某命名空间下所有微服务的运行状态,并且根据微服务的监控指标初步判断该是否出现异常。

操作步骤

  1. 登录 【TSF 控制台】 。

  2. 在左侧菜单栏中,单击【服务监控】,选择好命名空间、时间范围和微服务,可查看当前筛选条件下的服务的监控列表信息。 当某个服务的请求量,请求错误率,响应耗时等指标出现异常时,您可单击该服务操作列的【查看监控详情】查看详细监控信息:

  • 该服务的相关的依赖拓扑图(服务及其上下游服务):

  • 请求概览:统计服务被请求的监控详情。

  • 监控信息:选择【监控】页签,可查看服务的请求量、错误率、响应耗时、响应耗时分布和 HTTP 状态码等监控信息。 说明:响应耗时中 p95 代表线上95%的请求耗时都小于某个时间。 单击每条曲线右上角可添加指标同环比,后面部署组、实例和接口的各指标曲线同样可查看。

  • 统计信息:选择【统计】页签,可查看该服务的请求量、错误率、响应耗时和 HTTP 状态码等监控指标的统计信息。

  1. 在服务详情页面,您可以继续查看该服务下的部署组、实例和接口列表的监控信息。

部署组监控 单击【部署组监控】页签,可以查看该服务下部署组的监控信息。

您可以点击具体指标右边的按钮对该服务下所有部署组的指标进行排序,通过部署组的请求错误率和耗时等指标判断部署组是否有异常。 若发现部署组异常,您可以单击“部署组ID/名称”继续向下排查问题,参考 【部署组监控】 。 实例监控 单击【实例监控】页签,查看该服务下实例的监控信息。

  • 请求概览

您可以点击具体指标右边的按钮对该服务下所有实例的指标进行排序,通过实例的请求错误率和耗时等指标判断实例是否有异常。 若发现实例异常,您可以单击“实例ID/名称”继续向下排查问题 。

  • JVM 监控:仅 Java 应用支持 JVM 监控能力。 JVM 监控能力依赖实例上安装的探针。如您发现 JVM 监控不可用(2020年9月2日前导入集群的节点默认没有携带可以支持 JVM 监控的探针),针对虚拟机部署的业务,可以通过重新导入集群或重新安装 Agent 来使用 JVM 监控能力。针对容器部署的业务,则需要在 Dockerfile 中增加 JVM 监控组件 TencentCloudJvmMonitor-1.1.1

您可以单击右上角【前往查看实例诊断与实例日志】跳转至服务实例详情页面查看详细 JVM 监控信息。 接口监控 单击【接口监控】页签,可以查看该服务下接口的监控信息。

  • 请求概览 您可以点击具体指标右边的按钮对该服务下所有接口的指标进行排序,通过接口的请求错误率和耗时等指标判断接口是否出现异常。 若发现接口异常,您可以单击右上角【查看调用链详情】继续向下排查问题

  • 服务上游:展示服务上游的监控情况。 :::