实例监控

最近更新时间: 2025-01-15 17:01:00

操作场景

该任务指导您通过 TSF 控制台,查看所选服务下某实例的详细监控信息。

操作步骤

  1. 登录 【TSF 控制台】。
  2. 在左侧菜单栏中,单击【服务监控】,选择好命名空间、时间范围和微服务,可查看当前筛选条件下的服务的监控列表信息。
  3. 单击目标服务操作列的【查看监控详情】,进入服务概览界面。
  4. 选择页面上方【实例监控】页签,查看该服务下实例的监控信息。
  • 请求概览 您可以点击具体指标右边的按钮对该服务下所有实例的指标进行排序,通过实例的请求错误率和耗时等指标判断实例是否有异常。
  • JVM 监控:仅 Java 应用支持 JVM 监控能力。

JVM 监控能力依赖实例上安装的探针。如您发现 JVM 监控不可用(2020年9月2日前导入集群的节点默认没有携带可以支持 JVM 监控的探针),针对虚拟机部署的业务,可以通过重新导入集群或重新安装 Agent 来使用 JVM 监控能力。针对容器部署的业务,则需要在 Dockerfile 中增加 JVM 监控组件 TencentCloudJvmMonitor-1.1.2

您可以单击右上角【前往查看实例诊断与实例日志】跳转至服务实例详情页面查看详细JVM监控信息。

  1. 单击目标实例的“实例ID”,进入实例概览页面。 您可在实例详情中的【实例概览】中,查看到该实例的以下信息:
  • 基本信息 您可以通过【实例所在节点IP】跳转到云服务器页面,查看云服务器信息。
  • 经过该实例的请求监控信息
  • 该实例的 JVM 监控概览(如果该实例为 Java 实例)

内存 如果实例为 Java 实例,您可在实例详情的【内存】tab 页中,查看到该实例的内存监控详情:

堆内存的【max】展示的是堆内存真实可用的最大值(会扣除 to_space内存),而不是配置的 xmx 参数;JDK1.8版本部分 GC 算法(如 G1GC 的 Survivor space),其 max 值会设置为 max_int 值,此时值会显示为-1。

您还可以通过单击图片卡片右上方的放大图标 ,放大当前图片;或通过单击下载图标 ,将当前图片下载到本地(.png格式)。

线程 如果实例为 Java 实例,您可在实例详情的【线程】tab 页中,查看到该实例的线程数变化情况、线程列表及线程详情,并进行死锁检测,了解实例的死锁情况。 线程数: 死锁检测:

死锁检测目前的实现,是可以打印互相死锁的线程栈;多个线程等待同一个死锁的情况下,并不能检测出全部的死锁线程,只能找到死锁的根源;建议修复死锁后,重复检测以确认不出现嵌套死锁。 火焰图 如果实例为 Java 实例,您还可以在【火焰图】tab 页中,采集并查看指定时段内程序执行过程所形成的“火焰图”,用以进行性能分析。

数据量过大、无热点函数、或出现进程连接失败等异常情况时,火焰图可能采集失败。具体可查看 JVM 监控 【常见问题】 。 请求详情 您可在【请求详情】tab页中,查询经过该实例的请求的调用链详情。

列表页中的“耗时”和“状态”,为服务处理请求的本地耗时和状态。

日志 您可在【日志】tab页中,查看该实例上的日志,包括业务日志及 JVM 的 GC 日志。

您也可以开启右上角【查看实时日志】按钮查看实时日志信息。

若某个实例出现问题,会导致请求发送到该问题实例上,此时可以开启【屏蔽实例】来手动下线该实例。服务被屏蔽后,该服务实例将不会被其他服务发现,流量不会分发到该实例上。

在服务治理页面,点击目标服务的“ID/名称”,进入服务实例列表,在操作栏可以屏蔽实例。