容器服务(TKE)监控指标

最近更新时间: 2024-10-17 17:10:00

监控

目前云监控为容器服务提供了以下维度的监控指标:

集群维度监控指标

指标ID 指标名称 单位
K8sClusterNodeTotal Node 总数量
K8sClusterPodsUsedTotal Pod数量
K8sClusterAllocatablePodsTotal 可分配的 Pod 数量
K8sClusterCpuCoreTotal CPU总配置
K8sClusterRateCpuCoreUsedCluster CPU利用率 %
K8sClusterCpuCoreUsed CPU使用量
K8sClusterRateCpuCoreRequestCluster CPU分配率 %
K8sClusterEksCpuCoreUsed CPU使用量
K8sClusterMemoryTotal 内存总和 GB
K8sClusterRateMemUsageBytesCluster 内存利用率 %
K8sClusterRateMemNoCacheBytesCluster 内存利用率(不含cache) %
K8sClusterMemUsageBytes 内存使用量 MB
K8sClusterMemNoCacheBytes 内存使用量(不含cache) MB
K8sClusterEksMemUsageBytes 内存使用量 MB/S
K8sClusterRateMemRequestBytesCluster 内存分配率 %
K8sClusterNetworkTransmitBytes 网络出流量 MB
K8sClusterNetworkReceiveBytes 网络入流量 MB
K8sClusterNetworkTransmitBytesBw 网络出带宽 MB/S
K8sClusterNetworkReceiveBytesBw 网络入带宽 B
K8sClusterNetworkTransmitPackets 网络出包量 个/秒
K8sClusterNetworkReceivePackets 网络入包量 个/秒
K8sClusterFsReadTimes 块设备读取次数
K8sClusterFsWriteBytes 块设备写入大小 MB
K8sClusterEtcdDbTotalSizeBytes etcd存储量 MBytes
K8sClusterFsWriteTimes 块设备写入次数
K8sClusterFsReadBytes 块设备读取大小 MB
K8sClusterGpuTotal GPU总量
K8sClusterRateGpuRequestCluster GPU分配率 %
K8sClusterRateGpuMemoryUsedCluster GPU内存利用率 %
K8sClusterGpuMemoryUsedBytes GPU内存使用量 MB
K8sClusterGpuUsed GPU使用量
K8sClusterRateGpuMemoryRequestCluster GPU内存分配率 %
K8sClusterRateGpuMemoryUsedCluster GPU内存利用率 %
K8sClusterRateGpuUsedCluster GPU利用率 %
K8sClusterGpuMemoryTotalBytes GPU内存总量 GB

节点维度监控指标

指标ID 指标名称 单位
K8sNodePodRestartTotal 节点上 Pod 重启次数
K8sNodeCpuUsage CPU 利用率 %
K8sNodeMemUsage 内存利用率 %
K8sNodeLanIntraffic 内网入带宽 MB/S
K8sNodeLanOuttraffic 内网出带宽 MB/S
K8sNodeWanIntraffic 外网入带宽 MB/S
K8sNodeWanOuttraffic 外网出带宽 MB/S
K8sNodeTcpCurrEstab TCP 连接数
K8sNodeGpuUsed GPU 利用率 %

Pod维度监控指标

指标ID 指标名称 单位
K8sPodCpuCoreUsed CPU 使用量
K8sPodRateCpuCoreUsedNode CPU 利用率(占节点) %
K8sPodRateCpuCoreUsedRequest CPU 利用率(占 request) %
K8sPodRateCpuCoreUsedLimit CPU 利用率(占 limit) %
K8sPodMemUsageBytes 内存使用量 MB
K8sPodMemNoCacheBytes 内存使用量(不包含 cache) MB
K8sPodRateMemUsageNode 内存利用率(占节点) %
K8sPodRateMemNoCacheNode 内存利用率(占节点,不包含 cache) %
K8sPodRateGpuMemoryUsedRequest GPU 内存利用率(占 request) %
K8sPodRateMemNoCacheRequest 内存利用率(占 request,不包含 cache) %
K8sPodRateMemUsageLimit 内存利用率(占 limit) %
K8sPodRateMemNoCacheLimit 内存利用率(占 limit,不包含 cache) %
K8sPodNetworkReceiveBytesBw 网络入带宽 MB
K8sPodNetworkTransmitBytesBw 网络出带宽 MB/S
K8sPodNetworkReceiveBytes 网络入流量 MB
K8sPodNetworkTransmitBytes 网络出流量 MB
K8sPodNetworkReceivePackets 网络入包量 个/秒
K8sPodNetworkTransmitPackets 网络出包量 个/秒
K8sPodRateGpuUsedNode GPU 利用率(占节点) %
K8sPodRateGpuUsedRequest GPU 利用率(占 request) %
K8sPodGpuUsed GPU 使用量 MB

容器维度监控指标

指标ID 指标名称 单位
K8sContainerCpuCoreUsed CPU 使用量(容器2分钟内的平均 CPU 核数)
K8sContainerRateCpuCoreUsedNode CPU 利用率(占节点) %
K8sContainerRateCpuCoreUsedRequest CPU 利用率(占 Request) %
K8sContainerRateCpuCoreUsedLimit CPU 利用率(占 limit) %
K8sContainerMemUsageBytes 内存使用量 MB
K8sContainerMemNoCacheBytes 内存使用量(不包含 cache) MB
K8sContainerRateMemUsageNode 内存利用率(占节点) %
K8sContainerRateMemNoCacheNode 内存利用率(占节点,不包含 cache) %
K8sContainerRateMemUsageRequest 内存利用率(占 Request) %
K8sContainerRateMemNoCacheRequest 内存利用率(占 Request,不包含 cache) %
K8sContainerRateMemUsageLimit 内存利用率(占 limit) %
K8sContainerRateMemNoCacheLimit 内存利用率(占 Limit,不包含 cache) %
K8sContainerFsReadBytes 块设备读取带宽 MB/S
K8sContainerFsWriteBytes 块设备写入带宽 MB/S
K8sContainerGpuUsed 容器 GPU 使用量 MB
K8sContainerGpuMemoryUsedBytes GPU 内存使用量 MB
K8sContainerRateGpuUsedNode GPU 利用率(占节点) %
K8sContainerRateGpuMemoryUsedNode GPU 内存利用率(占节点) %
K8sContainerRateGpuUsedRequest GPU 利用率(占 request) %
K8sContainerRateGpuMemoryUsedRequest GPU显存利用率(占Request) %
K8sContainerNetworkTransmitBytes 网络出流量 MB

工作负载维度监控指标

指标ID 指标名称 单位
K8sWorkloadPodRestartTotal Pod重启次数
K8sWorkloadCpuCoreUsed CPU使用量
K8sWorkloadMemUsageBytes 内存使用量 MB
K8sWorkloadNetworkReceiveBytesBw 网络入带宽 MB
K8sWorkloadNetworkTransmitBytesBw 网络出带宽 MB
K8sWorkloadNetworkReceiveBytes 网络入流量 MB
K8sWorkloadNetworkTransmitBytes 网络出流量 MB
K8sWorkloadNetworkReceivePackets 网络入包量 个/秒
K8sWorkloadNetworkTransmitPackets 网络出包量 个/秒
K8sWorkloadGpuUsed GPU使用量
K8sWorkloadGpuMemoryUsedBytes GPU内存使用量 MB