机器组状态异常问题

最近更新时间: 2024-06-12 15:06:00

现象描述

配置机器组时,可能会出现所安装的 LogListener 状态异常。一旦状态异常,则 LogListener 与日志服务后端连接中断,会导致 LogListener 无法正常上传日志,异常状态如图:

排查步骤

说明:

本篇文档所述排查步骤仅适合于 LogListener 2.2.4 及以上版本。

1. 使用 LogListener 快速诊断工具

LogListener 快速诊断工具可以快速诊断 LogListener 是否启动、心跳是否正常、配置拉取是否正常。 在命令行下执行如下指令:

/etc/init.d/loglistenerd check

若 LogListener 运行正常,诊断工具返回的结果如图所示:

LogListener 进程异常

如果出现如下图所示 “[ERROR] loglistener is not running”字样,表示 LogListener 没有启动。 执行 /etc/init.d/loglistenerd start 启动,更多操作指令参考 LogListener 常用操作指令

LogListener 心跳异常

如果出现如下图所示 “[ERROR] check loglistener heareat fail” 字样,表示 LogListener 心跳异常。

引起 LogListener 心跳异常的原因有很多,最常见的情况有:

  • 网络异常

    检查网络环境是否连通。

     telnet <cls domain name> 80
  • 密钥信息错误

    检查 LogListener 密钥信息是否正确,进入到 LogListener 安装目录执行如下命令。

     grep secret etc/loglistener.conf

2. 检查机器组 IP 配置

检查机器组所添加的 IP 地址是否为 LogListener 安装过程中获取的 IP 地址。检查 LogListener 配置的 IP 地址:

grep group_ip etc/loglistener.conf

登录日志服务控制台,单击【机器组管理】,查看机器组配置的 IP 地址,机器组所配置的 IP 地址必须与 LogListener 获取的 IP 地址完全一致。