架构及模块说明

最近更新时间: 2024-06-12 15:06:00

  1. 整体设计

  2. 按模块划分

    • 上报部分:主要有业务的上报模块, dcos, 以及子机,母机上部署的Agent来完成采集和上报,子机与母机上均有到barad接入server的访问路径,所有上报均报到barad系统提供的统一的域名和cgi, 采用http协议进行上报。

    • 数据处理:由Flink搭建的流处理集群,前置接入server-NWS,和kafka提供消息缓冲。

    • 数据存储:采用ctsdb时序性数据存储,由专门的团队进行维护和升级。

    • 异常处理模块:包括告警中心和事件中心,分别处理需要统计计算后有阈值和持续时间的告警,以及单纯的触发性告警。

    • 消息发送模块:主要负责与后端的平台性消息发送平台对接,记录告警流水,以及对一些告警展示里的必要字段进行翻译。

    • 自定义消息模块:提供给租户端的直接发送消息功能的模块,不会进行收敛处理。

    • Api:分为customApi和baradApi两层,前者直接对接yunApi Gateway, 可供租户端调用;后者直接对接存储,对前端屏蔽一切存储相关的特性,且会提供一些指标配置管理的功能。

    • 自助接入系统:运营端使用,允许运维人员动态地添加、删除指标的维度聚合和统计配置,这些配置将会影响租户端和运营端可查看和配置告警的指标功能。