如上图,Prometheus核心功能包括服务发现、数据采集和数据存储。服务发现模块专门负责发现需要监控的目标采集点(target
)信息,数据采集模块从服务发现模块订阅该信息,获取到target
信息后,其中就包含协议(scheme
)、主机地址:端口(instance
)、请求路径(metrics_path
)、请求参数(params
)等;然后数据采集模块就可以基于这些信息构建出一个完整的Http Request
请求,定时通过pull http
协议不断的去目标采集点(target
)拉取监控样本数据(sample
);最后,将采集到监控样本数据交由TSDB
模块进行数据存储。
类似于微服务通过引入注册中心组件解决众多微服务间错综复杂的依赖调用。无论是服务主动停止,意外挂掉,还是因为流量增加对服务实现进行扩容,这些服务数据或状态上的动态变化,通过注册中心屏蔽服务状态变更造成的影响,简化了调用方处理逻辑。
(资料图片)
同理,Prometheus
最开始设计是一个面向云原生应用程序的,云原生、容器场景下按需的资源使用方式对于监控系统而言就意味着没有了一个固定的监控目标,所有的监控对象(基础设施、应用、服务)都在动态的变化。Prometheus
解决方案就是引入一个中间的代理人,这个代理人掌握着当前所有监控目标的访问信息,Prometheus
只需要向这个代理人询问有哪些监控目标即可,这种模式被称为服务发现(service discovery
)。
目前,Prometheus
支持的服务发现协议是非常丰富的,最新版本(2.41
)已支持接近三十种服务发现协议:
1、Prometheus
服务启动加载prometheus.yml
配置文件会被解析Config
结构体:
❝
Config
结构体是配置类的最顶层结构,内部包含6个字段分别对应prometheus
配置的6大组成部分。
❞
2、其中数据采集配置部分ScrapeConfigs
对应的是一个*ScrapeConfig类型
切片,一个ScrapeConfig
对应的是scrape_configs
配置下的一个job
抓取任务,服务发现协议配置对应其中ServiceDiscoveryConfigs
字段:
3、discovery.Configs
对应的是Config
切片:
type Configs []Config
所以,一个job
抓取任务下可以配置多个服务发现协议,如:
- job_name: "prometheus" metrics_path: /metrics static_configs: - targets: ["124.222.45.207:9090"] file_sd_configs: - files: - targets/t1.json - targets/t2.json refresh_interval: 5m
4、Config
是一个接口:
Config
是一个接口的定义,每种服务发现协议都会存在一个对应Config
接口的实现(见下图)。该接口主要定义两个方法:
1、Name() string:定义服务发现协议类型,如eureka、kubernetes等等;2、NewDiscoverer(DiscovererOptions) (Discoverer, error):返回一个Discoverer类型变量,该类型也是一个接口,其只定义了一个方法Run方法,即Discoverer是对应的服务发现协议具体运行逻辑封装,通过Run方法提供统一的运行入口。
服务发现核心原理
说明:
Prometheus
服务发现核心逻辑的入口主要关注Manager
结构体的ApplyConfig
方法:基于服务发现的配置使其生效;
ApplyConfig
方法包括四个主要步骤:
type provider struct { name string d Discoverer subs []string config interface{}}
❝一个job下一个服务发现协议对应一个Discoverer。❞
provider
还有额外三个字段:
1、name
:provider
名称,格式:fmt.Sprintf("%s/%d", typ, len(m.providers))
;
2、subs
:string
切片,存放job
名称,因为可能不同job
下存在一致的服务发现配置,就只会生成一个provider
,然后subs
存放job
列表;
3、config
:服务发现配置
Discoverer
接口Run
方法,让服务发现逻辑运行;协程中运行updater
方法;Discoverer
接口Run
方法主要基于具体服务发现协议发现target
,然后通过通道传递给updater
处理逻辑,将其解析处理放入到Manager
结构体中targets
字段中,并向triggerSend
通道发送信号,表示当前targets
发生变更;Manager
结构体sender
方法每5秒监听triggerSend
通道信号,并将Manager
结构体中targets
字段处理后放入到syncCh
通道中;数据采集模块(scrape
)监听syncCh
通道,就可以获取到服务发现生成的targets
信息,然后reload
将target
纳入监控开始抓取监控指标。启动provider
:遍历Manager
结构体中providers
切片,启动每个provider
,该步骤主要是启动两个协程:❝Manager
结构体sender
方法是在Prometheus
启动时discoveryManagerScrape.Run()
方法中启动。❞取消服务发现:配置变更也会调用ApplyConfig
方法,这时就要把基于之前配置运行的服务发现服务取消,然后基于当前配置重新生成;清空:主要清空discoverCancel
、targets
和providers
几个容器元素,因为要基于当前配置重新生成;注册provider
:provider
是对Discoverer
的封装,不同服务发现协议都会实现Config
接口,其中NewDiscoverer
方法就是创建Discoverer
「Prometheus服务发现核心就是三个协程之间协作:」
「协程1:」负责运行Discoverer
接口Run
方法,基于协议发现采集点;「协程2:」负责将协程1发现的采集点信息更新到Manager
结构体中targets
字段的map
中;「协程3:」负责将Manager
结构体中targets
字段的数据通过通道发送给scrape
模块;scrape模块获取到采集点如何进行数据采集后续scrape模块分析。
Prometheus
服务发现通用指标主要有如下5个,都定义在discovery/manager.go
中:
prometheus_sd_discovered_targetsprometheus_sd_failed_configsprometheus_sd_received_updates_totalprometheus_sd_updates_delayed_totalprometheus_sd_updates_total
「1、采集点数量指标」
服务发现主要基于协议发现采集目标,prometheus_sd_discovered_targets
指标反馈各个job
发现的采集目标数:
prometheus_sd_discovered_targets:gauge类型,当前发现的目标数config:job名称name:取值scrape和notify,区分指标抓取服务发现还是告警通知服务发现示例:prometheus_sd_discovered_targets{config="auth_es1", name="scrape"} 12
❝这里基于协议发现的目标数,还未进入采集模块,并不能区分是在线还是离线。❞
「2、服务发现协议异常错误指标」
服务发现会给每个发现配置项生成一个provider
,并为每个provider
使用协程运行,如果基于配置项生成provider
错误就可以通过prometheus_sd_failed_configs
指标反馈:
prometheus_sd_failed_configs:gauge类型,当前无法加载的服务发现配置数配置数:一个job可能存在多个服务发现协议配置,对应配置项则是多个示例:prometheus_sd_failed_configs{name="scrape"} 10prometheus_sd_failed_configs{name="notify"} 5
一个job
可能对应多个服务发现配置项,如下:这个job
下配置了static_configs
和file_sd_configs
两个服务发现协议配置,则对应两个服务发现配置项,注册两个provider
,每个provider
在独立协程中运行:
scrape_configs: # The job name is added as a label `job=` to any timeseries scraped from this config. - job_name: "test" static_configs: - targets: ["localhost:9090"] file_sd_configs: - refresh_interval: 5m files: - targets/manual.*.json
「3、协程交互指标」
服务发现主要涉及3类协程:
Discoverer协程
(多个):封装provider
,基于协议发现采集点,这里可能会存在多个,一个provider
对应一个Discoverer协程
;updater协程
(1个):Discoverer协程
发现采集点,通过channel通道
通知到updater协程
,updater协程
将采集点更新到Manager结构体
中targets字段
中,然后向Manager结构体
中triggerSend通道
写入数据,告诉sender
协程targets
有更新;sender协程
(1个):sender协程
每5秒检测triggerSend
通道数据,检测到更新则将Manager
结构体targets
数据处理封装写入到Manager
结构体syncCh
通道中,scrape
模块监测该通道,即完成将服务发现模块
和scrape模块
交互。这其中涉及三个指标:
prometheus_sd_received_updates_totalprometheus_sd_updates_delayed_totalprometheus_sd_updates_total
如上图,Prometheus核心功能包括服务发现、数据采集和数据存储。服...
保利天汇,作为天河的热门IP,一向是广州购房者心中的*选择。总价仅...
1、大相径庭、大有径庭。2、大相径庭(dàxiāngjìngtíng),汉语成...
不知不觉就是2021年的最后一天了,大家想好怎么去发朋友圈了吗?下面...
1、绝地求生官方给出的电脑推荐配置和最低配置如下2、可以用腾讯管...
1、抗衰老秘诀1:良好的作息规律2、一个好的作息规律可以帮助我们有...
中国的超大规模单一市场是应对各种“脱钩断链”挑战的重要基础。
90到110厘米。正常的室内楼梯一般情况下不能低于90厘米,室外楼梯的...
大家好,小城来为大家解答以上问题。无情突袭合剂怎么领悟,无情突...
产品质量报告怎么写的,产品质量报告怎么写这个很多人还不知道,现在...
福建省龙文区发布暴雨蓝色预警
近期,上海市高级人民法院会同上海市发展和改革委员会等17家单位联...
董卓虽然想用曹操,为何曹操却要刺杀他呢?对于汉臣来说,刺杀灵帝...
e公司讯,和而泰3月25日在互动平台表示,今年以来公司汽车电子新项...
↑这是黟县宏村南湖春景(3月24日摄)。新华社记者张晨摄仲春时节,...
如何优化基金定投过程,实现微笑曲线?,加仓,宽基,基金定投,基金投...
1、神舟七号发射日期:2008年9月25日。神舟七号载人航天飞船于2008...
2023年6月acca考试要提前进考场的,acca考试官方建议所有考生要在考...
拜见,意指拜访会见,从客人方面,是会见地位高或辈分高的人。语出...
随着春季新兵入伍起运,全市新兵结束集训正式踏上入伍的旅程。深圳...
03月24日,柏楚电子被沪股通减持11 22万股,已连续3日被沪股通减持...
1、免安装中文汉化错误比较多,建议去3DM论坛-GTA专区-头顶贴子:《侠...
永新县的乡镇如下:禾川镇、石桥镇、龙源口镇、里田镇、龙门镇、沙...
1、已发送。2、《家养人鱼不安分》是全本的。3、《人鱼也种田》只有...
当前疫情形势仍然严峻复杂,不可松懈。2023年03月25日重庆最新进出管...
今天小编肥嘟来为大家解答以上的问题。人格权和身份权的区别和共性...
3月24日十二点,2023年年度品质盛典选票就要结束了!截止到目前,张...
今日(3月24日)上午,A股三大指数表现分化。沪指低开后震荡走低,...
同花顺金融研究中心3月24日讯,有投资者向读客文化提问,公司在知识...
金雷股份(300443)深度:全球风电主轴龙头铸造开启第二成长曲线