广告
返回顶部
首页 > 资讯 > 前端开发 > JavaScript >Prometheus中怎么实现集群监控
  • 631
分享到

Prometheus中怎么实现集群监控

2024-04-02 19:04:59 631人浏览 泡泡鱼
摘要

prometheus中怎么实现集群监控,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。 1、Prometheus 对比 Zabbix和

prometheus中怎么实现集群监控,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

 

1、Prometheus 对比 Zabbix

和 Zabbix 类似,Prometheus 也是一个近年比较火的开源监控框架,和 Zabbix不同之处在于 Prometheus  相对更灵活点,模块间比较解耦,比如告警模块、代理模块等等都可以选择性配置。服务端和客户端都是开箱即用,不需要进行安装。Zabbix则是一套安装把所有东西都弄好,很庞大也很繁杂。

Zabbix 的客户端 agent 可以比较方便的通过脚本来读取机器内数据库日志等文件来做上报。而 Prometheus  的上报客户端则分为不同语言的SDK和不同用途的 exporter 两种,比如如果你要监控机器状态、Mysql性能等,有大量已经成熟的 exporter  来直接开箱使用,通过Http通信来对服务端提供信息上报(server去pull信息);

而如果你想要监控自己的业务状态,那么针对各种语言都有官方或其他人写好的 sdk 供你使用,都比较方便,不需要先把数据存入数据库或日志再供  zabbix-agent 采集。

Zabbix 的客户端更多是只做上报的事情,push 模式。而 Prometheus 则是客户端本地也会存储监控数据,服务端定时来拉取想要的数据。界面来说  zabbix 比较陈旧,而 prometheus 比较新且非常简洁,简洁到只能算一个测试和配置平台。要想获得良好的监控体验,搭配 Grafana  还是二者的必走之路。

2、安装 Prometheus

Prometheus 有很多种安装方式,可以在官网看到,这里只介绍下载安装包解压的方式,因为 Prometheus  是“开箱即用”的,也就是说解压安装包后就可以直接使用了,不需要再执行安装程序,很方便。

可以去 Prometheus 的官网下载页面获取最新版本的信息,比如现在的最新版本是2.7.2,那就下载相应系统的安装包,然后解压

$ wget https://GitHub.com/prometheus/prometheus/releases/download/v2.7.2/prometheus-2.7.2.linux-amd64.tar.gz $ tar xvfz prometheus-2.7.2.linux-amd64.tar.gz

解压后当前目录就会出现一个相应的文件夹,进入该文件夹,然后就可以直接运行Prometheus server了!

$ cd prometheus-2.7.2.linux-amd64 // 查看版本 $ ./prometheus --version // 运行server $ ./prometheus --config.file=prometheus.yml

命令中的 prometheus.yml 文件其实就是配置文件,也在当前目录下,在其中可以配置一些东西。

3、配置 Prometheus

上文说了,prometheus.yml 是配置文件,打开可以看到不多的几十行文字,类似下面:

$ cat prometheus.yml # my global config global:   scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.   evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.   # scrape_timeout is set to the global default (10s).  # Alertmanager configuration alerting:   alertmanagers:   - static_configs:     - targets:       # - alertmanager:9093  # Load rules once and periodically evaluate them according to the global 'evaluation_interval'. rule_files:   # - "first_rules.yml"   # - "second_rules.yml"  # A scrape configuration containing exactly one endpoint to scrape: # Here it's Prometheus itself. scrape_configs:   # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.   - job_name: 'prometheus'      # metrics_path defaults to '/metrics'     # scheme defaults to 'http'.      static_configs:     - targets: ['localhost:9090']

其大致分为四部分:

  • global:全局配置,其中 scrape_interval 表示抓取一次数据的间隔时间,evaluation_interval  表示进行告警规则检测的间隔时间;

  • alerting:告警管理器(Alertmanager)的配置,目前还没有安装Alertmanager;

  • rule_files:告警规则有哪些;

  • scrape_configs:抓取监控信息的目标。一个 job_name 就是一个目标,其 targets 就是采集信息的 IP 和端口。这里默认监控了  Prometheus 自己,可以通过修改这里来修改 Prometheus 的监控端口。

Prometheus 的每个 exporter 都会是一个目标,它们可以上报不同的监控信息,比如机器状态,或者 mysql 性能等等,不同语言 sdk  也会是一个目标,它们会上报你自定义的业务监控信息。

4、Prometheus 界面

运行后,在浏览器访问[机器IP:端口]就可以查看 Prometheus 的界面了,这里的机器IP是你运行 Prometheus  的机器,端口是上面配置文件中配置的监控自己的端口。打开后界面如下:

Prometheus中怎么实现集群监控

如果访问不了,看看是不是端口没有打开或者允许外网访问。

界面非常简单(所以我们还需要Grafana),上面标签栏中,Alerts是告警管理器,暂时还没安装。Graph是查看监控项的图表,也是访问后的默认页面,Status中可以查看一些配置、监控目标、告警规则等。

在 Graph 页面,由于我们默认已经监控了 Prometheus  自己,所以已经可以查看一些监控图表,比如在输入框输入“promhttp_metric_handler_requests_total”,执行Execute,下面的小标签中切换到Graph就能看到“/metrics”访问次数的折线图。

5、添加机器状态监控

我们尝试添加第一个监控exporter&mdash;&mdash;监控当前机器自身的状态,包括硬盘、CPU、流量等。因为Prometheus已经有了很多现成的常用exporter,所以我们直接用其中的node_exporter。注意了,这里名字虽然叫node_exporter,但跟nodejs没有任何关系,在Prometheus看来,一台机器或者说一个节点就是一个node,所以该exporter是在上报当前节点的状态。node_exporter本身也是一个http服务,可以供  prometheus server 调用(pull)来获取监控的信息,安装方法同样是下载安装包后解压直接运行:

// 下载最新版本,可以在github的release中对最新版本右键获取下载链接 $ wget https://github.com/prometheus/node_exporter/releases/download/v0.17.0/node_exporter-0.17.0.linux-amd64.tar.gz // 解压 $ tar xvfz node_exporter-0.17.0.linux-amd64.tar.gz // 进入解压出的目录 $ cd node_exporter-0.17.0.linux-amd64 // 运行监控采集服务 $ ./node_exporter

运行后可以看到在监听9100端口。这样就可以采集了,现在先访问试试能不能有没有成功运行:这里也可以看出其实每个exporter本身都是一个http服务,server端会定时来访问获取监控信息。访问成功的话,我们去prometheus的配置文件(prometheus.yml)中,加上这个target:

scrape_configs:   - job_name: 'prometheus'     static_configs:       - targets: ['localhost:9090']   - job_name: 'server'     static_configs:       - targets: ['localhost:9100']

可以看到,就是在 scrape_configs 模块中加一个job,命好名,配置好监听的IP和端口即可,然后重新运行 prometheus,在标签栏的  Status &rarr; Targets 中可以看到多了一个:

Prometheus中怎么实现集群监控

如果新加的 target 的 status 是“UP”的话,就说明监听成功了。

此时去Graph中,输入框输入node可以发现有很多 node 开头的监控项了,都是和机器状态有关的,可以自己执行看一看。

安装 Grafana

因为 Prometheus 的界面看起来非常简单,所以我们还需要 Grafana 这个非常强大也是最常用的监控展示框架。

我们还是用下载二进制包的方式来进行安装,这种方式不需要你当前的linux用户拥有sudo权限,也不需要你知道 root 密码。如果你有这些权限,那就使用  yum 等其他直接的安装方式吧,安装说明见 Grafana 的官方安装页面

我们直接下载并解压:

$wget [https://dl.grafana.com/oss/release/grafana-6.0.0.linux-amd64.tar.gz](https://dl.grafana.com/oss/release/grafana-6.0.0.linux-amd64.tar.gz) $ tar -zxvf grafana-6.0.0.linux-amd64.tar.gz 这个页面给出的是最新版本的安装命令,右上角可以选择切换其他版本的安装命令。

解压后会出现 grafana-6.0.0 目录,进入该目录,然后就可以运行 Grafana 了:

$ cd grafana-6.0.0 // 启动Grafana。$ ./bin/grafana-server WEB

通过log信息可以看到Grafana默认运行在3000端口,这个也可以通过配置文件进行修改:创建名为 custom.ini 的配置文件,添加到 conf  文件夹,复制 conf/defaults.ini 中定义的所有设置,然后修改自己想要修改的。

在 Grafana 展示监控信息

安装并启动Grafana后,浏览器输入 IP:3000  来访问Grafana,管理员账号密码默认是admin/admin。首次登陆会让你修改管理员密码,然后就可以登录查看了。

在界面左边是一竖排选项,选择设置图标中的Data Source,添加Prometheus的数据源,URL 就填上面你给 Prometheus Server  设置的ip+端口号就行了,如果没改过且在本机运行的话,那就是 localhost:9090。

此时可以添加 dashboard,也就是监控面板了,在刚配好的 Prometheus Data Source的设置中有一个标签就是  dashboard,我们导入 Prometheus 2.0 Stats  这个面板,就能看到我们Prometheus的一些基本监控情况了,这其实就是导入了一个别人写好的面板配置,并且连接我们自己 Prometheus  的监控数据做展示。还记得我们上面还运行了一个 node exporter 吧,现在我们展现一下这个监控信息,左边竖排点击加号图标中的  Import,来导入其他别人写好的面板。在Grafana的官方面板页面其实可以看到很多别人配置好的面板,我们找到自己想要的面板,比如这个node  exporter 的:

Prometheus中怎么实现集群监控

复制右边那个面板ID,然后在 Import 界面输入ID,Load  后配置好数据源为我们的Prometheus,就可以出现我们自己机器的状态监控面板了,很炫酷吧。

这个面板需要安装一个饼图的插件(页面上有说明),安装 Grafana 插件的方法为:

// 进入Grafana/bin目录 ./grafana-cli plugins install [插件名] // 安装成功后重启Grafana

看完上述内容,你们掌握Prometheus中怎么实现集群监控的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注编程网JavaScript频道,感谢各位的阅读!

--结束END--

本文标题: Prometheus中怎么实现集群监控

本文链接: https://www.lsjlt.com/news/77452.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Prometheus中怎么实现集群监控
    Prometheus中怎么实现集群监控,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。 1、Prometheus 对比 Zabbix和...
    99+
    2022-10-19
  • 怎么在CentOS7系统中搭建Prometheus 监控
    今天就跟大家聊聊有关怎么在CentOS7系统中搭建Prometheus 监控,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。 简介prometheus可以拆分成多个节点进行指...
    99+
    2023-06-07
  • 怎么在SpringBoot中利用Prometheus和Grafana实现实现应用监控和报警功能
    这篇文章将为大家详细讲解有关怎么在SpringBoot中利用Prometheus和Grafana实现实现应用监控和报警功能,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。SpringBoot的...
    99+
    2023-06-06
  • MongoDB中怎么实现集群
    本篇文章给大家分享的是有关MongoDB中怎么实现集群,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。基本概念文档(document):文档是M...
    99+
    2022-10-18
  • redis sentinel监控高可用集群实现的配置步骤
    目录一、端口转发二、修改HOST文件三、用第三方代理haproxy四、插曲一、端口转发 如果在一个主机里面,安装了两个redis实例,可以在项目里面配置IP端口,用iptables转...
    99+
    2022-11-13
  • 怎么在Redis集群中监听过期key
    这篇文章将为大家详细讲解有关怎么在Redis集群中监听过期key,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。redis.host1: 10.11...
    99+
    2022-10-18
  • php中怎么实现集群部署
    这篇“php中怎么实现集群部署”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“php中怎么实现集群部署”文章吧。一、什么是集群...
    99+
    2023-07-05
  • SpringCloud怎么实现Zuul集群
    小编给大家分享一下SpringCloud怎么实现Zuul集群,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!一、使用 Nginx+Zuul 实现网关集群互联网公司中网关都是集群 搭建集群: Nginx+Zuul 一主一备,或...
    99+
    2023-06-20
  • ElasticSearch中怎么实现集群分布式
    本篇文章为大家展示了ElasticSearch中怎么实现集群分布式,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。索引(index)“索引” 这个词在 Elastic...
    99+
    2022-10-18
  • MongoDB中怎么实现分片与集群
    这期内容当中小编将会给大家带来有关MongoDB中怎么实现分片与集群,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。一、 mongodb分片与集群拓扑图二、分片与集群的部署...
    99+
    2022-10-18
  • MongoDB中怎么实现分布式集群
    本篇文章给大家分享的是有关 MongoDB中怎么实现分布式集群,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。集群概览mongodb 相关的进程...
    99+
    2022-10-18
  • Facebook中怎么实现Hadoop和AvatarNode集群
    这篇文章给大家介绍Facebook中怎么实现Hadoop和AvatarNode集群,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。Facebook将数据存储在利用Hadoop/Hive搭建的数据仓库上,这个数据仓库拥有4...
    99+
    2023-06-10
  • Nginx中怎么实现状态监控
    这期内容当中小编将会给大家带来有关Nginx中怎么实现状态监控,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。NginxStatus 显示的内容意思如下:active co...
    99+
    2022-10-19
  • Linux中怎么实现流量监控
    这篇文章将为大家详细讲解有关Linux中怎么实现流量监控,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Linux流量监控iftop工具 用处: 用来立即监望网道状况战各ip所应用的频阔 履行...
    99+
    2023-06-16
  • VB.NET中怎么实现网络监控
    这篇文章给大家介绍VB.NET中怎么实现网络监控,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。在窗体上放置一个TreeView控件,改名为tvInfo。再放置一个按钮控件。双击按钮,编写VB.NET网络监控代码。Dim...
    99+
    2023-06-17
  • Hadoop集群同步怎么实现
    本篇内容介绍了“Hadoop集群同步怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、同步方式  选择一个机器,作为时间服务器(这里...
    99+
    2023-06-02
  • Redis7.0部署集群怎么实现
    这篇“Redis7.0部署集群怎么实现”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Redis7.0部署集群怎么实现”文章吧...
    99+
    2023-07-02
  • Node.js进程集群怎么实现
    这篇文章主要介绍了Node.js进程集群怎么实现的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Node.js进程集群怎么实现文章都会有所收获,下面我们一起来看看吧。一、cluster模块Node.js是单线程处...
    99+
    2023-07-02
  • 监控Agent集成Lua引擎怎么实现多维度日志采集
    监控Agent集成Lua引擎怎么实现多维度日志采集,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。在监控系统中,日志处理就是采集服务运行时生成的原始日志,根据用户配置的解析规...
    99+
    2023-06-05
  • 怎么实现Oracle集群自启动
    这篇文章主要讲解了“怎么实现Oracle集群自启动”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么实现Oracle集群自启动”吧!我们先看如下部分:Ora...
    99+
    2022-10-18
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作