广告
返回顶部
首页 > 资讯 > 前端开发 > node.js >Kubernetes节点之间的ping监控怎么实现
  • 298
分享到

Kubernetes节点之间的ping监控怎么实现

2024-04-02 19:04:59 298人浏览 安东尼
摘要

小编给大家分享一下kubernetes节点之间的ping监控怎么实现,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!脚本和配置我们解决方案的主要组件是一个脚本,该脚本监视每个节点的.stat

小编给大家分享一下kubernetes节点之间的ping监控怎么实现,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!

脚本和配置

我们解决方案的主要组件是一个脚本,该脚本监视每个节点的.status.addresses值。如果某个节点的该值已更改(例如添加了新节点),则我们的脚本使用Helm  value方式将节点列表以ConfigMap的形式传递给Helm图表:

apiVersion: v1 kind: ConfigMap metadata: name: ping-exporter-config namespace: d8-system data: nodes.JSON: > {{ .Values.pingExporter.targets | tojson }}    .Values.pingExporter.targets类似以下:  "cluster_targets":[{"ipAddress":"192.168.191.11","name":"kube-a-3"},{"ipAddress":"192.168.191.12","name":"kube-a-2"},{"ipAddress":"192.168.191.22","name":"kube-a-1"},{"ipAddress":"192.168.191.23","name":"kube-db-1"},{"ipAddress":"192.168.191.9","name":"kube-db-2"},{"ipAddress":"51.75.130.47","name":"kube-a-4"}],"external_targets":[{"host":"8.8.8.8","name":"Google-dns"},{"host":"youtube.com"}]}

下面是python脚本:

  1. #!/usr/bin/env python3 

  2.  

  3. import subprocess 

  4. import prometheus_client 

  5. import re 

  6. import statistics 

  7. import os 

  8. import json 

  9. import glob 

  10. import better_exchook 

  11. import datetime 

  12.  

  13. better_exchook.install() 

  14.  

  15. FPING_CMDLINE = "/usr/sbin/fping -p 1000 -C 30 -B 1 -q -r 1".split(" ") 

  16. FPING_REGEX = re.compile(r"^(\S*)\s*: (.*)$", re.MULTILINE) 

  17. CONFIG_PATH = "/config/targets.json" 

  18.  

  19. reGIStry = prometheus_client.CollectorRegistry() 

  20.  

  21. prometheus_exceptions_counter = \ 

  22. prometheus_client.Counter('kube_node_ping_exceptions', 'Total number of exceptions', [], registry=registry) 

  23.  

  24. prom_metrics_cluster = {"sent": prometheus_client.Counter('kube_node_ping_packets_sent_total', 

  25.                                               'ICMP packets sent', 

  26.                                               ['destination_node', 'destination_node_ip_address'], 

  27.                                               registry=registry), 

  28.             "received": prometheus_client.Counter('kube_node_ping_packets_received_total', 

  29.                                                   'ICMP packets received', 

  30.                                                  ['destination_node', 'destination_node_ip_address'], 

  31.                                                  registry=registry), 

  32.             "rtt": prometheus_client.Counter('kube_node_ping_rtt_milliseconds_total', 

  33.                                              'round-trip time', 

  34.                                             ['destination_node', 'destination_node_ip_address'], 

  35.                                             registry=registry), 

  36.             "min": prometheus_client.Gauge('kube_node_ping_rtt_min', 'minimum round-trip time', 

  37.                                            ['destination_node', 'destination_node_ip_address'], 

  38.                                            registry=registry), 

  39.             "max": prometheus_client.Gauge('kube_node_ping_rtt_max', 'maximum round-trip time', 

  40.                                            ['destination_node', 'destination_node_ip_address'], 

  41.                                            registry=registry), 

  42.             "mdev": prometheus_client.Gauge('kube_node_ping_rtt_mdev', 

  43.                                             'mean deviation of round-trip times', 

  44.                                             ['destination_node', 'destination_node_ip_address'], 

  45.                                             registry=registry)} 

  46.  

  47.  

  48. prom_metrics_external = {"sent": prometheus_client.Counter('external_ping_packets_sent_total', 

  49.                                               'ICMP packets sent', 

  50.                                               ['destination_name', 'destination_host'], 

  51.                                               registry=registry), 

  52.             "received": prometheus_client.Counter('external_ping_packets_received_total', 

  53.                                                   'ICMP packets received', 

  54.                                                  ['destination_name', 'destination_host'], 

  55.                                                  registry=registry), 

  56.             "rtt": prometheus_client.Counter('external_ping_rtt_milliseconds_total', 

  57.                                              'round-trip time', 

  58.                                             ['destination_name', 'destination_host'], 

  59.                                             registry=registry), 

  60.             "min": prometheus_client.Gauge('external_ping_rtt_min', 'minimum round-trip time', 

  61.                                            ['destination_name', 'destination_host'], 

  62.                                            registry=registry), 

  63.             "max": prometheus_client.Gauge('external_ping_rtt_max', 'maximum round-trip time', 

  64.                                            ['destination_name', 'destination_host'], 

  65.                                            registry=registry), 

  66.             "mdev": prometheus_client.Gauge('external_ping_rtt_mdev', 

  67.                                             'mean deviation of round-trip times', 

  68.                                             ['destination_name', 'destination_host'], 

  69.                                             registry=registry)} 

  70.  

  71. def validate_envs(): 

  72. envs = {"MY_NODE_NAME": os.getenv("MY_NODE_NAME"), "PROMETHEUS_TEXTFILE_DIR": os.getenv("PROMETHEUS_TEXTFILE_DIR"), 

  73.         "PROMETHEUS_TEXTFILE_PREFIX": os.getenv("PROMETHEUS_TEXTFILE_PREFIX")} 

  74.  

  75. for k, v in envs.items(): 

  76.     if not v: 

  77.         raise ValueError("{} environment variable is empty".fORMat(k)) 

  78.  

  79. return envs 

  80.  

  81.  

  82. @prometheus_exceptions_counter.count_exceptions() 

  83. def compute_results(results): 

  84. computed = {} 

  85.  

  86. matches = FPING_REGEX.finditer(results) 

  87. for match in matches: 

  88.     host = match.group(1) 

  89.     ping_results = match.group(2) 

  90.     if "duplicate" in ping_results: 

  91.         continue 

  92.     splitted = ping_results.split(" ") 

  93.     if len(splitted) != 30: 

  94.         raise ValueError("ping returned wrong number of results: \"{}\"".format(splitted)) 

  95.  

  96.     positive_results = [float(x) for x in splitted if x != "-"] 

  97.     if len(positive_results) > 0: 

  98.         computed[host] = {"sent": 30, "received": len(positive_results), 

  99.                         "rtt": sum(positive_results), 

  100.                         "max": max(positive_results), "min": min(positive_results), 

  101.                         "mdev": statistics.pstdev(positive_results)} 

  102.     else: 

  103.         computed[host] = {"sent": 30, "received": len(positive_results), "rtt": 0, 

  104.                         "max": 0, "min": 0, "mdev": 0} 

  105. if not len(computed): 

  106.     raise ValueError("regex match\"{}\" found nothing in fping output \"{}\"".format(FPING_REGEX, results)) 

  107. return computed 

  108.  

  109.  

  110. @prometheus_exceptions_counter.count_exceptions() 

  111. def call_fping(ips): 

  112. cmdline = FPING_CMDLINE + ips 

  113. process = subprocess.run(cmdline, stdout=subprocess.PIPE, 

  114.                          stderr=subprocess.STDOUT, universal_newlines=True) 

  115. if process.returncode == 3: 

  116.     raise ValueError("invalid arguments: {}".format(cmdline)) 

  117. if process.returncode == 4: 

  118.     raise OSError("fping reported syscall error: {}".format(process.stderr)) 

  119.  

  120. return process.stdout 

  121.  

  122.  

  123. envs = validate_envs() 

  124.  

  125. files = glob.glob(envs["PROMETHEUS_TEXTFILE_DIR"] + "*") 

  126. for f in files: 

  127. os.remove(f) 

  128.  

  129. labeled_prom_metrics = {"cluster_targets": [], "external_targets": []} 

  130.  

  131. while True: 

  132. with open(CONFIG_PATH, "r") as f: 

  133.     config = json.loads(f.read()) 

  134.     config["external_targets"] = [] if config["external_targets"] is None else config["external_targets"] 

  135.     for target in config["external_targets"]: 

  136.         target["name"] = target["host"] if "name" not in target.keys() else target["name"] 

  137.  

  138. if labeled_prom_metrics["cluster_targets"]: 

  139.     for metric in labeled_prom_metrics["cluster_targets"]: 

  140.         if (metric["node_name"], metric["ip"]) not in [(node["name"], node["ipAddress"]) for node in config['cluster_targets']]: 

  141.             for k, v in prom_metrics_cluster.items(): 

  142.                 v.remove(metric["node_name"], metric["ip"]) 

  143.  

  144. if labeled_prom_metrics["external_targets"]: 

  145.     for metric in labeled_prom_metrics["external_targets"]: 

  146.         if (metric["target_name"], metric["host"]) not in [(target["name"], target["host"]) for target in config['external_targets']]: 

  147.             for k, v in prom_metrics_external.items(): 

  148.                 v.remove(metric["target_name"], metric["host"]) 

  149.  

  150.  

  151. labeled_prom_metrics = {"cluster_targets": [], "external_targets": []} 

  152.  

  153. for node in config["cluster_targets"]: 

  154.     metrics = {"node_name": node["name"], "ip": node["ipAddress"], "prom_metrics": {}} 

  155.  

  156.     for k, v in prom_metrics_cluster.items(): 

  157.         metrics["prom_metrics"][k] = v.labels(node["name"], node["ipAddress"]) 

  158.  

  159.     labeled_prom_metrics["cluster_targets"].append(metrics) 

  160.  

  161. for target in config["external_targets"]: 

  162.     metrics = {"target_name": target["name"], "host": target["host"], "prom_metrics": {}} 

  163.  

  164.     for k, v in prom_metrics_external.items(): 

  165.         metrics["prom_metrics"][k] = v.labels(target["name"], target["host"]) 

  166.  

  167.     labeled_prom_metrics["external_targets"].append(metrics) 

  168.  

  169. out = call_fping([prom_metric["ip"]   for prom_metric in labeled_prom_metrics["cluster_targets"]] + \ 

  170.                  [prom_metric["host"] for prom_metric in labeled_prom_metrics["external_targets"]]) 

  171. computed = compute_results(out) 

  172.  

  173. for dimension in labeled_prom_metrics["cluster_targets"]: 

  174.     result = computed[dimension["ip"]] 

  175.     dimension["prom_metrics"]["sent"].inc(computed[dimension["ip"]]["sent"]) 

  176.     dimension["prom_metrics"]["received"].inc(computed[dimension["ip"]]["received"]) 

  177.     dimension["prom_metrics"]["rtt"].inc(computed[dimension["ip"]]["rtt"]) 

  178.     dimension["prom_metrics"]["min"].set(computed[dimension["ip"]]["min"]) 

  179.     dimension["prom_metrics"]["max"].set(computed[dimension["ip"]]["max"]) 

  180.     dimension["prom_metrics"]["mdev"].set(computed[dimension["ip"]]["mdev"]) 

  181.  

  182. for dimension in labeled_prom_metrics["external_targets"]: 

  183.     result = computed[dimension["host"]] 

  184.     dimension["prom_metrics"]["sent"].inc(computed[dimension["host"]]["sent"]) 

  185.     dimension["prom_metrics"]["received"].inc(computed[dimension["host"]]["received"]) 

  186.     dimension["prom_metrics"]["rtt"].inc(computed[dimension["host"]]["rtt"]) 

  187.     dimension["prom_metrics"]["min"].set(computed[dimension["host"]]["min"]) 

  188.     dimension["prom_metrics"]["max"].set(computed[dimension["host"]]["max"]) 

  189.     dimension["prom_metrics"]["mdev"].set(computed[dimension["host"]]["mdev"]) 

  190.  

  191. prometheus_client.write_to_textfile( 

  192.    

    envs["PROMETHEUS_TEXTFILE_DIR"] + envs["PROMETHEUS_TEXTFILE_PREFIX"] + envs["MY_NODE_NAME"] + ".prom", registry)

该脚本在每个Kubernetes节点上运行,并且每秒两次发送ICMP数据包到Kubernetes集群的所有实例。收集的结果会存储在文本文件中。

该脚本会包含在Docker镜像中:

FROM Python:3.6-alpine3.8 COPY rootfs / WORKDIR /app RUN pip3 install --upgrade pip && pip3 install -r requirements.txt && apk add --no-cache fping ENTRYPOINT ["python3", "/app/ping-exporter.py"]

另外,我们还创建了一个ServiceAccount和一个具有唯一权限的对应角色用于获取节点列表(这样我们就可以知道它们的IP地址):

apiVersion: v1 kind: ServiceAccount metadata: name: ping-exporter namespace: d8-system --- kind: ClusterRole apiVersion: rbac.authorization.k8s.io/v1 metadata: name: d8-system:ping-exporter rules: - apiGroups: [""] resources: ["nodes"] verbs: ["list"] --- kind: ClusterRoleBinding apiVersion: rbac.authorization.k8s.io/v1 metadata: name: d8-system:kube-ping-exporter subjects: - kind: ServiceAccount name: ping-exporter namespace: d8-system roleRef: apiGroup: rbac.authorization.k8s.io kind: ClusterRole name: d8-system:ping-exporter

最后,我们需要DaemonSet来运行在集群中的所有实例:

apiVersion: apps/v1 kind: DaemonSet metadata: name: ping-exporter namespace: d8-system spec: updateStrategy: type: RollingUpdate selector: matchLabels:   name: ping-exporter template: metadata:   labels:     name: ping-exporter spec:   terminationGracePeriodSeconds: 0   tolerations:   - operator: "Exists"   hostNetwork: true   serviceAccountName: ping-exporter   priorityClassName: cluster-low   containers:   - image: private-registry.flant.com/ping-exporter/ping-exporter:v1     name: ping-exporter     env:       - name: MY_NODE_NAME         valueFrom:           fieldRef:             fieldPath: spec.nodeName       - name: PROMETHEUS_TEXTFILE_DIR         value: /node-exporter-textfile/       - name: PROMETHEUS_TEXTFILE_PREFIX         value: ping-exporter_     volumeMounts:       - name: textfile         mountPath: /node-exporter-textfile       - name: config         mountPath: /config   volumes:     - name: textfile       hostPath:         path: /var/run/node-exporter-textfile     - name: config       configMap:         name: ping-exporter-config   imagePullSecrets:   - name: private-registry

该解决方案的最后操作细节是:

  • Python脚本执行时,其结果(即存储在主机上/var/run/node-exporter-textfile目录中的文本文件)将传递到DaemonSet类型的node-exporter。

  • node-exporter使用--collector.textfile.directory  /host/textfile参数启动,这里的/host/textfile是hostPath目录/var/run/node-exporter-textfile。(你可以点击这里了解关于node-exporter中文本文件收集器的更多信息。)

  • 最后node-exporter读取这些文件,然后Prometheus从node-exporter实例上收集所有数据。

那么结果如何?

现在该来享受期待已久的结果了。指标创建之后,我们可以使用它们,当然也可以对其进行可视化。以下可以看到它们是怎样的。

首先,有一个通用选择器可让我们在其中选择节点以检查其“源”和“目标”连接。你可以获得一个汇总表,用于在Grafana仪表板中指定的时间段内ping选定节点的结果:

Kubernetes节点之间的ping监控怎么实现

以下是包含有关选定节点的组合统计信息的图形:

Kubernetes节点之间的ping监控怎么实现

另外,我们有一个记录列表,其中每个记录都链接到在“源”节点中选择的每个特定节点的图:

Kubernetes节点之间的ping监控怎么实现

如果将记录展开,你将看到从当前节点到目标节点中已选择的所有其他节点的详细ping统计信息:

Kubernetes节点之间的ping监控怎么实现

下面是相关的图形:

Kubernetes节点之间的ping监控怎么实现

节点之间的ping出现问题的图看起来如何?

Kubernetes节点之间的ping监控怎么实现

如果你在现实生活中观察到类似情况,那就该进行故障排查了!

最后,这是我们对外部主机执行ping操作的可视化效果:

Kubernetes节点之间的ping监控怎么实现

我们可以检查所有节点的总体视图,也可以仅检查任何特定节点的图形:

Kubernetes节点之间的ping监控怎么实现

看完了这篇文章,相信你对“Kubernetes节点之间的ping监控怎么实现”有了一定的了解,如果想了解更多相关知识,欢迎关注编程网node.js频道,感谢各位的阅读!

--结束END--

本文标题: Kubernetes节点之间的ping监控怎么实现

本文链接: https://www.lsjlt.com/news/84903.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Kubernetes节点之间的ping监控怎么实现
    小编给大家分享一下Kubernetes节点之间的ping监控怎么实现,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!脚本和配置我们解决方案的主要组件是一个脚本,该脚本监视每个节点的.stat...
    99+
    2022-10-19
  • Python虚拟机字节码之控制流怎么实现
    本篇内容介绍了“Python虚拟机字节码之控制流怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!控制流实现控制流这部分代码主要涉及下面...
    99+
    2023-07-06
  • Python怎么实现多线程的事件监控
    这篇文章主要介绍“Python怎么实现多线程的事件监控”,在日常操作中,相信很多人在Python怎么实现多线程的事件监控问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python怎么实现多线程的事件监控”的疑...
    99+
    2023-06-15
  • java递归查找树的子节点怎么实现
    在Java中,使用递归实现查找树的子节点可以通过以下步骤完成: 定义树节点类,包含节点值和左右子节点引用。 class Tree...
    99+
    2023-10-25
    java
  • 怎么实现spark的官网原生监控整理
    这篇文章给大家介绍怎么实现spark的官网原生监控整理,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。一.官网解析官网位置截图Monitoring2.解释对于默认的webui 你访问完就不可以在看到了这样你不可...
    99+
    2023-06-02
  • HTML怎么实现websocket的模拟日志监控界面
    本篇内容介绍了“HTML怎么实现websocket的模拟日志监控界面”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学...
    99+
    2022-10-19
  • 怎么用shell脚本实现LINUX下的流量监控
    本篇内容主要讲解“怎么用shell脚本实现LINUX下的流量监控”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用shell脚本实现LINUX下的流量监控”吧!一、脚本源码# vi /etc/...
    99+
    2023-06-09
  • Vue组件之间的数据共享怎么实现
    本篇内容介绍了“Vue组件之间的数据共享怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、在项目开发中,组件之间的最常见的关系分为如...
    99+
    2023-06-21
  • 怎么实现Docker容器之间的数据传输
    小编给大家分享一下怎么实现Docker容器之间的数据传输,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!从容器中将文件拷贝到宿主机上。在宿主机你想要接收文件的地方,运行下面的指令docker cp 容器i...
    99+
    2023-06-29
  • java中VO和DTO之间的转换怎么实现
    今天小编给大家分享一下java中VO和DTO之间的转换怎么实现的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。一、背景领域模型...
    99+
    2023-06-30
  • windows和Linux之间的文件共享怎么实现
    本篇内容主要讲解“windows和Linux之间的文件共享怎么实现”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“windows和Linux之间的文件共享怎么实现”吧!一、接禁Guest1.右击&...
    99+
    2023-07-04
  • 怎么用css实现监控网络连接状态的页面
    这篇文章主要介绍怎么用css实现监控网络连接状态的页面,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!   代码解读   navigator.onLine属性用于获取在线状态,再配...
    99+
    2022-10-19
  • 怎么在Android中实现两个Fragment之间的跳转
    这篇文章主要介绍了怎么在Android中实现两个Fragment之间的跳转,编程网小编觉得不错,现在分享给大家,也给大家做个参考,一起跟随编程网小编来看看吧!Android是什么Android是一种基于Linux内核的自由及开放源代码的操作...
    99+
    2023-05-30
    android fragment
  • 使用Java怎么实现两个大数之间的运算
    这期内容当中小编将会给大家带来有关使用Java怎么实现两个大数之间的运算,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。大数相减import java.util.Scanner;public&nb...
    99+
    2023-05-30
    java
  • php怎么实现不同域名之间的数据共享
    本篇内容主要讲解“php怎么实现不同域名之间的数据共享”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“php怎么实现不同域名之间的数据共享”吧!一、前端跨域在当前的Web开发环境中,“跨域”是一个...
    99+
    2023-07-05
  • QT怎么实现二、八、十六进制之间的转换
    这篇文章主要讲解了“QT怎么实现二、八、十六进制之间的转换”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“QT怎么实现二、八、十六进制之间的转换”吧!主要使用QT中的三个方法。第一个是QStr...
    99+
    2023-06-30
  • Android应用中怎么实现Activity之间的数据传递
    本篇文章为大家展示了Android应用中怎么实现Activity之间的数据传递,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。MainActivitypublic class MainActivity...
    99+
    2023-05-31
    android roi activity
  • 怎么利用Shell脚本实现邮件监控Linux系统的内存
    这篇文章给大家介绍怎么利用Shell脚本实现邮件监控Linux系统的内存,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。一、安装Linux下面的一个邮件客户端Msmtp软件(类似于一个Foxmail的工具)**1、下载安...
    99+
    2023-06-28
  • python监控日志中的报错并进行邮件报警怎么实现
    今天小编给大家分享一下python监控日志中的报错并进行邮件报警怎么实现的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。实现思...
    99+
    2023-07-02
  • 怎么使用Golang哈希算法实现配置文件的监控功能
    这篇文章主要介绍“怎么使用Golang哈希算法实现配置文件的监控功能”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“怎么使用Golang哈希算法实现配置文件的监控功能”文章能帮助大家解决问题。SHA(...
    99+
    2023-07-05
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作