iis服务器助手广告广告
返回顶部
首页 > 资讯 > 精选 >Kubernetes监控实践
  • 451
分享到

Kubernetes监控实践

2023-06-04 22:06:36 451人浏览 八月长安
摘要

一、kubernetes介绍Kubernetes(k8s)是一个开源平台,能够有效简化应用管理、应用部署和应用扩展环节的手动操作流程,让用户更加灵活地部署管理云端应用。作为可扩展的容错平台,K8s几乎能够部署在所有基础设施中,与Google

一、kubernetes介绍

Kubernetes(k8s)是一个开源平台,能够有效简化应用管理、应用部署和应用扩展环节的手动操作流程,让用户更加灵活地部署管理云端应用。

作为可扩展的容错平台,K8s几乎能够部署在所有基础设施中,与Google Cloud、MS Azure及AWS等公有云、私有云、混合云、服务器集群、数据中心等完美兼容。Kubernetes最大的亮点在于支持容器自动部署和自动复制。这也是大量云端微服务基础设施部署在K8s上的原因。

二、K8s由来

K8s最初是由Google工程师设计开发的,于2014年上线并开源,目前由来自微软、红帽、IBM及Docker等软件巨头的社区贡献者维护升级。

Google不仅开源了公司整个基础设施在容器中的运行方式,还积极开发linux容器技术,支撑Google所有云服务。K8s是基于云平台15年的生产工作负载运行经验设计出来的,用于处理成千上万个容器。Google每周部署20多亿个容器。在K8s上线前,Google主要通过内部开发平台Borg进行容器部署。Borg是大型内部集群管理系统,运行了无数应用和集群任务,多年的开发经验奠定了K8s技术的基础。

三、K8s工作原理

K8s本质上是分部在不同机器上的容器化应用的协调系统,目的是帮助开发人员通过K8s的可预测性、可扩展性和高可用性管理容器化应用和服务的整个生命周期,通过更高水平的抽象,将多个机器统一成一个机器。这对于大型环境的运行来说至关重要。

K8s不仅能够优化Docker的镜像运行能力和容器管理能力,还能兼容rkt和CoreOS等容器引擎。

Kubernetes监控实践

上方架构图展示了K8s工作原理。图中包含一组Master组件,其中包括很多pod。Pod针对特定应用的“逻辑主机”进行建模。每个Pod均包含一个或多个应用容器、存储资源、唯一的网络IP及容器运行细节。Pod是容器的最小原子单元。理论上,Pod中包含一个或多个高度耦合的应用。理想情况下,每个Pod中包含一个容器。

每个进程包含一个api server、一个scheduler和多个controller。

API server负责暴露K8s API、处理REST操作及后续更新。Scheduler负责将未部署的Pod匹配到合适虚拟机或物理机上。如果没有合适的机器,则Pod将处于未分配状态,直至出现合适的节点。Master运行集群级别的其他功能,通过嵌入式controller完成创建端点、发现节点、复制控制等操作。由于controller设计灵活且可扩展,Kube管理员可自行创建controller。Kube通过API server监控K8s集群的共享状态,并对集群状态进行调整,确保当前状态与理想状态一致。

K8s提供支持容器化应用统一自动化、控制和升级的各项功能,包括企业级容器部署、内置服务发现、自动扩展、持久化存储、高可用、集群互通和资源装箱等。

依赖这些功能,K8s实现了对单体应用、批处理应用及高度分布式微服务应用等不同应用架构的支持。

四、K8s监控实践中的挑战

2014年上线以来,K8s一直在变革容器技术,已经成为快速批量启动应用的关键工具。与此同时,挑战也随之而来,容器编排极其复杂。

K8s虽然已经极大地简化了容器实现和管理过程中从调度、配置到状态自动维护等一系列任务的操作难度,但监控方面依然存在挑战:

  • 相互通信的应用分布在不同的云服务平台上。K8s本质上是一个通用平台,用户可在平台上自由部署应用。企业一般会采用多云端解决方案,不仅能够减少对单一云服务平台的依赖,还能缩短故障停机时间,避免数据丢失。但这种部署方式也给实时数据抓取和应用状态监控带来了挑战。
  • 在动态基础设施上不断迁移应用。由于应用处于频繁迁移状态,因此很难做到所有平台和协议之间的完全可见,这就会隐藏系统的瓶颈问题。很多公司的基础设施上都运行着多个应用,因此这种问题是不可避免的。如果没有稳健的监控系统,用户便无法发现应用的潜在问题。
  • 监控对象数量繁多且极为复杂:K8s由很多组件构成,非常复杂,因此要监控K8s,就必须监控下列所有对象:

    • 集群容量和资源利用情况:(a)node:确保K8s所有节点的状态,监控CPU、内存和硬盘的使用情况;(b)Pod:确保所有已实现Pod状态正常;(c)Container:根据配置的消耗上限监控CPU和内存的消耗情况。 应用:根据请求率、吞吐量、错误率监控集群中应用的性能和可用性。
    • 终端用户体验:监控移动应用和浏览器性能,优化加载时间和可用性,提高客户满意度。
    • 配套基础设施:前文提到,K8s的运行平台也非常重要。
  • 操作细节:K8s的所有核心组件(即kubelet、Kube controller manager和Kube scheduler)都有很多标记。这些标记决定了集群的操作和运行方式,其初始默认值一般较小,适用于规模较小的集群。随着集群规模的扩大,用户需要及时对集群进行调整,并监控K8s的标签和注释等细节。

但监控工具从K8s抓取大量数据时会影响集群性能甚至导致集群故障,因此需要确定监控基线。需要诊断故障时,可适当调高基线值。

调高基线值的同时要部署更多master和node,提高可用性。涉及大规模部署时,可单独部署专门存储K8s数据的集群,这样能够保证在创建监控事件、检索监控数据时,主要实例的性能不受影响。

五、从源头上监控K8s

和很多容器编排平台一样,K8s具备基本的服务器监控工具。用户可对这些工具进行适当调整,以便更好地监控K8s的运行情况。主要工具如下:

  • K8s仪表盘:插件工具,展示每个K8s集群上的资源利用情况,也是实现资源和环境管理与交互的主要工具。
  • 容器探针:容器健康状态诊断工具。
  • Kubelet:每个Node上都运行着Kubelet,监控容器的运行情况。Kubelet也是Master与各个Node通信的渠道。Kubelet能够直接暴露cAdvisor中与容器使用相关的个性化指标数据。
  • cAdvisor:开源的单节点agent,负责监控容器资源使用情况与性能,采集机器上所有容器的内存、网络使用情况、文件系统和CPU等数据。
  • cAdvisor简单易用,但也存在不足:一是仅能监控基础资源利用情况,无法分析应用的实际性能;二是不具备长期存储和趋势分析能力。
  • Kube-state-metrics:轮询Kubernetes API,并将Kubernetes的结构化信息转换为metrics。
  • Metrics server:Metrics server定时从Kubelet的Summary API采集指标数据,并以metric-api的形式暴露出去。

整体监控流程如下:

  • cAdvisor默认安装在所有集群节点上,采集容器和节点的指标数据。
  • Kubelet通过kubelet API将指标数据暴露出去。
  • Metrics判断所有可用节点,请求kubelet API上送容器和节点使用情况数据,然后通过Kubernetes聚合API将指标数据暴露出去。

上述基础性工具虽然不能提供详细的应用监控数据,但能够帮助用户了解底层主机和K8s节点的情况。

一般来说,K8s集群管理员主要关注全局监控,而应用开发人员则主要关注应用层面的监控情况。但两者的共同诉求都是在控制投入成本的前提下尽可能全面地监控系统、采集数据。下周文章中,我们将介绍两个可行的监控方案:prometheus和Sensu。两个方案都能全面提供系统级的监控数据,帮助开发人员跟踪K8s关键组件的性能、定位故障、接收预警。

本篇为译文,原文作者:STEFAN THORPE

译自Monitoring Kubernetes

译文首发于UAVStack智能运维

--结束END--

本文标题: Kubernetes监控实践

本文链接: https://www.lsjlt.com/news/240329.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Kubernetes监控实践
    一、Kubernetes介绍Kubernetes(K8s)是一个开源平台,能够有效简化应用管理、应用部署和应用扩展环节的手动操作流程,让用户更加灵活地部署管理云端应用。作为可扩展的容错平台,K8s几乎能够部署在所有基础设施中,与Google...
    99+
    2023-06-04
  • 怎么用Kubernetes监控
    本篇文章为大家展示了怎么用Kubernetes监控,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。 什么是KubernetesKubernetes 是一个可...
    99+
    2024-04-02
  • 怎么搞定Kubernetes监控
    本篇内容主要讲解“怎么搞定Kubernetes监控”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么搞定Kubernetes监控”吧!如果你位于DevOps前线,Kubernetes正在迅速成为...
    99+
    2023-06-04
  • kubernetes实践之六十:Cabin-Manage Kubernetes
    一:简介Cabin是由bitnami开源的手机管理Kubernetes集群的客户端,目前提供iOS和安卓版本. 源码地址为https://github.com/bitnami-labs/cabin .所有功能跟kubernetes dash...
    99+
    2023-06-04
  • Kubernetes节点之间的ping监控怎么实现
    小编给大家分享一下Kubernetes节点之间的ping监控怎么实现,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!脚本和配置我们解决方案的主要组件是一个脚本,该脚本监视每个节点的.stat...
    99+
    2024-04-02
  • 【云原生】-Zabbix6监控MySQL最佳实践
    📢📢📢📣📣📣 哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10年DBA工作经验 一位上进心十足的【大数据领域博主】!😜😜😜 中国DBA联盟(ACDU)成员,目前从事DBA及程序编程...
    99+
    2023-09-07
    云原生 zabbix mysql
  • 使用 Loki 实现 Kubernetes 容器日志监控的方法
    目录一、基本介绍1.Loki 架构2.Loki 工作原理二、使用 Loki 实现容器日志监控1.安装 Loki2.安装 Promtail3.安装 Grafana4.验证一、基本介绍 ...
    99+
    2024-04-02
  • Agentless监控实践中的预警指标采集
    很多公司已经开发了监控解决方案,解决了指标收集、展示、预警发送等一系列问题。本文介绍的监控解决方案由高性能时序数据库InfluxDB、时序分析监控工具Grafana及Agentless自动化工具Ansible构成:Ansible负责不间断抓...
    99+
    2023-06-04
  • 操作系统性能监控的最佳实践
    监控操作系统的性能对于保持系统的稳定性和提高效率至关重要。本文将介绍最佳实践,帮助优化资源利用、识别瓶颈并提高应用程序性能。 最佳实践: 1. 系统资源监控 利用内置工具(如top、ps、vmstat)或第三方工具(如Nagios、Z...
    99+
    2024-03-02
    操作系统监控、性能优化、资源利用、工具
  • kubernetes实践之五十八:CronJob
    一: 简介CronJob即定时任务,就类似于Linux系统的crontab,在指定的时间周期运行指定的任务。1.在给定时间点只运行一次2.周期性地在给定时间点运行二:CronJob定义1.spec.schedule指定任务运行周期,格式同C...
    99+
    2023-06-04
  • kubernetes实践之六十四:CoreDNS
    一:简介1.Kubernetes包括用于服务发现的DNS服务器Kube-DNS。 该DNS服务器利用SkyDNS的库来为Kubernetes pod和服务提供DNS请求。SkyDNS2的作者,Miek Gieben,创建了一个新的DNS服务...
    99+
    2023-06-04
  • 如何通过Splunk监控Kubernetes运行性能
    这篇文章主要介绍如何通过Splunk监控Kubernetes运行性能,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!Splunk是业界领先的机器数据收集、处理、分析和管理平台。机器数据是指那些能够为企业业务发展提供动力...
    99+
    2023-06-27
  • kubernetes集群如何搭建Zabbix监控平台
    本篇内容介绍了“kubernetes集群如何搭建Zabbix监控平台”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、zabbix介绍1.z...
    99+
    2023-07-02
  • kubernetes实践之四十二:StatefulSet
    一: 前言1.使用StatefulSet的场景a.稳定、唯一的网络标识b.稳定、持久的存储c.按照顺序、优雅的部署和扩容d.按照顺序、优雅的删除和终止e.按照顺序、自动滚动更新2.StatefulSet的限制a.在Kubernetes 1....
    99+
    2023-06-04
  • kubeadm安装Kubernetes实践过程
    kubeadm安装Kubernetes实践过程,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。kubeadm安装Kubernetes这里以1.9.3为例:x版本安装参考:http...
    99+
    2023-06-19
  • kubernetes实践之二十六:GlusterFS
    一:前言GlusterFS是Scale-Out存储解决方案Gluster的核心,它是一个开源的分布式文件系统,具有强大的横向扩展能力,通过扩展能够支持数PB存储容量和处理数千客户端。GlusterFS借助TCP/IP或InfiniBand ...
    99+
    2023-06-04
  • 打造立体化监控体系的最佳实践
    作者:云栖社区原文:https://www.aliyun.com/aliware/news/monitoringsolution摘要: 本文将从分布式系统调用的复杂现状说起,具体分析调用链的三大使用场景,以及调用链的最佳实践,简述...
    99+
    2023-06-05
  • Kubernetes中怎么监控和调试Pods的性能
    在Kubernetes中,可以使用各种工具来监控和调试Pods的性能。以下是一些常用的方法: 使用Kubernetes内置的ku...
    99+
    2024-04-02
  • JMX 实践:使用 Java 监控和管理的真实案例
    Java 管理扩展 (JMX) 是一种强大的框架,用于监控和管理 Java 应用程序。本文提供了实际案例,展示了如何使用 JMX 监视和管理各种性能指标,包括内存使用、线程使用和应用程序状态。 简介 JMX 是一种用于监测和管理 Jav...
    99+
    2024-02-19
    JMX Java 监控 管理 MBean 性能
  • golang调试bug及性能监控方式实践总结
    目录如何分析程序运行所需时间及cpu的使用率?使用shell内置的time指令使用/usr/bin/time指令GODEBUG与gctrace格式及其含义如何分析程序运行所需时间及c...
    99+
    2023-05-19
    golang调试bug性能监控 golang bug调试
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作