iis服务器助手广告广告
返回顶部
首页 > 资讯 > 操作系统 >怎么在Linux系统上安装slurm来监控网络带宽和控制节点
  • 201
分享到

怎么在Linux系统上安装slurm来监控网络带宽和控制节点

2023-06-12 23:06:50 201人浏览 薄情痞子
摘要

这篇文章主要讲解了“怎么在linux系统上安装slurm来监控网络带宽和控制节点”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么在Linux系统上安装slurm来监控网络带宽和控制节点”吧

这篇文章主要讲解了“怎么在linux系统上安装slurm来监控网络带宽和控制节点”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么在Linux系统上安装slurm来监控网络带宽和控制节点”吧!

SLURM 是一个类似 Sun Grid Engine (SGE) 的开源分布式资源管理软件,用于超级计算机和大型计算节点集群,可高度伸缩和容错。SUN 被卖给 oracle 后,好用的 SGE 变成 Oracle Grid Engine 并且从 6.2u6 版本开始成为商业软件了(可以免费使用90天),所以我们不得不另寻其他的开源替代方案,SLURM 是上次在德班高性能会议的时候一位陌生人介绍的,听上去不错。
SLURM 通过一对冗余集群控制节点(冗余是可选的)来管理集群计算节点,是由一个名为 slurmctld 的管理守护程序实现的,slurmctld 提供了对计算资源的监视、分配和管理,并将进入的作业序列映射和分发到各个计算节点上。每个计算节点也有一个守护程序 slurmd,slurmd 管理在其上运行的节点,监视节点上运行的任务、接受来自控制节点的请求和工作、将工作映射到节点内部等等。图示如下:
怎么在Linux系统上安装slurm来监控网络带宽和控制节点

监控带宽

代码如下:


$ apt-get install slurm


它会用字符来显示文本图形。
例如:

代码如下:


$ slurm -i <interface>
$ slurm -i eth2


怎么在Linux系统上安装slurm来监控网络带宽和控制节点

选项
按 l 显示 lx/tx 指示灯.
按 c 切换到经典模式.
按 r 刷新屏幕.
按 q 退出.

控制节点
在控制节点和计算结点分别安装 slurm 包,这个包里面既含有控制节点需要的 slurmctld 也含有计算结点需要的 slurmd:

代码如下:


# apt-get install slurm-llnl


控制节点和计算结点之间需要通信,通信就需要认证,slurm 支持两种认证方式:Brent Chun&rsquo;s 的 authd 和 LLNL 的 MUNGE,MUNGE 是专为高性能集群计算打造的,这里我们选用 MUNGE,生成 key 后启动 munge 认证服务:

代码如下:


# /usr/sbin/create-munge-key
Generating a pseudo-random key using /dev/urandom completed.
# /etc/init.d/munge start


使用 SLURM Version 2.3 Configuration Tool 在线配置工具生成配置文件,然后把配置文件拷贝控制节点以及各个计算结点的 /etc/slurm-llnl/slurm.conf(是的,控制节点和计算结点使用同一个配置文件)。
有了配置文件和启动了 munge 服务后就可以在控制节点启动 slurmctld 服务了:

代码如下:


# /etc/init.d/slurm-llnl start
* Starting slurm central management daemon slurmctld         [ OK ]


把控制节点生成的 munge.key 拷贝到各个计算结点:

代码如下:


# scp /etc/munge/munge.key ubuntu@slurm01:/etc/munge/


登陆计算节点后启动 munge 服务(注意需要改变 munge.key 的 owner 和 group 为 munge,否则会启动失败)和 slurmd 服务:

代码如下:


# ssh ubuntu@slurm01
# chown munge:munge munge.key
# /etc/init.d/munge start
* Starting MUNGE munged                        [ OK ]
# slurmd


在控制节点上(slurm00)测试一下是否顺利连接到计算结点(slurm01),并且简单运行一个程序 /bin/hostname 看看效果吧:

代码如下:


# sinfo
PARTITION AVaiL  TIMELIMIT  nodeS  STATE NODELIST
debug*       up   infinite      1   idle slurm01
# srun -N1 /bin/hostname
slurm01

感谢各位的阅读,以上就是“怎么在Linux系统上安装slurm来监控网络带宽和控制节点”的内容了,经过本文的学习后,相信大家对怎么在Linux系统上安装slurm来监控网络带宽和控制节点这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

--结束END--

本文标题: 怎么在Linux系统上安装slurm来监控网络带宽和控制节点

本文链接: https://www.lsjlt.com/news/263350.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 怎么在Linux系统上安装slurm来监控网络带宽和控制节点
    这篇文章主要讲解了“怎么在Linux系统上安装slurm来监控网络带宽和控制节点”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么在Linux系统上安装slurm来监控网络带宽和控制节点”吧...
    99+
    2023-06-12
  • 怎么在Linux系统上安装MRTG来监控网络流量
    这篇文章主要讲解了“怎么在Linux系统上安装MRTG来监控网络流量”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么在Linux系统上安装MRTG来监控网络流量”吧!Multi Route...
    99+
    2023-06-12
  • 怎么在CentOS系统上安装网络监控软件ntopng
    这篇文章主要介绍“怎么在CentOS系统上安装网络监控软件ntopng”,在日常操作中,相信很多人在怎么在CentOS系统上安装网络监控软件ntopng问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么在Ce...
    99+
    2023-06-10
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作