iis服务器助手广告广告
返回顶部
首页 > 资讯 > 精选 >HDFS免重启挂载新磁盘的方法
  • 293
分享到

HDFS免重启挂载新磁盘的方法

2023-06-29 21:06:09 293人浏览 安东尼
摘要

本篇内容主要讲解“hdfs免重启挂载新磁盘的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“HDFS免重启挂载新磁盘的方法”吧!在生产环境中,集群节点磁盘大小不同,其使用率也会不同,HDFS虽

本篇内容主要讲解“hdfs免重启挂载新磁盘的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“HDFS免重启挂载新磁盘的方法”吧!

在生产环境中,集群节点磁盘大小不同,其使用率也会不同,HDFS虽有均衡策略,但也会有数据不平衡的情况,有些节点磁盘就会被打满,然后这个节点就不健康了(Unhealthy nodes),Yarn的磁盘阈值检查(yarn.nodemanager.disk-health-checker.min-healthy-disks),默认是90%,超过这个值就会不健康,集群有个节点不健康,就会导致任务运行缓慢,之后任务再挤压,Yarn资源被集中占用,最终影响上层服务。

问题

  • 磁盘空间不足,待扩容,可动态增删磁盘

  • yarn资源不足,待优化,可动态调整

官方说明

官方文档:DataNode Hot Swap Drive

DataNode Hot Swap Drive

Datanode supports hot swappable drives. The user can add or replace HDFS data volumes without shutting down the DataNode. The following briefly describes the typical hot swapping drive procedure:

  • If there are new storage directories, the user should fORMat them and mount them appropriately.

  • The user updates the DataNode configuratiodfs.datanode.data.dir to reflect the data volume directories that will be actively in use.

  • The user runs dfsadmin -reconfig datanode HOST:PORT start to start the reconfiguration process. The user can use dfsadmin -reconfig datanode HOST:PORT status to query the running status of the reconfiguration task.

  • Once the reconfiguration task has completed, the user can safely umount the removed data volume directories and physically remove the disks.

经过谷歌翻译如下:

DataNode 热插拔驱动器

Datanode 支持热插拔驱动器。用户可以在不关闭 DataNode 的情况下添加或替换 HDFS 数据卷。下面简要介绍典型的热插拔驱动器过程:

  • 如果有新的存储目录,用户应该格式化它们并适当地挂载它们。

  • 用户更新 DataNode 配置dfs.datanode.data.dir 以反映将被积极使用的数据卷目录。

  • 用户运行dfsadmin -reconfig datanode HOST:PORT start来启动重新配置过程。用户可以使用 dfsadmin -reconfig datanode HOST:PORT status 查询重配置任务的运行状态。

  • 重新配置任务完成后,用户可以安全地卸载已移除的数据卷目录并物理移除磁盘。

我们先说添加新的磁盘,大意就是不需要重启任何节点,在需要添加磁盘的节点上,添加好磁盘,这个需要运维操作,就是挂载一个新目录,文档中是说要配置DataNode的目录,这里我们建议加上NameNode的目录dfs.namenode.name.dir,然后再执行一个使配置生效的命令,最后查看配置状态。

具体操作

这里假设已有集群,需要加磁盘的节点为node2。运维也已经帮我们挂载好磁盘,新磁盘目录为/data2

第一步:新增目录

在node2上添加新目录,数据目录和元数据目录

mkdir -p /data2/soft/hadoop/tmp/dfs/data

mkdir -p /data2/soft/hadoop/tmp/dfs/name

第二步:修改配置

修改节点node2的配置文件hdfs-site.xml,主要两个属性

修改前

<!--指定hdfs中namenode的存储位置--><property>    <name>dfs.namenode.name.dir</name>    <value>/data/soft/hadoop/tmp/dfs/name</value></property><!--指定hdfs中datanode的存储位置--><property>    <name>dfs.datanode.data.dir</name>    <value>/data/soft/hadoop/tmp/dfs/data</value></property>

修改后

<!--指定hdfs中namenode的存储位置--><property>    <name>dfs.namenode.name.dir</name>    <value>/data/soft/hadoop/tmp/dfs/name,/data2/soft/hadoop/tmp/dfs/name</value></property><!--指定hdfs中datanode的存储位置--><property>    <name>dfs.datanode.data.dir</name>    <value>/data/soft/hadoop/tmp/dfs/data,/data2/soft/hadoop/tmp/dfs/data</value></property>

第三步:使配置生效

重新配置DataNode的配置,使配置生效。

hdfs dfsadmin -reconfig datanode node2:50020 start

hdfs dfsadmin -reconfig datanode node2:50020 status

第四步:平衡数据

HDFS数据本身并不总是均匀的放置在DataNode中,在添加新磁盘后,我们需要重新平衡下数据,HDFS为我们提供了一个工具,可以分析数据块放的位置和跨 DataNode 重新平衡数据:balancer

官方文档:hdfs balancer

hdfs balancer    [-threshold <threshold>]:磁盘容量百分百,判断集群是否平衡的目标参数,每一个 datanode 存储使用率和集群总存储使用率的差值都应该小于这个阀值,越小越平衡,默认10,越大平衡越快。    [-policy <policy>]:datanode(默认):如果每个数据节点都是平衡的,则集群是平衡的。blockpool:如果每个数据节点中的每个块池都是平衡的,则集群是平衡的。    [-exclude [-f <hosts-file> | <comma-separated list of hosts>]]:将指定的数据节点排除在平衡器的平衡之外。    [-include [-f <hosts-file> | <comma-separated list of hosts>]]:仅包括要由平衡器平衡的指定数据节点。    [-idleiterations <idleiterations>]:rebalanecing server启动的线程数,默认5。

平衡前操作

在平衡时受带宽影响,每个数据节点每秒使用的最大字节数是有限的,所以我们先临时设置这个值,此值会覆盖hdfs-site.xml中dfs.datanode.balance.bandwidthPerSec的值,默认是1M,本操作命令不会持久,命令如下:

hdfs dfsadmin -setBalancerBandwidth 104857600

其他值:1024*1024=1M(1048576),52428800=50M,104857600=100M

开始平衡

本次执行平衡命令,磁盘平衡目标数为20 nohup hdfs balancer -threshold 20 > balancer.log &

其他平衡命令

平衡所有节点 nohup hdfs balancer > balancer.log &

平衡指定节点,磁盘平衡目标数为10 nohup hdfs balancer -include node7,node9,node10,node11 -threshold 10 > balancer.log &

平衡指定节点,磁盘平衡目标数,启动线程数为10 nohup hdfs balancer -include node7,node9,node10,node11 -threshold 10 -idleiterations 10 > balancer.log &

注(可选):一般在平衡时,可以先停止存储比较高的节点上的NodeManager,这样在该节点上就不会受本地NodeManager落数据到本地,使得本地存储迅速增加的影响。

yarn-daemon.sh stop nodemanager yarn-daemon.sh start nodemanager

到此,相信大家对“HDFS免重启挂载新磁盘的方法”有了更深的了解,不妨来实际操作一番吧!这里是编程网网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

--结束END--

本文标题: HDFS免重启挂载新磁盘的方法

本文链接: https://www.lsjlt.com/news/326422.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • HDFS免重启挂载新磁盘的方法
    本篇内容主要讲解“HDFS免重启挂载新磁盘的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“HDFS免重启挂载新磁盘的方法”吧!在生产环境中,集群节点磁盘大小不同,其使用率也会不同,HDFS虽...
    99+
    2023-06-29
  • HDFS免重启挂载新磁盘
    在生产环境中,集群节点磁盘大小不同,其使用率也会不同,HDFS虽有均衡策略,但也会有数据不平衡的情况,有些节点磁盘就会被打满,然后这个节点就不健康了(Unhealthy Nodes)...
    99+
    2024-04-02
  • linux挂载新硬盘的方法
    本文小编为大家详细介绍“linux挂载新硬盘的方法”,内容详细,步骤清晰,细节处理妥当,希望这篇“linux挂载新硬盘的方法”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。复制代码...
    99+
    2024-04-02
  • linux重启之后挂载的磁盘没了如何解决
    当Linux重启后挂载的磁盘消失时,可以按照以下步骤来解决问题:1. 检查磁盘是否存在:运行`lsblk`或`fdisk -l`命令...
    99+
    2023-09-15
    linux
  • linux查看磁盘挂载的方法有哪些
    本篇内容介绍了“linux查看磁盘挂载的方法有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!第一种方法:使用df命令,例如:代码如下:o...
    99+
    2023-06-13
  • Linux云服务器挂载新磁盘的方法步骤是什么
    Linux云服务器挂载新磁盘的步骤是:1、用/dev/vdb fdisk -1命令查看磁盘的状态,发现有一块新磁盘,然后使用lsblk -f查看磁盘格式;2、对数据盘进行分区,依次输入n,p,l,两次回车,wq保存,然后用命令mkfs.ex...
    99+
    2024-04-02
  • win7清理磁盘后重新启动更新失败的响应方法
    网友在清理C盘后发现电脑在重新启动时无法成功更新设备,原因众多。win7如果磁盘清洗后重新启动设备更新失败怎么办?您能否关闭重新启动计算机配置更新的页面?下面的小系列将教你win清理C盘后发生win7重新启动更新失败的解决方案。我们可以自动...
    99+
    2023-07-10
  • ubuntu新硬盘挂载的方法是什么
    在Ubuntu中,挂载新的硬盘可以按照以下步骤进行:1. 插入新硬盘到计算机上,并确保硬盘被正确识别。2. 打开终端,运行以下命令以...
    99+
    2023-09-06
    ubuntu
  • linux系统磁盘分区以及把磁盘挂载到系统中的方法
    本篇内容主要讲解“linux系统磁盘分区以及把磁盘挂载到系统中的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“linux系统磁盘分区以及把磁盘挂载到系统中的方法”吧!fdisk 分区 fdi...
    99+
    2023-06-12
  • linux下磁盘管理与挂载硬盘方法是什么
    这篇文章主要介绍“linux下磁盘管理与挂载硬盘方法是什么”,在日常操作中,相信很多人在linux下磁盘管理与挂载硬盘方法是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”linux下磁盘管理与挂载硬盘方法...
    99+
    2023-06-26
  • Win8系统快速挂载VHD虚拟磁盘的方法
    Win7系统里的VHD相信大家也不陌生,VHD文件全名叫做Virtual Hard Disk,也就是虚拟磁盘,是微软推出的一种磁盘的格式,在hyper-V中安装操作系统时,就可以把操作系统安装在这种虚拟磁盘文件中。在Wi...
    99+
    2023-06-05
    Win8 VHD 磁盘 系统 方法
  • Linux系统自动挂载磁盘的方法是什么
    本篇内容介绍了“Linux系统自动挂载磁盘的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!方法步骤:第一步先 fdisk -l ,...
    99+
    2023-06-28
  • linux多磁盘挂载到同一个分区的方法是什么
    在Linux中,可以使用LVM(逻辑卷管理)来将多个磁盘挂载到同一个分区。以下是实现此目的的步骤:1. 确保所有要挂载到同一个分区的...
    99+
    2023-08-08
    linux
  • linux退出u盘挂载的方法
    linux中退出u盘挂载的方法:在使用完u盘后,在拔出前需要在linux终端输入“umount 挂载目录路径”命令退出u盘挂载即可。具体操作步骤:在linux系统桌面中使用快捷键【Ctrl+Alt+T】打开linux终端命令行模式。在lin...
    99+
    2024-04-02
  • Linux系统下挂载光盘的方法
    本篇内容介绍了“Linux系统下挂载光盘的方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一般Linux系统都是运行在命令行界面,那如何在...
    99+
    2023-06-13
  • centos挂载ntfsu盘的方法是什么
    在CentOS中挂载NTFS格式的U盘,可以按照以下步骤操作: 首先,插入U盘到计算机上,并打开终端。 运行以下命令查看U盘...
    99+
    2024-04-02
  • 阿里云服务器挂载磁盘详解配置与使用方法
    在进行云服务器管理时,我们经常需要将本地磁盘挂载到服务器上,以便于数据的存储和访问。本文将详细介绍如何在阿里云服务器上挂载磁盘。 一、准备步骤首先,你需要在阿里云控制台上创建一个服务器实例。在创建过程中,你需要选择服务器类型、操作系统和磁盘...
    99+
    2023-12-16
    阿里 使用方法 磁盘
  • shell脚本怎么快速创建、格式化、挂载新添加的磁盘
    这篇文章主要介绍了shell脚本怎么快速创建、格式化、挂载新添加的磁盘,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一、通过管理员选择创建、格式化、挂载新添加的磁盘脚本#!&...
    99+
    2023-06-09
  • centos移动硬盘挂载的方法是什么
    在CentOS系统中,可以通过以下步骤将移动硬盘挂载到系统中: 首先,插入移动硬盘到计算机的USB接口上。 执行命令查看移动...
    99+
    2024-04-02
  • ubuntu自动挂载硬盘的方法是什么
    在Ubuntu中,有几种方法可以实现自动挂载硬盘。1. 使用命令行方式:- 找到要挂载的硬盘的设备名,可以使用`lsblk`命令来查...
    99+
    2023-08-19
    ubuntu
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作