iis服务器助手广告广告
返回顶部
首页 > 资讯 > 操作系统 >如何分析Linux命令du和df统计结果差异
  • 923
分享到

如何分析Linux命令du和df统计结果差异

2023-06-28 13:06:54 923人浏览 薄情痞子
摘要

这篇文章跟大家分析一下“如何分析linux命令du和df统计结果差异”。内容详细易懂,对“如何分析Linux命令du和df统计结果差异”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习

这篇文章跟大家分析一下“如何分析linux命令du和df统计结果差异”。内容详细易懂,对“如何分析Linux命令du和df统计结果差异”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习“如何分析Linux命令du和df统计结果差异”的知识吧。

11.文件存储和删除的底层过程

这里简单说明下文件系统相关的底层机制。

首先说明下文件是怎么存储到文件系统中的。假如要存储a.txt到/tmp目录下。

如何分析Linux命令du和df统计结果差异

当a.txt文件要存储到/tmp下时:

  • (1).首先从inode table中找一个空闲的inode号分配给a.txt,例如2222。再将inode map(imap)中2222这个inode号标记为已使用。

  • (2).在/tmp的data block中添加一条a.txt文件的记录。该记录中包括一个指向inode号的指针,例如”0x2222″。

  • (3).然后从block map(bmap)中找出空闲的data block,并开始将a.txt中的数据写入到data block中。每写一段空间(每次分配一段空间)就从bmap中找一次空闲的data block,直到存完所有数据。

  • (4).设置inode table中关于2222这条记录的data block指针,通过该指针可以找到a.txt使用了哪些data block。

当要删除a.txt文件时:

  • (1).在inode table中删除指向a.txt的data block指针。这里只要一删除,外界就找不到a.txt的数据了。但是这个文件还存在,只是它是被”损坏”的文件,因为没有任何指针指向数据块。

  • (2).在imap中将2222的inode号标记为未使用。于是这个inode号就被释放,可以被后续的文件重用。

  • (3).删除父目录/tmp的data block中关于a.txt的记录。这里只要一删除,外界就看不到也找不到这个文件了。

  • (4).在bmap中将a.txt占用的block标记为未使用。这里被标记为未使用后,这些data block就可以被后续文件覆盖重用。

考虑一种情况,当一个文件被删除时,但此时还有进程在使用这个文件,这时是怎样的情况呢?外界是看不到也找不到这个文件的,所以删除的过程已经进行到了第(3)步。但进程还在使用这个文件的数据,也能找到这个文件的数据,是因为进程在加载这个文件的时候就已经获取到了该文件占用哪些data block,虽然删除了文件,但bmap中这些data block还没有标记为未使用。

2.du统计的原理

du是通过stat命令来统计每个文件(包括子目录)的空间占用总和。因为会对每个涉及到的文件使用stat命令,所以速度较慢。

1.如果统计目录下挂载了其他文件系统,那么也会对这个文件系统进行统计。

例如”du -sh /”的时候,会统计所有分区的文件,包括挂载上来的。正如本文开头统计的”/”一样,du的结果是244G,明显比df统计的结果大,就是因为将某个分区挂载到了/mnt目录下。

##### df的统计结果[root@linuxidc ~]# df -hTFilesystem     Type Size Used Avail Use% Mounted on/dev/sda2     ext4  18G 1.7G 15G 11% /tmpfs       tmpfs 491M  0 491M 0% /dev/shm/dev/sda1     ext4 239M 68M 159M 30% /boot//192.168.0.124/win cifs 381G 243G 138G 64% /mnt

##### du对根目录的统计结果[root@linuxidc ~]# du -sh / 2>/dev/null244G  /

2.如果文件被删除,即使被其他进程引用了,du命令也无法对其统计。因为*stat命令找不到这个文件*

3.可以跨分区统计某些你想统计的文件大小总和。因为它们都能被stat找到并统计。

例如:

统计Linux下所有img文件的大小。

[root@linuxidc ~]# find / -type f -name “*.img” -print0 | xargs -0 du -csh19M  /boot/initramfs-2.6.32-504.el6.x86_64.img13M  /mnt/linux工具/cirros-0.3.4-x86_64-disk.img31M  total

这里统计的两个img文件就是在不同分区内的。

3.df统计的原理

df是读取每个分区的superblock来获取空闲数据块、已使用数据块,从而计算出空闲空间和已使用空间,因此df统计的速度极快(superblock才占用1024字节)。

1.当某个文件系统下挂载了其他分区,df不会把这个分区也统计进去。

这很容易理解,因为df读取的是各自分区的superblock,即使分区1挂载在分区0的目录下,df统计分区0的时候,也只能读取分区0的superblock。

例如,下面的/mnt、/boot都没有统计在”/”中。

[root@linuxidc ~]# df -hTFilesystem     Type Size Used Avail Use% Mounted on/dev/sda2     ext4  18G 1.7G 15G 11% /tmpfs       tmpfs 491M  0 491M 0% /dev/shm/dev/sda1     ext4 239M 68M 159M 30% /boot//192.168.0.124/win cifs 381G 243G 138G 64% /mnt

2.由于df每次统计都是读取superblock,所以df对文件系统中的某个文件进行统计时,会自动转为统计这个文件系统的信息。

[root@linuxidc ~]# df -hT /etc/fstabFilesystem  Type Size Used Avail Use% Mounted on/dev/sda2   ext4 18G 1.7G 15G 11% /

3.df会统计已删除但却仍有进程引用的文件。

正常情况下,删除文件会立刻释放相关指针,并将imap和bmap中相关的位图标记为未使用。bmap只要一改变,文件系统立刻就能知道每个块组中哪些数据块是空闲的,哪些数据块是被使用的,这些信息都会更新到分区的superblock中。于是df能立刻统计到实时的空间信息。

但是当一个文件被删除时,如果还有进程在引用这个文件,根据前文的分析,bmap中不会将这个文件的data block标记为未使用,也就不会将数据块的使用情况更新到superblock中。由于df是根据superblock中空闲和使用数据块的数量来计算空闲空间和已使用空间的,所以df统计的时候会将这个已被”删除”的文件统计到已使用空间中。

例如,创建一个较大一点的文件放在”/”目录下,并du和df统计根目录的已使用空间。

[root@linuxidc ~]# dd if=/dev/zero of=/my.iso bs=1M count=1000

[root@linuxidc ~]# df -hT /Filesystem  Type Size Used Avail Use% Mounted on/dev/sda2   ext4 18G 2.7G 14G 17% /

[root@linuxidc ~]# du -sh –exclude=”/mnt” / 2>/dev/null2.7G  /

它们在GB级的单位上是相等的。

现在使用一个进程来引用这个文件,然后删除这个文件,再du和df统计。

[root@linuxidc ~]# tail -f /my.iso &

[root@linuxidc ~]# rm -rf /my.iso[root@linuxidc ~]# ls /my.isols: cannot access /my.iso: No such file or directory

[root@linuxidc ~]# du -sh –exclude=”/mnt” / 2>/dev/null1.8G  /

[root@linuxidc ~]# df -hT /Filesystem  Type Size Used Avail Use% Mounted on/dev/sda2   ext4 18G 2.7G 14G 17% /

可以发现,外界已经获取不到my.iso文件了,所以du无法统计这个文件。而df却将该文件大小统计进去了,因为my.iso占用的data block还未被标记为未使用。

再关掉tail进程,然后df再统计空间,结果将和du一样显示为正常的大小。

[root@linuxidc ~]# jobs[1]+ Running        tail -f /my.iso &[root@linuxidc ~]# kill %1

[root@linuxidc ~]# df -hT /Filesystem  Type Size Used Avail Use% Mounted on/dev/sda2   ext4 18G 1.7G 15G 11% /

如果不知道文件系统中哪些已被删除,但却还被进程引用的文件,可以使用lsof来获取。通过它还能获取到文件的大小,看看到底是哪个文件在”占着茅坑以及占了多少茅坑”。

例如,关掉tail进程前,使用lsof查看。可以看到tail进程占用了/my.iso,且这个文件的大小为1048576000字节。

[root@linuxidc ~]# lsof | grep deleted PHP-fpm 12597   root txt  REG 8,2  4058416 931143 /usr/sbin/php-fpm (deleted)php-fpm 12657  nobody txt  REG 8,2  4058416 931143 /usr/sbin/php-fpm (deleted)php-fpm 12707  nobody txt  REG 8,2  4058416 931143 /usr/sbin/php-fpm (deleted)php-fpm 12708  nobody txt  REG 8,2  4058416 931143 /usr/sbin/php-fpm (deleted)tail   14437   root  3r  REG 8,2 1048576000  7171 /my.iso (deleted)

经过上面的分析,想必对du和df的结果不会再有任何疑惑了吧。

关于如何分析Linux命令du和df统计结果差异就分享到这里啦,希望上述内容能够让大家有所提升。如果想要学习更多知识,请大家多多留意小编的更新。谢谢大家关注一下编程网网站!

--结束END--

本文标题: 如何分析Linux命令du和df统计结果差异

本文链接: https://www.lsjlt.com/news/319621.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 如何分析Linux命令du和df统计结果差异
    这篇文章跟大家分析一下“如何分析Linux命令du和df统计结果差异”。内容详细易懂,对“如何分析Linux命令du和df统计结果差异”感兴趣的朋友可以跟着小编的思路慢慢深入来阅读一下,希望阅读后能够对大家有所帮助。下面跟着小编一起深入学习...
    99+
    2023-06-28
  • 如何进行Unix与Linux操作系统差异的分析
    这篇文章给大家介绍如何进行Unix与Linux操作系统差异的分析,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。Unix与Linux操作系统是同一个操作系统吗是,也不是。或许这个答案有自相矛盾的地方,但是却是一个比较合理...
    99+
    2023-06-17
  • Linux系统如何将命令结果输出到文件
    小编今天带大家了解Linux系统如何将命令结果输出到文件,文中知识点介绍的非常详细。觉得有帮助的朋友可以跟着小编一起浏览文章的内容,希望能够帮助更多想解决这个问题的朋友找到问题的答案,下面跟着小编一起深入学习“Linux系统如何将命令结果输...
    99+
    2023-06-28
  • Linux系统中如何分析SSH与SCP命令
    这篇文章给大家介绍Linux系统中如何分析SSH与SCP命令,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。如果ssh的端口是22,那么可以不用指定-p或-P选项。1. sshLinux使用ssh命令登陆Linux服务器...
    99+
    2023-06-28
  • 如何使用top命令分析linux系统性能
    这篇文章给大家介绍如何使用top命令分析linux系统性能,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。top命令是Linux下常用的性能分析工具,可谓是分析系统性能最方便的工具能够实时显示系统中各个进程的资源占用状况...
    99+
    2023-06-28
  • 如何进行dd命令备份Linux系统的分析
    本篇文章为大家展示了如何进行dd命令备份Linux系统的分析,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。数据丢失带来的损失是相当昂贵的。关键数据的丢失会对各种规模的企业带来影响。有几种方法来备份L...
    99+
    2023-06-28
  • Linux中如何用ssh命令统计分布式集群信息
    这篇“Linux中如何用ssh命令统计分布式集群信息”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看...
    99+
    2023-05-25
    linux ssh
  • Linux Shell如何用ssh命令统计分布式集群信息详解
    目录一、统计分布式集群信息的思路二、SSH加密原理三、SSH命令四、利用ssh-keygen和ssh-copy-id 实现免密登录五、Linux Shell 脚本实现六、ssh只循环...
    99+
    2024-04-02
  • 如何分析Linux下at延时任务和crontab定时任务命令
    本篇文章为大家展示了如何分析Linux下at延时任务和crontab定时任务命令,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。在Linux系统中,要想设定及时任务可以用at:一次性定时任务计划执行和...
    99+
    2023-06-28
  • linux下如何使用fdisk结合partprobe命令不重启系统添加一块新的磁盘分区
    linux下如何使用fdisk结合partprobe命令不重启系统添加一块新的磁盘分区,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。主机自带硬盘超过300GB,...
    99+
    2023-06-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作