广告
返回顶部
首页 > 资讯 > 操作系统 >linux有什么分布式文件系统
  • 810
分享到

linux有什么分布式文件系统

linux 2023-03-22 13:03:17 810人浏览 八月长安
摘要

今天小编给大家分享一下linux有什么分布式文件系统的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解

今天小编给大家分享一下linux有什么分布式文件系统的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。

linux分布式文件系统有:1、OpenAFS,是一套开放源代码的分布式文件系统;2、MooseFs,是一个具备容错功能的网络分布式文件统;3、GoogleFs,是一个可扩展分布式文件系统等。

linux分布式文件系统有哪些?

  • NFS(www.tldp.org/HOWTO/NFS-HOWTO/index.html

网络文件系统是FreeBSD支持的文件系统中的一种,也被称为NFS。

NFS允许一个系统在网络上与它人共享目录和文件。通过使用NFS, 用户和程序可以象访问本地文件一样访问远端系统上的文件。它的好处是:

1、本地工作站使用更少的磁盘空间,因为通常的数据可以存放在一台机器上而且可以通过网络访问到。

2、用户不必在每个网络上机器里面都有一个home目录。home目录可以被放在NFS服务器上并且在网络上处处可用。

3、诸如软驱、CDROM、和ZIP之类的存储设备可以在网络上面被别的机器使用。可以减少整个网络上的可移动介质设备的数量。

开发语言C/C++,可跨平台运行。

  • OpenAFS(www.openafs.org)

OpenAFS是一套开放源代码的分布式文件系统,允许系统之间通过局域网和广域网来分享档案和资源。OpenAFS是围绕一组叫做cell的文件服务器组织的,每个服务器的标识通常是隐藏在文件系统中,从AFS客户机登陆的用户将分辨不出他们在那个服务器上运行,因为从用户的角度上看,他们想在有识别的Unix文件系统语义的单个系统上运行。

文件系统内容通常都是跨cell复制,一便一个硬盘的失效不会损害OpenAFS客户机上的运行。OpenAFS需要高达1GB的大容量客户机缓存,以允许访问经常使用的文件。它是一个十分安全的基于kerbero的系统,它使用访问控制列表(ACL)以便可以进行细粒度的访问,这不是基于通常的Linux和Unix安全模型。开发协议IBM Public,运行在linux下。

  • MooseFs(derf.homelinux.org)

Moose File System是一个具备容错功能的网络分布式文件统,它将数据分布在网络中的不同服务器上,MooseFs通过FUSE使之看起来就 是一个Unix的文件系统。但有一点问题,它还是不能解决单点故障的问题。开发语言perl,可跨平台操作。

  • pNFS(www.pnfs.com)

网络文件系统(Network FileSystem,NFS)是大多数局域网(LAN)的重要的组成部分。但NFS不适用于高性能计算中苛刻的输入书橱密集型程序,至少以前是这样。NFS标准的罪行修改纳入了Parallel NFS(pNFS),它是文件共享的并行实现,将传输速率提高了几个数量级。

开发语言c/c++,运行在linux下。

  • googleFs

据说是一个比较不错的一个可扩展分布式文件系统,用于大型的,分布式的,对大量数据进行访问的应用。它运行于廉价的普通硬件上,但可以提供容错功能,它可以给大量的用户提供性能较高的服务。google自己开发的。

相关拓展:

常用的分布式文件系统有:GFS、TFS、hdfs、MooseFs、FastDfs、MogileFs、GridFs、MiNIO、SeaweedFS、GlusterFS、Ceph、GlusterFS等。

常见分布式文件系统比对

1、GFS(Google File System)
Google公司为满足公司需求而开发的基于Linux的可扩展的分布式文件系统,用于大型的、分布式的、对大数据进行访问和应用,成本低,应用于廉价的普通硬件上,但不开源,暂不考虑。

2、TFS(Taobao File System)
阿里巴巴为满足了淘宝对小文件存储的需求而开发的一个可扩展、高可用、高性能、面向互联网服务、开源的分布式文件系统,主要针对海量的非结构化数据,它构筑在普通的Linux机器集群上,可为外部提供高可靠和高并发的存储访问。TFS为淘宝提供海量小文件存储,通常文件大小不超过1M,这个也暂不考虑。

3、HDFS(hadoop Distributed File System)
Hadoop分布式文件系统,适合运行在通用硬件上做分布式存储和计算,因为它具有高容错性和可扩展性的特点,可部署在廉价的机器上,适合大数据的处理,在离线批量处理大数据上有先天的优势。
Hadoop是Apache Lucene创始人Doug Cutting开发的使用广泛的文本搜索库。它起源于Apache Nutch,后者是一个开源的网络搜索引擎,本身也是Luene项目的一部分。Aapche Hadoop架构mapReduce算法的一种开源应用,是Google开创其帝国的重要基石。

4、MooseFS
MooseFS 是来自波兰的开源且具备冗余容错功能的分布式 POSIX 文件系统,也是参照了 GFS 的架构,实现了绝大部分 POSIX 语义和 api,它支持通过FUSE方式将文件挂载操作,同时其提供的WEB管理界面非常方便查看当前的文件存储状态,对master服务器有单点依赖,用perl编写,用于中、大型文件应用,但性能相对较差,由于可能会实时访问所以暂不考虑。
备注:POSIX表示可移植操作系统接口(Portable Operating System Interface of UNIX,缩写为 POSIX ),POSIX标准定义了操作系统应该为应用程序提供的接口标准

5、FastDFS
由淘宝的余庆先生所开发的一个开源分布式文件系统。它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。适合以文件为载体的在线服务,如相册网站、视频网站等等。FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS搭建一套高性能的文件服务器集群提供文件上传、下载等服务。但是FastDFS部署有点麻烦,且它的SKD是不全的。

6、MogileFS
MogileFS是一套高效开源的文件自动备份组件,由Six Apart开发,广泛应用在包括LiveJournal等web2.0站点上。支持多节点冗余,可实现自动的文件复制。不需要RaiD,应用层可以直接实现RAID,不共享任何东西,通过集群接口提供服务工作于应用层,没有特殊的组件要求。使用Http方式通信。

国内所知道的使用 MogileFS 的公司有图片托管网站 yupoo又拍,digg, 土豆, 豆瓣,1 号店, 大众点评,搜狗,安居客等等网站.基本很多网站容量,图片都超过 30T 以上。

7、GridFS
mongoDB是一种知名的NoSQL数据库,GridFS是MongoDB的一个内置功能,它用于存储和恢复那些超过16M(BSON文件限制)的文件(如:图片、音频、视频等),是文件存储的一种方式,但是它是存储在MonoDB的集合中。它可以直接利用已建立的复制或分片机制,所以对于文件存储来说故障恢复和扩展都容易,且GridFS不产生磁盘碎片。

8、Minio
MinIO 是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,而一个对象文件可以是任意大小,从几kb到最大5T不等。它也是一个非常轻量的服务,可以很简单的和其他应用的结合。MinIO的特色在于简单、轻量级,对开发者友好,学习成本低,安装运维简单,开箱即用。

9、SeaweedFS
SeaweedFS是基于go语言开发高度可扩展开源的分布式存储系统,能存储数十亿文件(最终受制于你的硬盘大小)、并且速度快,内存占用小。上手使用比fastDFS要简单很多,自带Rest API。对于中小型文件效率非常高,但是单卷最大容量被程序限制到30G,建议存储文件以100MB以内为主。

10、Ceph
Ceph是Red Hat旗下一个成熟的分布式文件系统,而且还是一个有企业级功能的对象存储生态环境。该系统具备高性能、高可用性、高可扩展性、实时存储性等特点。虽然ceph很强大,但是学习成本高、安装运维复杂。Ceph用C++编写,存储容量可轻松达到PB级别。

11、GlusterFS
GlusterFS 是由美国的 Gluster 公司开发的 POSIX 分布式文件系统(以 GPL 开源),它主要应用在集群系统中,具有高扩展性、高可用性、高性能、可横向扩展等特点,并且其没有元数据服务器的设计,让整个服务没有单点故障的隐患。该系统主要是为中大型文件设计的,存储容量可轻松达到PB。它存在扩容缩容影响服务器较多、遍历目录下文件耗时、小文件性能较差的缺点。

以上就是“linux有什么分布式文件系统”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注编程网服务器栏目。

--结束END--

本文标题: linux有什么分布式文件系统

本文链接: https://www.lsjlt.com/news/200812.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • linux有什么分布式文件系统
    今天小编给大家分享一下linux有什么分布式文件系统的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解...
    99+
    2023-03-22
    linux
  • Linux文件分布式系统是什么
    这篇文章主要介绍“Linux文件分布式系统是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Linux文件分布式系统是什么”文章能帮助大家解决问题。Lustre(www.lustre.org)  ...
    99+
    2023-06-28
  • 分布式文件系统FastDFS的原理是什么
    今天就跟大家聊聊有关分布式文件系统FastDFS的原理是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。什么是FastDFS?FastDFS是一个开源的轻量级分布式文件系统。它解决...
    99+
    2023-06-16
  • 分布式文件系统HDFS的示例分析
    小编给大家分享一下分布式文件系统HDFS的示例分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧! 从RAID说起大数据技术主要要解决的问题的是大规模数据的计算处理问题,那么首先要解决的就是大规模数据的存储问题。大规模数据存...
    99+
    2023-06-19
  • Hadoop分布式文件系统HDFS架构分析
    本文小编为大家详细介绍“Hadoop分布式文件系统HDFS架构分析”,内容详细,步骤清晰,细节处理妥当,希望这篇“Hadoop分布式文件系统HDFS架构分析”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。Hadoo...
    99+
    2023-06-27
  • Numpy分布式文件系统的Java实现方法是什么?
    Numpy是Python中用于科学计算的重要库之一。其中,Numpy的分布式文件系统提供了一种方便的方法来存储和处理大数据。但是,如果我们想在Java中使用Numpy分布式文件系统,应该如何实现呢? 实现方法 在Java中使用Numpy分...
    99+
    2023-07-28
    文件 分布式 numpy
  • HDFS分布式文件系统如何设计
    这篇文章将为大家详细讲解有关HDFS分布式文件系统如何设计,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。正文HDFS的设计以及概念  HDFS集群是典型的 master/slave 架构,master 节...
    99+
    2023-06-02
  • 分布式文件系统mogilefs的简单应用
    简介MogileFS是一个开源的分布式文件存储系统,由LiveJournal旗下的DangaInteractive公司开发。Danga团队开发了包括Memcached、MogileFS、Perlbal等多个...
    99+
    2022-10-18
  • Java中如何处理分布式文件系统?
    随着互联网的发展,越来越多的应用需要处理大量的文件数据,而传统的单机文件系统已经无法满足这种需求。因此,分布式文件系统应运而生。分布式文件系统是一种能够将数据存储在多台服务器上的文件系统,通过将数据分散到不同的服务器上,可以提高数据的可靠...
    99+
    2023-07-28
    文件 分布式 numpy
  • 分布式系统中的文件管理和Go语言编程有什么关联?
    随着互联网的迅速发展,分布式系统在我们的生活中扮演着越来越重要的角色。在分布式系统中,文件管理是一个至关重要的方面。文件管理的好坏直接影响着系统的性能和稳定性。同时,Go语言作为一种并发性强、易于编写高性能程序的编程语言,也在分布式系统中...
    99+
    2023-08-02
    编程算法 文件 分布式
  • 如何使用Python实现分布式文件系统?
    分布式文件系统是一种可以将文件储存在多个节点上的文件系统,它可以提高文件系统的可靠性和可扩展性。Python是一种非常流行的编程语言,它可以用来实现分布式文件系统。在本文中,我们将介绍如何使用Python实现分布式文件系统,并提供一些演示代...
    99+
    2023-06-02
    并发 文件 分布式
  • Apache和Python:如何搭建分布式文件系统?
    随着数据量的不断增加,传统的单机文件系统已经无法满足我们的需求。为了解决这个问题,分布式文件系统应运而生。分布式文件系统通过将数据存储在多个节点上,并允许多个用户同时访问这些数据,实现了高可用性和可伸缩性。在本文中,我们将介绍如何使用Ap...
    99+
    2023-07-31
    apache 文件 分布式
  • Linux系统下的hosts文件有什么用
    本篇内容介绍了“Linux系统下的hosts文件有什么用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!hosts文件hosts &m...
    99+
    2023-06-12
  • Java分布式索引对Linux系统的要求是什么?
    随着互联网的不断发展,大数据和分布式系统的应用越来越广泛。在这个时代,Java分布式索引成为了非常重要的技术。Java分布式索引是一种基于Java技术的分布式索引技术,可以帮助我们快速高效地处理大规模数据。但是,Java分布式索引对Lin...
    99+
    2023-08-24
    分布式 索引 linux
  • 文件分布式存储系统的Numpy实现方法有哪些?
    随着数据量的爆炸性增长和云计算、大数据等技术的发展,文件分布式存储系统越来越受到重视。文件分布式存储系统可以将大量数据分散存储在多台计算机上,实现数据的高效存储和访问。在实现分布式存储系统时,Numpy是一个非常强大的工具。那么,文件分布...
    99+
    2023-07-28
    文件 分布式 numpy
  • Linux内核与根文件系统有什么关系
    这篇文章主要为大家展示了“Linux内核与根文件系统有什么关系”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Linux内核与根文件系统有什么关系”这篇文章吧。Linux内核与根文件系统的关系 开...
    99+
    2023-06-12
  • Django如何优化分布式文件系统的性能?
    随着互联网技术的不断发展,分布式文件系统被越来越多的企业采用。然而,分布式文件系统的性能问题一直是困扰开发人员的难题。本文将介绍如何通过Django优化分布式文件系统的性能。 一、使用缓存 缓存是提高分布式文件系统性能的有效手段之一。Dj...
    99+
    2023-09-29
    分布式 文件 django
  • 分布式文件系统的完美选择:Python和Apache?
    随着云计算的发展,分布式文件系统逐渐成为了数据存储的首选。传统的本地文件系统已经无法满足大规模数据处理和存储的需求,而分布式文件系统可以将数据存储在多个节点上,提高了可靠性和可扩展性。Python和Apache是目前最受欢迎的编程语言和开...
    99+
    2023-07-31
    apache 文件 分布式
  • Nginx+NFS及Redis和分布式文件系统Moosefs有哪些优缺点
    Nginx+NFS及Redis和分布式文件系统Moosefs有哪些优缺点,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。  大量小文件存储一直是...
    99+
    2022-10-18
  • Linux系统下分布式计算的最佳实践是什么?
    分布式计算是一个非常重要的技术,它可以将大规模的计算任务分解为多个小任务,然后在多台计算机上并行执行,从而提高计算效率和性能。在Linux系统下,分布式计算的最佳实践是什么呢?本文将为您介绍一些最佳实践和示例代码。 使用Hadoop框架...
    99+
    2023-08-02
    numy linux 分布式
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作