iis服务器助手广告广告
返回顶部
首页 > 资讯 > 精选 >hadoop需要什么技术支持
  • 884
分享到

hadoop需要什么技术支持

2023-06-02 18:06:10 884人浏览 八月长安
摘要

这篇文章给大家分享的是有关hadoop需要什么技术支持的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。hadoop是一个开源软件框架,可安装在一个商用机器集群中,使机器可彼此通信并协同工作,以高度分布式的方式共同存

这篇文章给大家分享的是有关hadoop需要什么技术支持的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

hadoop是一个开源软件框架,可安装在一个商用机器集群中,使机器可彼此通信并协同工作,以高度分布式的方式共同存储和处理大量数据。最初,Hadoop 包含以下两个主要组件:Hadoop Distributed File System (hdfs) 和一个分布式计算引擎,该引擎支持以 mapReduce 作业的形式实现和运行程序。

Hadoop 还提供了软件基础架构,以一系列 map 和 reduce 任务的形式运行 MapReduce 作业。Map 任务在输入数据的子集上调用map函数。在完成这些调用后,reduce任务开始在 map函数所生成的中间数据上调用reduce任务,生成最终的输出。map和reduce任务彼此单独运行,这支持并行和容错的计算。

最重要的是,Hadoop 基础架构负责处理分布式处理的所有复杂方面:并行化、调度、资源管理、机器间通信、软件和硬件故障处理,等等。得益于这种干净的抽象,实现处理数百(或者甚至数千)个机器上的数 TB 数据的分布式应用程序从未像现在这么容易过,甚至对于之前没有使用分布式系统的经验的开发人员也是如此。


 hadoop需要什么技术支持

map reduce 过程图

shuffle combine

整体的Shuffle过程包含以下几个部分:Map端Shuffle、Sort阶段、Reduce端Shuffle。即是说:Shuffle 过程横跨 map 和 reduce 两端,中间包含 sort 阶段,就是数据从 map task 输出到reduce task输入的这段过程。

sort、combine 是在 map 端的,combine 是提前的 reduce ,需要自己设置。

Hadoop 集群中,大部分 map task 与 reduce task 的执行是在不同的节点上。当然很多情况下 Reduce 执行时需要跨节点去拉取其它节点上的map task结果。如果集群正在运行的 job 有很多,那么 task 的正常执行对集群内部的网络资源消耗会很严重。而对于必要的网络资源消耗,最终的目的就是最大化地减少不必要的消耗。还有在节点内,相比于内存,磁盘 io 对 job 完成时间的影响也是可观的。从最基本的要求来说,对于 MapReduce 的 job 性能调优的 Shuffle 过程,目标期望可以有:

完整地从map task端拉取数据到reduce 端。

在跨节点拉取数据时,尽可能地减少对带宽的不必要消耗。

减少磁盘IO对task执行的影响。

总体来讲这段Shuffle过程,能优化的地方主要在于减少拉取数据的量及尽量使用内存而不是磁盘。

YARN

ResourceManager 代替集群管理器

ApplicationMaster 代替一个专用且短暂的 JobTracker

nodeManager 代替 TaskTracker

一个分布式应用程序代替一个 MapReduce 作业

一个全局 ResourceManager 以主要后台进程的形式运行,它通常在专用机器上运行,在各种竞争的应用程序之间仲裁可用的集群资源。

在用户提交一个应用程序时,一个称为 ApplicationMaster 的轻量型进程实例会启动来协调应用程序内的所有任务的执行。这包括监视任务,重新启动失败的任务,推测性地运行缓慢的任务,以及计算应用程序计数器值的总和。有趣的是,ApplicationMaster 可在容器内运行任何类型的任务。

NodeManager 是 TaskTracker 的一种更加普通和高效的版本。没有固定数量的 map 和 reduce slots,NodeManager 拥有许多动态创建的资源容器。





hadoop需要什么技术支持


大数据Hadoop开发厂商有Amazon WEB Services、Cloudera、Hortonworks、IBM、MapR科技、华为和大快搜索。这些厂商都是基于Apache开源项目,然后增加打包、支持、集成等特性以及自己的创新等内容。

大快的大数据通用计算平台(DKH),已经集成相同版本号的开发框架的全部组件。如果在开源大数据框架上部署大快的开发框架,需要平台的组件支持如下:

数据源与sql引擎:DK.Hadoop、sparkHive、sqoop、flume、kafka

数据采集:DK.hadoop

数据处理模块:DK.Hadoop、spark、stORM、hive

机器学习ai:DK.Hadoop、spark

NLP模块:上传服务器jar包,直接支持

索引擎模块:不独立发布

感谢各位的阅读!关于“hadoop需要什么技术支持”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

--结束END--

本文标题: hadoop需要什么技术支持

本文链接: https://www.lsjlt.com/news/231007.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • hadoop需要什么技术支持
    这篇文章给大家分享的是有关hadoop需要什么技术支持的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。hadoop是一个开源软件框架,可安装在一个商用机器集群中,使机器可彼此通信并协同工作,以高度分布式的方式共同存...
    99+
    2023-06-02
  • SEO需要了解什么技术
    这篇文章主要介绍了SEO需要了解什么技术,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。做SEO需要了解技术吗?答案是肯定的。假设你是个人站长,那懂技术是必须的,如果不懂技术,...
    99+
    2023-06-10
  • hadoop支持什么开发语言
    Hadoop支持多种开发语言,包括:1. Java:Hadoop是用Java编写的,因此Java是Hadoop的首选开发语言。开发人...
    99+
    2023-10-11
    hadoop
  • 组建网站需要什么技术
    组建一个网站需要以下技术:1. HTML:用于定义网页结构和内容的标记语言。2. CSS:用于定义网页样式和布局的样式表语言。3. ...
    99+
    2023-06-03
    组建网站
  • openSUSE支持容器技术吗
    是的,openSUSE支持容器技术。它提供了一个叫做openSUSE Kubic的项目,专门用于构建基于容器的操作系统。此外,ope...
    99+
    2024-04-02
  • 学习hadoop需要什么基础
    这篇文章主要为大家展示了“学习hadoop需要什么基础”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“学习hadoop需要什么基础”这篇文章吧。学习hadoop需要什么基础“学习hadoop需要什...
    99+
    2023-06-02
  • 亚马逊技术支持:为您提供全方位的技术支持服务
    1. 什么是亚马逊技术支持? 亚马逊技术支持是亚马逊公司为其客户提供的一项重要服务。作为全球最大的电子商务平台之一,亚马逊致力于为用户提供优质的购物体验和无缝的在线服务。为了实现这一目标,亚马逊建立了一支专业的技术支持团队,为用户解决在使...
    99+
    2023-10-27
    亚马逊 技术支持 为您提供
  • 购物网站建设需要什么技术
    购物网站建设需要以下技术:1. 前端技术:HTML、CSS、JavaScript等用于构建网站的用户界面。2. 后端技术:PHP、P...
    99+
    2023-06-12
    购物网站建设 网站建设
  • 网站建设需要掌握什么技术
    这篇文章主要为大家展示了“网站建设需要掌握什么技术”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“网站建设需要掌握什么技术”这篇文章吧。(1)域名。建立网站就必须拥有自己的域名,域名在国际互联网上...
    99+
    2023-06-27
  • 网站开发需要什么技术人员
    这篇文章将为大家详细讲解有关网站开发需要什么技术人员,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。与外部网站开发公司的合作对于许多企业来讲,可能招聘到大量的专业的网站开发人员可能成本有些过于高昂,但是招聘...
    99+
    2023-06-10
  • openSUSE支持哪些容器技术
    openSUSE支持以下容器技术: Docker:Docker是一种轻量级的容器化技术,openSUSE提供了对Docker的支...
    99+
    2024-03-13
    openSUSE
  • 亚马逊需要不需要服务器支持的
    如果您是在亚马逊的个人或小型企业客户,您可能不需要使用云服务的服务器支持。亚马逊的云服务提供商通常拥有自己的服务器和专业的技术支持团队,可以为您提供必要的支持和服务。 但是,如果您的业务需要更高级的计算资源和存储空间,或者您的客户需要在多...
    99+
    2023-10-27
    亚马逊 不需要 服务器
  • 云服务器运维需要什么技术
    云服务器运维需要掌握多项技术,以下是其中一些: 网络架构:网络架构是云服务器运行的基础,要确保云服务器稳定运行,需要保障高性能的网络连接、稳定可靠的网络带宽、良好的网络安全机制等。 数据库架构:数据库是云服务器运行的重要组成部分,要能够...
    99+
    2023-10-26
    服务器 技术
  • FreeBSD支持哪些容器技术
    FreeBSD支持多种容器技术,包括: Jails:FreeBSD的原生容器技术,可以实现轻量级的虚拟化隔离,每个Jail拥有独...
    99+
    2024-04-02
  • 小程序开发需要了解什么技术
    这篇文章将为大家详细讲解有关小程序开发需要了解什么技术,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。小程序开发需要的技术有:1、wxml,与html网页的编程技术类似;2、wxss,大部分和原先的css、...
    99+
    2023-06-20
  • 私有云平台搭建需要什么技术
    私有云平台搭建需要以下技术:1. 虚拟化技术:用于在物理硬件上创建虚拟机,以支持多个操作系统和应用程序的运行。2. 存储技术:用于存...
    99+
    2023-06-12
    私有云平台搭建 私有云
  • FreeBSD支持哪些虚拟化技术
    FreeBSD支持以下几种虚拟化技术: Jails:Jails是FreeBSD操作系统内建的虚拟化技术,可以实现将一个系统划分成...
    99+
    2024-04-02
  • Rocky Linux支持虚拟化技术吗
    Rocky Linux支持多种虚拟化技术,其中包括: KVM(Kernel-based Virtual Machine):Rock...
    99+
    2024-04-09
    Rocky Linux
  • ArchLinux支持哪些虚拟化技术
    ArchLinux支持多种虚拟化技术,包括: KVM(Kernel-based Virtual Machine):基于Linux内...
    99+
    2024-03-13
    ArchLinux
  • 亚马逊需要不需要服务器支持的网络
    一般情况下,如果您是在美国境内访问亚马逊的网站,则需要使用VPN服务进行网络加密和安全访问。如果您是通过第三方公共网络访问,则需要使用专用网络连接,例如宽带服务或VPN。 如果您需要使用云计算平台(例如Amazon Web Service...
    99+
    2023-10-27
    亚马逊 不需要 服务器
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作