iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >cdh4云存储最实用搭建方法
  • 628
分享到

cdh4云存储最实用搭建方法

2024-04-02 19:04:59 628人浏览 安东尼
摘要

一、cdh是什么 CDH is Cloudera’s 100% open source hadoop distribution, built specifically to meet enter

一、cdh是什么
CDH is Cloudera’s 100% open source hadoop distribution, built specifically to meet enterprise demands
即一个开源分布式存储系统
二、cdh5包含了哪些软件和功能
首先HBase,hadoop,ZooKeeper这些是必不可少的
其次Hive,oozie,Map/Reduce也可以集成在其中
HBase是一个分布式的、面向列的开源数据库,该技术来源于Chang et al所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”
hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储
ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为mapReduce任务进行运行
Oozie是一种框架,它让我们可以把多个Map/Reduce作业组合到一个逻辑工作单元中
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(化简)",和他们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。他极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上
三、cdh5的安装
cdh5安装一般来讲通俗的方法就是登录官方网站Http://www.cloudera.com/blog/2012/02/introducing-cdh5/
下载所需rpm包,根据官方文档,一路yum安装,最后配置即可


这里我要介绍的是通过cloudera-manager来安装cdh5的安装过程
cloudera-manager也是apache基金会的产品,目前有免费版与商业版两种,免费版只支持50个节点,商业版不限制
当然一般情况50个节点也就够用了,这里我们用的就是cloudera-manager的免费版
官方下载地址:https://ccp.cloudera.com/display/SUPPORT/Downloads
1.安装环境
node1:192.168.1.124 Centos6.2系统
node2:192.168.1.163 centos6.2系统
iptables关闭
selinux关闭
2.安装cloudera-manager
node1:
官方下载后会得到一个可执行文件cloudera-manager-installer.bin
这里需要我们事先安装X Window System包组,原因很简单,图形化安装界面
这里安装时会自动yum安装他所需要的包,大约有100多M,yum安装,自动下载的,由于是外国的源,加上公司限速,天朝的种种策略等,经常会导致卡死不动,一天也安装不完的状况
我的安装方法是直接中断图形化界面的安装,就是直接kill掉,这时候他需要导入的yum源已经导入到我们的系统里了
根据yum源里面的连接http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/4.0.4/
自己手动下载,如下包

cdh4云存储最实用搭建方法

下载完成后,使用yum本地安装
yum localinstall --nogpGCheck *.rpm
yum安装完成后,重新运行cloudera-manager-installer.bin完成安装(如果安装失败,提示已安装,则进入/usr/share/cmf目录中,删除掉uninstall-cloudera-manager.sh文件即可)
附1:两台主机都要装,只是一台运行图形化界面,作为控制台,另一台不用动,这里我是使用的node1节点作为控制台
附2:两台主机jdk也要实现安装好,否则也会自动下载安装,推荐用rpm包安装的jdk
3.安装cdh5
①.cloudera-manager安装完成后,会自动启动,可以通过netstat -tNLP发现启动了7182,7180等端口

cdh4云存储最实用搭建方法


通过网页连接http://192.168.1.124:7180进入cloudera-manager的WEB管理入口,默认管理员用户admin,密码admin

cdh4云存储最实用搭建方法


登录之后会提示如下框,即是使用免费版还是商业版,我们选择免费使用

cdh4云存储最实用搭建方法


②.之后就是完全cloudera-manager控制台web界面的安装,很简单
首先搜索主机,将两主机ip填入,搜索到主机,然后选择安装

cdh4云存储最实用搭建方法


安装版本cdh5,等等,然后就是读条的安装页面,这里跟安装cloudera-manager一样,yum源文件出来之后,直接中断,然后回到系统kill掉yum进程,关闭页面
,通过/etc/yum.repos.d/cloudera-cdh5.repo查看所需下载软件连接http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/4/下载如下rpm包

cdh4云存储最实用搭建方法


然后跟上面一样,yum localinstall --nogpgcheck *.rpm
最后重新打开http://192.168.1.124:7180页面重新对主机进行安装
附1:cloudera-manager控制台对于已经安装过的软件包不再重新下载安装
附2:如果网速好的话,可以不用中断,直接图形化界面等待安装完成,但是如果失败了,千万不要点重试,重试会卸载已安装内容,也就是重头再来,由于外国的源,网速神马的都懂的
③.安装玩以上内容后,会有个主机检测,主机多的话会比较慢,这个看个人而定,检测完之后,可以选择服务,这里我选择的是hbase,hadoop,zookeeper,然后启动服务
服务状况实时检测

cdh4云存储最实用搭建方法


主机状况实时检测

cdh4云存储最实用搭建方法


进入主机,打开hbase shell测试

cdh4云存储最实用搭建方法


到这里cdh5框架就可以使用了
附:对于没有选择的服务,默认也是不启动的,这个不用担心,如果需要用到hive等,可自行手动执行

您可能感兴趣的文档:

--结束END--

本文标题: cdh4云存储最实用搭建方法

本文链接: https://www.lsjlt.com/news/38828.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • sql中外码怎么设置
    sql 中外码设置步骤:确定父表和子表。在子表中创建外码列,引用父表主键。使用 foreign key 约束将外码列链接到父表主键。指定引用动作,以处理父表数据更改时的子表数据操作。 ...
    99+
    2024-05-15
  • sql中having是什么
    having 子句用于过滤分组结果,应用于分组后的数据集。它与 where 子句类似,但基于分组结果而不是原始数据。用法:1. 过滤分组后的聚合值。2. 根据分组后的...
    99+
    2024-05-15
  • 在sql中空值用什么表示
    在 sql 中,空值表示未知或不存在的值,可使用 null、空字符串或特殊值表示。处理空值的方法包括使用操作符(is null/is not null)、coalesce 函数(返回第一...
    99+
    2024-05-15
    oracle
  • sql中number什么意思
    sql 中的 number 类型用于存储数值数据,包括小数和整数,特别适合货币、度量和科学数据。其精度由 scale(小数点位数)和 precision(整数字段和小数字段总位数)决定。...
    99+
    2024-05-15
  • sql中空值赋值为0怎么写
    可以通过使用 coalesce() 函数将 sql 中的空值替换为指定值(如 0)。coalesce() 的语法为 coalesce(expression, replacement),其...
    99+
    2024-05-15
  • sql中revoke语句的功能
    revoke 语句用于撤销指定用户或角色的权限或角色成员资格。可撤销的权限包括 select、insert、update、delete 等,撤销的对象类型包括表、视图、存储过程...
    99+
    2024-05-15
    敏感数据
  • sql中REVOKE是什么意思
    revoke 是 sql 中用于撤销用户或角色对数据库对象权限的命令。它通过撤销权限类型、对象级别和目标权限来实现:权限类型:撤销 select、insert、update、d...
    99+
    2024-05-15
  • sql中sp是什么意思
    sql中的sp是存储过程的缩写,它是一种预编译的、已命名的sql语句块,存储在数据库中,可以被用户通过简单命令调用。存储过程的特点有:可重用性、模块化、性能优化、安全性、事务支持。存储过...
    99+
    2024-05-15
    敏感数据
  • sql中references是什么意思
    sql 中的 references 关键字用于在外键约束中定义表之间的父-子关系。外键约束确保子表中的行都引用父表中存在的行,从而维护数据完整性。references 语法的格式为:fo...
    99+
    2024-05-15
  • sql中判断字段为空怎么写
    sql 中可通过 4 种方法判断字段是否为空:1)is null 运算符;2)is not null 运算符;3)coalesce() 函数;4)case 语句。例如,查询所有 colu...
    99+
    2024-05-15
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作