iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >1、Python大数据应用——部署Had
  • 376
分享到

1、Python大数据应用——部署Had

数据Python 2023-01-31 06:01:59 376人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

python大数据应用简介 简介:目前业界主流存储与分析平台以hadoop为主的开源生态圈,mapReduce作为Hadoop的数据集的并行运算模型,除了提供Java编写MapReduce任务外,还兼容了Streaming方式,可以使用任意

python大数据应用简介

简介:目前业界主流存储与分析平台以hadoop为主的开源生态圈,mapReduce作为Hadoop的数据集的并行运算模型,除了提供Java编写MapReduce任务外,还兼容了Streaming方式,可以使用任意脚本语言来编写MapReduce任务,优点是开发简单且灵活。


Hadoop环境部署

1、部署Hadoop需要Master访问所有Slave主机实现无密码登陆,即配置账号公钥认证。

2、Master主机安装jdk环境

yum安装方式:yum install -y java-1.6.0-openjdk*

配置Java环境变量:vi /etc/profile
JAVA_HOME=/usr/lib/JVM/java-1.6.0-openjdk-1.6.0.41.x86_64
JRE_HOME=$JAVA_HOME/jre
CLASS_PATH=::$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
export JAVA_HOME JRE_HOME CLASS_PATH PATH

使配置文件生效:source /etc/profile 

3、Master主机安装Hadoop

3.1、下载Hadoop,解压到/usr/local目录下

3.2、修改hadoop-env.sh中java环境变量

export JAVA_HOME=/usr/lib/jvm/java-1.6.0-openjdk-1.6.0.41.x86_64

3.3、修改core-site.xml(Hadoop core的配置文件)

<configuration>
<property>
        <name>hadoop.tmp.dir</name>
        <value>/data/tmp/hadoop-${user.name}</value>
</property>
<property>
        <name>fs.default.name</name>
        <value>hdfs://192.168.1.1:9000</value>
</property>
</configuration>

3.4、修改hdfs-site.xml(Hadoop的HDFS组件的配置项)

<configuration>
<property>
        <name>dfs.name.dir</name>
        <value>/data/tmp/name</value>
</property>
<property>
        <name>dfs.data.dir</name>
        <value>/data/hdfs/data</value>
</property>
<property>
        <name>dfs.datanode.max.xcievers</name>
        <value>4096</value>
</property>
<property>
        <name>dfs.replication</name>
        <value>2</value>
</property>
</configuration>

3.5、修改mapred-site.xml(配置map-reduce组件的属性,包括jobtracker和tasktracker)

<configuration>
<property>
        <name>mapred.job.tracker</name>
        <value>192.168.1.1:9001</value>
</property>
</configuration>

3.6、修改masters,slaves配置文件

masters文件

192.168.1.1

slaves文件

192.168.1.1
192.168.1.2
192.168.1.3

4、Slave主机配置

4.1、配置和Master主机一样的JDK环境,目标路径保持一致

4.2、将Master主机配置好的hadoop环境复制到Slave主机上

5、配置防火墙

master主机

iptables -I INPUT -s 192.168.1.0/24 -p tcp --dport 50030 -j ACCEPT
iptables -I INPUT -s 192.168.1.0/24 -p tcp --dport 50070 -j ACCEPT
iptables -I INPUT -s 192.168.1.0/24 -p tcp --dport 9000 -j ACCEPT
iptables -I INPUT -s 192.168.1.0/24 -p tcp --dport 90001 -j ACCEPT

Slave主机

iptables -I INPUT -s 192.168.1.0/24 -p tcp --dport 50075 -j ACCEPT
iptables -I INPUT -s 192.168.1.0/24 -p tcp --dport 50060 -j ACCEPT
iptables -I INPUT -s 192.168.1.1 -p tcp --dport 50010 -j ACCEPT

6、检验结果

6.1、在Master主机上执行启动命令(在安装目录底下)

./bin/start-all.sh

所示结果如下,表示启动成功
1、Python大数据应用——部署Hadoop

6.2、在Master主机上测试MapReduce示例

./bin/hadoop jar hadoop-examples-1.2.1.jar pi 10 100

所示结果如下,表示配置成功
1、Python大数据应用——部署Hadoop

7、补充:访问Hadoop提供的管理页面

Map/Reduce管理地址:192.168.1.1:50030
1、Python大数据应用——部署Hadoop
HDFS管理地址:192.168.1.1:50070
1、Python大数据应用——部署Hadoop

--结束END--

本文标题: 1、Python大数据应用——部署Had

本文链接: https://www.lsjlt.com/news/189729.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 1、Python大数据应用——部署Had
    Python大数据应用简介 简介:目前业界主流存储与分析平台以Hadoop为主的开源生态圈,MapReduce作为Hadoop的数据集的并行运算模型,除了提供Java编写MapReduce任务外,还兼容了Streaming方式,可以使用任意...
    99+
    2023-01-31
    数据 Python
  • 如何部署MongoDB数据库应用
    这篇文章主要介绍了如何部署MongoDB数据库应用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇如何部署MongoDB数据库应用文章都会有所收获,下面我们一起来看看吧。一、MongoDB 简介MongoDB 是...
    99+
    2023-06-29
  • 大数据NoSQL数据库HBase集群部署
    目录 1.  简介 2.  安装 1. HBase依赖Zookeeper、JDK、Hadoop(HDFS),请确保已经完成前面 2. 【node1执行】下载HBase安装包 3. 【node1执行】,修改配置文件,修改conf/hbase-...
    99+
    2023-10-23
    大数据 nosql hbase java 分布式 服务器
  • 大数据报表工具都有哪些应用部署方式
    本篇文章为大家展示了大数据报表工具都有哪些应用部署方式,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。回答这个问题之前,我们先来看看报表工具到目前为止都有哪些形态,虽然国产的大部分都是 java 语言...
    99+
    2023-06-03
  • k8s怎么部署大数据集群
    部署大数据集群在Kubernetes上通常需要使用一些特定的工具和组件,以下是一种常见的部署方法: 使用Helm安装Hadoop...
    99+
    2024-04-02
  • 怎么用Docker部署一个Python应用
    本文小编为大家详细介绍“怎么用Docker部署一个Python应用”,内容详细,步骤清晰,细节处理妥当,希望这篇“怎么用Docker部署一个Python应用”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。前言在使用...
    99+
    2023-07-02
  • 使用Docker部署MongoDB数据库
    要在Docker中部署MongoDB数据库,可以按照以下步骤操作: 下载MongoDB镜像: docker pull mongo...
    99+
    2024-04-25
    Docker
  • 如何进行Python应用容器化部署
    如何进行Python应用容器化部署,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。 1. 简介Docker 是目前主流...
    99+
    2024-04-02
  • Python ORM 在大数据项目中的应用
    对象关系映射(ORM)是一种编程技术,允许开发人员使用对象编程语言来操作数据库,而无需直接编写 SQL 查询。Python 中的 ORM 工具(例如 SQLAlchemy、Peewee 和 Django ORM)简化了大数据项目的数据库交...
    99+
    2024-03-15
    ORM
  • 如何使用Docker部署mysql数据库
    今天小编给大家分享一下如何使用Docker部署mysql数据库的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。一、检查系统版本...
    99+
    2023-07-05
  • Docker部署用Python编写的Web应用的实践
    目录1. 安装 docker2. 编写代码3. 编写 Dockerfile4. 上传镜像5. 修改镜像1. 安装 docker 在 WSL2 中安装 docker https://w...
    99+
    2024-04-02
  • 从0到1构建springbootweb应用镜像并使用容器部署的过程
    目录一、生成镜像的两种方法1.1、使用commit生成镜像1.1.1、拉取Centos基础镜像1.1.2、启动Centos容器并安装Go1.1.3、commit生成新镜像1.1.4、...
    99+
    2023-03-19
    springboot web应用镜像构建 springboot web容器部署
  • 大数据Atlas的部署和维护流程是怎样的
    大数据Atlas的部署和维护流程如下: 部署Atlas:首先需要安装和配置Hadoop集群,然后下载并安装Atlas的软件包,在...
    99+
    2024-03-08
    Atlas
  • 关于python进行批量数据备份及部署
    这里主要是自己工作中使用python进行备份和部署的一些介绍,其实用shell也可以实现,但是觉得略有些麻烦,于是进研究下了python,废话不多说了,直接上干货,以下是我的研究成果:首先需要导入fabric模块,该模块其实说白了就是一个库...
    99+
    2023-01-31
    批量 数据备份 python
  • 5分钟教会你用Docker部署一个Python应用
    目录前言1. Dockerfile 描述文件2. 实战一下2-1 项目开发2-2 编写 Dockerfile2-3 构建镜像2-4 运行镜像容器2-5 测试一下3. 总结前言 在使用...
    99+
    2024-04-02
  • 怎么使用docker-compose部署mysql数据库
    要使用docker-compose部署MySQL数据库,需要按照以下步骤操作: 首先,确保你已经安装了Docker和docker...
    99+
    2024-04-09
    mysql
  • 【大数据】通过 docker-compose 快速部署 MinIO 保姆级教程
    文章目录 一、概述二、MinIO 与 Ceph 对比1)架构设计对比2)数据一致性对比3)部署和管理对比4)生态系统和兼容性对比 三、前期准备1)部署 docker2)部署 docker...
    99+
    2023-09-01
    大数据 docker minio
  • 小程序应用的Python服务器部署高配,
    上一篇文章,“小程序创业最低配置部署,腾讯云折扣秒杀阿里云!”介绍了小程序项目启动时的最低配置服务器选择,但当项目良好发展时,还是要把服务器配置调整到标准水平,承受住日益增长的流量访问。 随着Python的流行,直接用Python来部署W...
    99+
    2023-01-31
    服务器 程序 Python
  • 云服务器部署数据库怎么用
    云服务器部署数据库是使用PostgreSQL数据库,可以通过以下步骤使用云服务器部署数据库: 打开云服务器控制台: 在浏览器中,输入"云服务器控制台"按钮,然后使用"http://localhost:3001"命令登录云服务器控制台。 ...
    99+
    2023-10-26
    服务器 数据库
  • Rancher Server单容器如何部署使用外部数据库
    这期内容当中小编将会给大家带来有关Rancher Server单容器如何部署使用外部数据库,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Rancher 除了使用内部的数据库,你可以启动一个Ran...
    99+
    2023-06-19
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作