广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Streaming执行Python版Wo
  • 451
分享到

Streaming执行Python版Wo

StreamingPythonWo 2023-01-31 07:01:43 451人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

一:先写map类import sys for line in sys.stdin: line = line.strip( ) Words = line.split( ) for word in words: print('%s\t%s' %

一:先写map类

import sys
for line in sys.stdin:
line = line.strip( )
Words = line.split( )
for word in words:
print('%s\t%s' % (word, 1))


二:写reduce类

import sys
current_word = None
current_count = 0
word = None
for line in sys.stdin:
line = line.strip()
word, count = line.split('\t',1)
try:
count = int(count)
except ValueError:
continue
if current_word == word:
current_count += count
else:
if current_word:
print('%s\t%s' % (current_word,current_count))
current_count = count
current_word = word
if current_word == word:
print('%s\t%s' % (current_word,current_count))


三:利用hadoop Streaming执行python的内容。

hadoop jar /home/hadoop/hadoop-2.6.0-cdh5.5.2/share/hadoop/tools/lib/hadoop-streaming-2.6.0-cdh5.5.2.jar  -input /user/hadoop/aa.txt -output /user/hadoop/Python_output -mapper "python mapper.py" -reducer "python reducer.py" -file mapper.py -file reducer.py  


说明:

输入和输出路径,本身就是hdfs上的,不需要特殊指定hdfs。

不加×××部分的引号的话,会报错误:

Error: java.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess failed with code 2

不加粉色部分的内容的话,会报错误:

Error: java.lang.RuntimeException: Error in configuring object


--结束END--

本文标题: Streaming执行Python版Wo

本文链接: https://www.lsjlt.com/news/191299.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Streaming执行Python版Wo
    一:先写map类import sys for line in sys.stdin: line = line.strip( ) words = line.split( ) for word in words: print('%s\t%s' %...
    99+
    2023-01-31
    Streaming Python Wo
  • Python执行hive sql
    该python脚本是用于执行hive脚本的,需要设置hive的可执行环境变量,其实质转化为shell下命令 hive -e 'sql语句’ 的方式执行,然后把结果重定向到控制台显示。注:由于该脚本是直接调用shell中的hive...
    99+
    2023-01-31
    Python hive sql
  • Celery 3 版本 定时执行与 异
    Celery 是一个 基于python开发的分布式异步消息任务队列,通过它可以轻松的实现任务的异步处理, 如果你的业务场景中需要用到异步任务,就可以考虑使用celery。 软件架构 环境 * python3.6.4 * django ...
    99+
    2023-01-31
    版本 Celery
  • 在Python中执行cmd
    目录1、使用os.system()方法2、使用os.popen()方法3、使用subprocess.Popen()1、使用os.system()方法 os.system用来执行cmd...
    99+
    2022-11-12
  • python执行cmd命令
    最典型的模块 一,执行cmd并读取返回值 import subprocess p = subprocess.Popen("ls", stdout=subprocess.PIPE, universal_newl...
    99+
    2023-01-31
    命令 python cmd
  • python paramiko 执行命令
    参考http://wangwei007.blog.51cto.com/blog/68019/1058726http://youzao.blog.51cto.com/3946111/1348903在node1上想对node2执行命令,标准的答...
    99+
    2023-01-31
    命令 python paramiko
  • python执行js文件
    #!/usr/bin/python # -*- coding: UTF-8 -*- import execjs,os #执行本地自定义的js print execjs.compile('function test(){' ...
    99+
    2023-01-31
    文件 python js
  • jenkins执行python脚本
    最新在研究使用jenkins做升级发布功能,大概的操作是选择产品、模块、环境等参数后,执行一个python脚本,脚本获取用户选择参数,然后执行发布动作。jenkins执行python脚本,需要使用python plugin具体使用方法:1、...
    99+
    2023-01-31
    脚本 jenkins python
  • python执行sql文件
    最近遇到一对需要执行的sql文件,sql文件内是insert 语句。如下: INSERT INTO hs_his.stock_industry VALUES ('采掘', '000006', '深振业A'); INSERT INT...
    99+
    2023-01-31
    文件 python sql
  • Python:执行命令行指令
    文章目录 简介os.systemos.popensubprocess.Popen()参考文献 简介 在python中,调用外部命令行(linux中的shell、或者windows中的cmd...
    99+
    2023-09-30
    python
  • Python并行执行for循环
    简介 在介绍如何最简单地利用 python 实现并行前,我们先来看一个简单的代码。 words = ['apple', 'bananan', 'cake', 'dumpling'] for word in words:...
    99+
    2023-01-31
    Python
  • Python执行py文件需要可执行权限吗
    这篇文章主要讲解了“Python执行py文件需要可执行权限吗”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python执行py文件需要可执行权限吗”吧!案例解析这个问题描述起来有点违反直觉,...
    99+
    2023-07-05
  • [python]map方法与并行执行
    文章也可参考: 我的个人博客 1. 内建方法map 内建map方法可以通过一个序列的方式来实现函数之间的映射, 并且串行执行。如: import time from datetime import datetime def ad...
    99+
    2023-01-31
    方法 python map
  • python之commands模块(执行
    commands模块用于执行Linux shell命令,要获得shell命令的输出只需要在后面参数写入('命令')就可以了。需要得到命令执行的状态则需要判断$的值, 在Python中有一个模块commands也很容易做到以上的效果。看一下三...
    99+
    2023-01-31
    模块 python commands
  • Windows 下 Python如何执行
    在Windows 系统下安装好Pyton后,直接在CMD命令提示符号里 输入CD .py的文件路径, 进入.py文件的所在目录,例如 cd c:\python33\study,进入这个目录后 输入 Python .py文件名 回车就执行了....
    99+
    2023-01-31
    Windows Python
  • python 实现异步执行
    python 实现异步执行 网上看到个例子怎样利用 threading 模块实现异步执行,自己动手试了试,写了个装饰器的例子,很实用。 把 async 分离开,放到一个单独的模块中,就可以把它当成一个模块实用 分析一下,...
    99+
    2023-01-31
    python
  • python远程执行命令
    import paramiko def sshclient_execmd(hostname, port, username, password, execmd):     paramiko.util.log_to_file("paramik...
    99+
    2023-01-31
    命令 python
  • python内部执行过程
    python内部执行过程如下:...
    99+
    2023-01-31
    过程 python
  • python之执行shell命令
    [root@s141 ~]# python Python 2.7.5 (default, Sep 15 2016, 22:37:39)  [GCC 4.8.5 20150623 (Red Hat 4.8.5-4)] on linux2 Ty...
    99+
    2023-01-31
    命令 python shell
  • 优化python执行效率
    开始优化前,写一个高级测试来证明原来代码很慢。你可能需要采用一些最小值数据集来复现它足够慢。通常一两个显示运行时秒的程序就足够处理一些改进的地方了。有一些基础测试来保证你的优化没有改变原有代码的行为也是很必要的。你也能够在很多次运行测试来优...
    99+
    2023-01-31
    效率 python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作