广告
返回顶部
首页 > 资讯 > 后端开发 > Python >Python安装spark的详细过程
  • 163
分享到

Python安装spark的详细过程

2024-04-02 19:04:59 163人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

目录一.配置版本二.配置环境 1.配置jdk2.配置spark3.配置hadoop三.PyCharm配置spark四.使用anconda中python环境配置spark&n

一.配置版本

Java JDK 1.8.0_111
Python 3.9.6
Spark 3.1.2
Hadoop 3.2.2

二.配置环境

 1.配置JDK

从官网下载相应JDK的版本安装,并进行环境变量的配置
(1)在系统变量新建JAVA_HOME,根据你安装的位置填写变量值

在这里插入图片描述

(2)新建CLASSPATH
变量值:.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar;(注意前面所需的符号)

在这里插入图片描述

(3)点击Path

在这里插入图片描述

在其中进行新建:%JAVA_HOME%\bin

在这里插入图片描述

(4)配置好后进行确定
(5)验证,打开cmd,输入java -version和javac进行验证

在这里插入图片描述
在这里插入图片描述

此上说明jdk环境变量配置成功

2.配置Spark

(1)下载安装:
Spark官网:spark-3.1.2-bin-hadoop3.2下载地址

在这里插入图片描述

(2)解压,配置环境

在这里插入图片描述

(3)点击Path,进行新建:%SPARK_HOME%\bin,并确认
(4)验证,cmd中输入pyspark

在这里插入图片描述

这里提醒我们要安装Hadoop

3.配置Hadoop

(1)下载:
Hadoop官网:Hadoop 3.2.2下载地址

在这里插入图片描述

(2)解压,配置环境

在这里插入图片描述

注意:解压文件后,bin文件夹中可能没有以下两个文件:

在这里插入图片描述

下载地址:https://GitHub.com/cdarlint/winutils
配置环境变量CLASSPATH:%HADOOP_HOME%\bin\winutils.exe
(3)点击Path,进行新建:%HADOOP_HOME%\bin,并确认
(4)验证,cmd中输入pyspark

在这里插入图片描述

由上可以看出spark能运行成功,但是会出现如下警告:

WARN ProcfsMetricsGetter: Exception when trying to compute pagesize, as a result reporting of ProcessTree metrics is stopped

这里因为spark为3.x版本有相关改动,使用spar2.4.6版本不会出现这样的问题。
不改版本解决方式(因是警告,未尝试):
方式一:解决方法一
方式二:解决方法二

三.Pycharm配置spark

(1)Run–>Edit Configurations

在这里插入图片描述

(2)对Environment Variables进行配置

在这里插入图片描述

(3)File–>Settings–>Project Structure–>Add Content Root
找到spark-3.1.2-bin-hadoop3.2\python\lib下两个包进行添加

在这里插入图片描述

选择结果:

在这里插入图片描述

(4)测试


# 添加此代码,进行spark初始化
import findspark

findspark.init()


from datetime import datetime, date

from pyspark.sql import SparkSession

spark = SparkSession.builder.getOrCreate()

rdd = spark.sparkContext.parallelize([
    (1, 2., 'string1', date(2000, 1, 1), datetime(2000, 1, 1, 12, 0)),
    (2, 3., 'string2', date(2000, 2, 1), datetime(2000, 1, 2, 12, 0)),
    (3, 4., 'string3', date(2000, 3, 1), datetime(2000, 1, 3, 12, 0))
])
df = spark.createDataFrame(rdd, schema=['a', 'b', 'c', 'd', 'e'])
df.show()

运行结果:

在这里插入图片描述

四.使用anconda中python环境配置spark

 1.创建虚拟环境


conda create -n pyspark_env python==3.9.6

查看环境:


conda env list

运行结果:

在这里插入图片描述

2.安装pyspark

切换到pyspark_env并进行安装pyspark


pip install pyspark

在这里插入图片描述

3.环境配置

运行上面的实例,会出现以下错误:

在这里插入图片描述

这说明我们需要配置py4j,SPARK_HOME
SPARK_HOME:

在这里插入图片描述

PYTHONPATH设置:

在这里插入图片描述

HADOOP_HOME设置:

在这里插入图片描述

path中设置:

在这里插入图片描述

4.运行

在这里插入图片描述


# 添加此代码,进行spark初始化
import findspark

findspark.init()


from datetime import datetime, date

from pyspark.sql import SparkSession

spark = SparkSession.builder.getOrCreate()

rdd = spark.sparkContext.parallelize([
    (1, 2., 'string1', date(2000, 1, 1), datetime(2000, 1, 1, 12, 0)),
    (2, 3., 'string2', date(2000, 2, 1), datetime(2000, 1, 2, 12, 0)),
    (3, 4., 'string3', date(2000, 3, 1), datetime(2000, 1, 3, 12, 0))
])
df = spark.createDataFrame(rdd, schema=['a', 'b', 'c', 'd', 'e'])
df.show()

运行结果同上

到此这篇关于Python安装spark的文章就介绍到这了,更多相关Python安装spark内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python安装spark的详细过程

本文链接: https://www.lsjlt.com/news/154596.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Python安装spark的详细过程
    目录一.配置版本二.配置环境 1.配置JDK2.配置Spark3.配置Hadoop三.Pycharm配置spark四.使用anconda中python环境配置spark&n...
    99+
    2022-11-12
  • Apache安装的详细过程
    这篇文章主要讲解了“Apache安装的详细过程”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Apache安装的详细过程”吧!第一步:安装openssl1、解压软件:# tar xvfz op...
    99+
    2023-06-10
  • 安装MySQL的详细过程
    本篇内容主要讲解“安装MySQL的详细过程”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“安装MySQL的详细过程”吧!在日常开发学习中不可或少的需要用到MySQ...
    99+
    2022-10-18
  • Nagios的详细安装过程
    这篇文章主要讲解了“Nagios的详细安装过程”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Nagios的详细安装过程”吧!Nagios是一款企业级网络监控系统,它功能之强大,管理之简单,使...
    99+
    2023-06-16
  • PHPStorm2023详细安装过程
    文章目录 前言准备安装汉化解释器安装解释器配置预览查看(补充) 前言 PHPStorm是一款功能强大的PHP集成开发环境(IDE),具有众多优点: 1、强大的代码编辑功能:PHPS...
    99+
    2023-10-04
    php 网络安全 windows ide
  • zabbix2.4详细安装过程
    zabbix是现在比较主流的监控软件,有着较为普遍的使用 官网  www.zabbix.com 配置阿里云yum源http://repo.zabbix.com/zab...
    99+
    2022-10-18
  • Anaconda安装(过程详细)
    在本文开始之前,祝大家新年快乐,心想事成,事事顺利! 一、前言 Anaconda是一个开源的Python发行版本,用来管理Python相关的包,安装Anaconda可以很方便的切换不同的环境,使用不同的深度学习框架开发项目,本文将详细介绍A...
    99+
    2023-08-31
    python anaconda
  • Python中Pygame模块的详细安装过程
    首先: 确认自己安装有python(没有安装的同学可自行安装,这里我们不过多赘述) 确认安装有python之后,win+r打开cmd窗口,输入python查看自己的python版本 ...
    99+
    2022-11-11
  • Python安装和配置uWSGI的详细过程
    目录Python 安装 uWSGI添加并发和监控结合 Web 服务器使用部署 Django部署 Flask本文主要介绍如何部署简单的 WSGI 应用和常见的 Web 框架。 以 Ub...
    99+
    2022-11-11
  • centos8安装nginx1.9.1的详细过程
    1.17.9 更香,真的 nginx下载地址:https://nginx.org/download/ 1.下载nginx wget https://nginx.org/downlo...
    99+
    2022-11-12
  • window安装mysql的详细过程
    本篇内容主要讲解“window安装mysql的详细过程”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“window安装mysql的详细过程”吧!环境:Window...
    99+
    2022-10-18
  • Docker安装logstash的详细过程
    编辑docker-compose.yml,内容如下: version: '3' services: logstash02: image: logstash:6.4.1...
    99+
    2022-11-12
  • dockercompose安装etcd的详细过程
    1、下载docker-compose wget https://github.com/docker/compose/releases/download/v2.6.0/docker-c...
    99+
    2022-11-13
  • CentOS8.4安装Redis6.2.6的详细过程
     一、下载 官网:Redis   我们下载 Stable 稳定版 # cd /mydata # wget https://dow...
    99+
    2022-11-12
  • AlmaLinux9安装MySQL8.0.32的详细过程
    目录1、配置安装源2、安装MySQL3、配置MySQL4、修改配置文件5、启动MySQL6、安全配置1、配置安装源 # 安装 dnf install http://mirrors.u...
    99+
    2023-05-16
    AlmaLinux安装mysql AlmaLinux9安装mysql8.0.32 mysql8.0.32安装
  • centos8安装MongoDB的详细过程
    MongoDB是什么: MongoDB是一个棉线文档的开源NoSQL数据库管理系统。 MongoDB是一个开源,跨平台,面向文档的数据库管理系统。MongoDB是NoSQL(不仅是S...
    99+
    2022-11-12
  • 安装scikit-learn的详细过程
     1. 打开命令终端,检查Python和pip的版本. scikit-learn支持的Python版本是3.6及以上,pip版本最低为9.0.1. 2. 升级pip版本(可选).使用命令:   pip install --user --up...
    99+
    2023-09-18
    python 机器学习 sklearn
  • Ubuntu 15.10的详细安装过程
    这篇文章主要介绍“Ubuntu 15.10的详细安装过程”,在日常操作中,相信很多人在Ubuntu 15.10的详细安装过程问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Ubuntu 15.10的详细安装过程...
    99+
    2023-06-13
  • vmware安装win7的详细过程
      vmware虚拟机可以运行不同的操作系统,对电脑本身自带的系统没有任何影响,比电脑装双系统还更加的便利,那么如何使用vmware安装win7呢下面小编就把vmware安装win7系统的方法教给大家。  vmware安装win7步骤如下:...
    99+
    2023-07-14
  • macOS 安装 Homebrew 详细过程
    文章目录 macOS 安装 Homebrew 详细过程 Homebrew 简介 Homebrew 安装过程 设置环境变量 ...
    99+
    2023-08-30
    macos 策略模式 homebrew
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作