欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

如何將PySpark導(dǎo)入Python的放實(shí)現(xiàn)(2種)

 更新時(shí)間:2020年04月26日 15:00:49   作者:Lauhoman  
這篇文章主要介紹了如何將PySpark導(dǎo)入Python的放實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

方法一

使用findspark

使用pip安裝findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

導(dǎo)入你要使用的pyspark庫(kù)

>>> from pyspark import *

優(yōu)點(diǎn):簡(jiǎn)單快捷
缺點(diǎn):治標(biāo)不治本,每次寫(xiě)一個(gè)新的Application都要加載一遍findspark

方法二

把預(yù)編譯包中的Python庫(kù)文件添加到Python的環(huán)境變量中

export SPARK_HOME=你的PySpark目錄
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

優(yōu)點(diǎn):一勞永逸
缺點(diǎn):對(duì)于小白可能不太了解環(huán)境變量是什么

問(wèn)題1、ImportError: No module named pyspark

現(xiàn)象:

  • 已經(jīng)安裝配置好了PySpark,可以打開(kāi)PySpark交互式界面;
  • 在Python里找不到pysaprk。

參照上面解決

問(wèn)題2、ImportError: No module named ‘py4j'

現(xiàn)象:

已經(jīng)安裝配置好了PySpark,可以打開(kāi)PySpark交互式界面;
按照上面的b方式配置后出現(xiàn)該問(wèn)題。
解決方法:

把py4j添加到Python的環(huán)境變量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:這里的py4j-x.xx-src.zip根據(jù)自己電腦上的py4j版本決定。

測(cè)試成功的環(huán)境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 預(yù)編譯包
  • OS: Mac OSX 10.11.1

參考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此這篇關(guān)于如何將PySpark導(dǎo)入Python的放實(shí)現(xiàn)(2種)的文章就介紹到這了,更多相關(guān)PySpark導(dǎo)入Python內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論