欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python?PySpark案例實(shí)戰(zhàn)教程

 更新時(shí)間:2023年09月12日 10:28:33   作者:加油吧少年時(shí)代  
PySpark是由Spark官方開發(fā)的Python語(yǔ)言第三方庫(kù),Python開發(fā)者可以使用pip程序快速的安裝PySpark并像其它三方庫(kù)那樣直接使用,本文給大家介紹Python?PySpark案例實(shí)戰(zhàn),感興趣的朋友一起看看吧

為什么要學(xué)習(xí)PySpark?

Spark對(duì)Python語(yǔ)言的支持,重點(diǎn)體現(xiàn)在,Python第三方庫(kù):PySpark之上。

PySpark是由Spark官方開發(fā)的Python語(yǔ)言第三方庫(kù)。

Python開發(fā)者可以使用pip程序快速的安裝PySpark并像其它三方庫(kù)那樣直接使用。

 PySpark庫(kù)的安裝

在”CMD”命令提示符程序內(nèi),輸入:

pip install pyspark

或使用國(guó)內(nèi)代理鏡像網(wǎng)站(清華大學(xué)源)

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspark

構(gòu)建PySpark執(zhí)行環(huán)境入口對(duì)象

想要使用PySpark庫(kù)完成數(shù)據(jù)處理,首先需要構(gòu)建一個(gè)執(zhí)行環(huán)境入口對(duì)象。

PySpark的執(zhí)行環(huán)境入口對(duì)象是:類 SparkContext 的類對(duì)象

PySpark的編程模型 

 SparkContext類對(duì)象,是PySpark編程中一切功能的入口。

  • 數(shù)據(jù)輸入:通過(guò)SparkContext完成數(shù)據(jù)讀取
  • 數(shù)據(jù)計(jì)算:讀取到的數(shù)據(jù)轉(zhuǎn)換為RDD對(duì)象,調(diào)用RDD的成員方法完成計(jì)算
  • 數(shù)據(jù)輸出:調(diào)用RDD的數(shù)據(jù)輸出相關(guān)成員方法,將結(jié)果輸出到list、元組、字典、文本文件、數(shù)據(jù)庫(kù)等

到此這篇關(guān)于Python PySpark案例實(shí)戰(zhàn)的文章就介紹到這了,更多相關(guān)Python PySpark案例內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評(píng)論