欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python?PySpark案例實(shí)戰(zhàn)教程

 更新時(shí)間:2023年09月12日 10:28:33   作者:加油吧少年時(shí)代  
PySpark是由Spark官方開發(fā)的Python語言第三方庫,Python開發(fā)者可以使用pip程序快速的安裝PySpark并像其它三方庫那樣直接使用,本文給大家介紹Python?PySpark案例實(shí)戰(zhàn),感興趣的朋友一起看看吧

為什么要學(xué)習(xí)PySpark?

Spark對Python語言的支持,重點(diǎn)體現(xiàn)在,Python第三方庫:PySpark之上。

PySpark是由Spark官方開發(fā)的Python語言第三方庫。

Python開發(fā)者可以使用pip程序快速的安裝PySpark并像其它三方庫那樣直接使用。

 PySpark庫的安裝

在”CMD”命令提示符程序內(nèi),輸入:

pip install pyspark

或使用國內(nèi)代理鏡像網(wǎng)站(清華大學(xué)源)

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspark

構(gòu)建PySpark執(zhí)行環(huán)境入口對象

想要使用PySpark庫完成數(shù)據(jù)處理,首先需要構(gòu)建一個(gè)執(zhí)行環(huán)境入口對象。

PySpark的執(zhí)行環(huán)境入口對象是:類 SparkContext 的類對象

PySpark的編程模型 

 SparkContext類對象,是PySpark編程中一切功能的入口。

  • 數(shù)據(jù)輸入:通過SparkContext完成數(shù)據(jù)讀取
  • 數(shù)據(jù)計(jì)算:讀取到的數(shù)據(jù)轉(zhuǎn)換為RDD對象,調(diào)用RDD的成員方法完成計(jì)算
  • 數(shù)據(jù)輸出:調(diào)用RDD的數(shù)據(jù)輸出相關(guān)成員方法,將結(jié)果輸出到list、元組、字典、文本文件、數(shù)據(jù)庫等

到此這篇關(guān)于Python PySpark案例實(shí)戰(zhàn)的文章就介紹到這了,更多相關(guān)Python PySpark案例內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論