Python?PySpark案例實戰(zhàn)教程
為什么要學習PySpark?
Spark對Python語言的支持,重點體現(xiàn)在,Python第三方庫:PySpark之上。
PySpark是由Spark官方開發(fā)的Python語言第三方庫。
Python開發(fā)者可以使用pip程序快速的安裝PySpark并像其它三方庫那樣直接使用。
PySpark庫的安裝
在”CMD”命令提示符程序內(nèi),輸入:
pip install pyspark
或使用國內(nèi)代理鏡像網(wǎng)站(清華大學源)
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspark
構(gòu)建PySpark執(zhí)行環(huán)境入口對象
想要使用PySpark庫完成數(shù)據(jù)處理,首先需要構(gòu)建一個執(zhí)行環(huán)境入口對象。
PySpark的執(zhí)行環(huán)境入口對象是:類 SparkContext 的類對象
PySpark的編程模型
SparkContext類對象,是PySpark編程中一切功能的入口。
- 數(shù)據(jù)輸入:通過SparkContext完成數(shù)據(jù)讀取
- 數(shù)據(jù)計算:讀取到的數(shù)據(jù)轉(zhuǎn)換為RDD對象,調(diào)用RDD的成員方法完成計算
- 數(shù)據(jù)輸出:調(diào)用RDD的數(shù)據(jù)輸出相關成員方法,將結(jié)果輸出到list、元組、字典、文本文件、數(shù)據(jù)庫等
到此這篇關于Python PySpark案例實戰(zhàn)的文章就介紹到這了,更多相關Python PySpark案例內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
Python腳本實現(xiàn)音頻和視頻格式轉(zhuǎn)換
這篇文章主要為大家詳細介紹了Python如何通過腳本實現(xiàn)音頻和視頻格式轉(zhuǎn)換,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學習一下2025-03-03python輾轉(zhuǎn)相除法求最大公約數(shù)和最小公倍數(shù)的實現(xiàn)
這篇文章主要介紹了python輾轉(zhuǎn)相除法求最大公約數(shù)和最小公倍數(shù)的實現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-07-07Python3 多線程(連接池)操作MySQL插入數(shù)據(jù)
本文將結(jié)合實例代碼,介紹Python3 多線程(連接池)操作MySQL插入數(shù)據(jù),具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-06-06