[{u'date': u'2015-02-08', u'by': u'abc@gg.com', u'value': u'NA'}, {u'date': u'2016-02-08', u'by': u'dfg@yaa.com', u'value': u'applicable'}, {u'date': u'2017-02-08', u'by': u'wrwe@hot.com', u'value': u'ufc'}]

假設“ x”是在數(shù)據(jù)框中保存此值的列。

現(xiàn)在，我想傳遞該字符串列“ x”并獲取列表，以便可以將其傳遞給 mapPartition 函數(shù)。

我想避免迭代驅動程序上的每一行，這就是我這樣想的原因。

在 Python 中使用 eval()函數(shù)(如果已使用)：我得到以下輸出：

x = "[{u'date': u'2015-02-08', u'by': u'abc@gg.com', u'value': u'NA'}, {u'date': u'2016-02-08', u'by': u'dfg@yaa.com', u'value': u'applicable'}, {u'date': u'2017-02-08', u'by': u'wrwe@hot.com', u'value': u'ufc'}]"

list = eval(x)

for i in list:  print i

輸出：(這也是我在 PySpark 中想要的)

{u'date': u'2015-02-08', u'by': u'abc@gg.com', u'value': u'NA'}
{u'date': u'2016-02-08', u'by': u'dfg@yaa.com', u'value': u'applicable'}
{u'date': u'2017-02-08', u'by': u'wrwe@hot.com', u'value': u'ufc'}

如何在 PySpark 中做到這一點？

實例擴展：

df.schema: StructType(List(StructField(id,StringType,true),StructField(recs,StringType,true)))

|id     | recs |

|ABC|[66, [["AB", 10]]]
|XYZ|[66, [["XY", 10], ["YZ", 20]]]
|DEF|[66, [["DE", 10], ["EF", 20], ["FG", 30]]]

我正試著把這些單子弄平

|id | like_id
|ABC|AB|
|XYZ|XY|
|XYZ|YZ|
|DEF|DE|
|DEF|EF|
|DEF|FG|

到此這篇關于從PySpark中的字符串獲取列表方法講解的文章就介紹到這了,更多相關如何從 PySpark 中的字符串獲取列表內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

OpenCV計算平均值cv::mean實例代碼
函數(shù)cv::mean計算數(shù)組元素的平均值M,每個通道都是獨立的,并返回這個平均值,這篇文章主要給大家介紹了關于OpenCV計算平均值cv::mean的相關資料,需要的朋友可以參考下
2021-08-08
詳解pandas apply 并行處理的幾種方法
這篇文章主要介紹了詳解pandas apply 并行處理的幾種方法，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2021-02-02
python爬蟲要用到的庫總結
在本篇內容中小編給大家整理的是關于python爬蟲要用到的庫總結內容，需要的朋友們可以學習下。
2020-07-07
Python實現(xiàn)選擇排序
選擇法也算是入門的一種排序算法，比起冒泡法，它的方法巧妙了一些，它的出發(fā)點在于“挑”，每次挑選數(shù)組的最值，與前置元素換位，然后繼續(xù)挑選剩余元素的最值并重復操作。個人認為選擇排序的意義不在于排序本身，而在于挑選和置換的方法，對于一些問題很有幫助。
2017-06-06
Python socket實現(xiàn)的簡單通信功能示例
這篇文章主要介紹了Python socket實現(xiàn)的簡單通信功能,結合實例形式分析了Python socket通信的相關概念、原理、客戶端與服務器端實現(xiàn)技巧以及socketserver模塊多并發(fā)簡單實現(xiàn)方法,需要的朋友可以參考下
2018-08-08
用TensorFlow實現(xiàn)lasso回歸和嶺回歸算法的示例
本篇文章主要介紹了用TensorFlow實現(xiàn)lasso回歸和嶺回歸算法的示例，小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2018-05-05
python中的opencv?圖像梯度
這篇文章主要介紹了python中的opencv?圖像梯度，圖像梯度計算的是圖像變化的速度，圖像梯度計算需要求導數(shù)，但是圖像梯度一般通過計算像素值的差來得到梯度的近似值，下文詳細介紹需要的小伙伴可以參考一下
2022-06-06
pycharm?使用conda虛擬環(huán)境的詳細配置過程
這篇文章主要介紹了pycharm?使用conda虛擬環(huán)境,本文給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2023-03-03
PyTorch中的C++擴展實現(xiàn)
這篇文章主要介紹了PyTorch中的C++擴展實現(xiàn)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-04-04
Python代碼部署的三種加密方案
本文主要介紹了Python代碼部署的三種加密方案，主要介紹了代碼混淆、代碼編譯、代碼打包這三種，具有一定的參考價值，感興趣的可以了解一下
2023-02-02