欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

從PySpark中的字符串獲取列表方法講解

 更新時間:2021年12月19日 10:01:22   作者:java學(xué)習之路  
在本篇內(nèi)容里小編給大家分享的是一篇關(guān)于從PySpark中的字符串獲取列表方法講解及相關(guān)實例,有需要的朋友們跟著學(xué)習下。

在 PySpark 中是否有類似eval的功能。

我正在嘗試將 Python 代碼轉(zhuǎn)換為 PySpark

我正在查詢一個數(shù)據(jù)框,并且其中一列具有數(shù)據(jù),如下所示,但采用字符串格式。

[{u'date': u'2015-02-08', u'by': u'abc@gg.com', u'value': u'NA'}, {u'date': u'2016-02-08', u'by': u'dfg@yaa.com', u'value': u'applicable'}, {u'date': u'2017-02-08', u'by': u'wrwe@hot.com', u'value': u'ufc'}]

假設(shè)“ x”是在數(shù)據(jù)框中保存此值的列。

現(xiàn)在,我想傳遞該字符串列“ x”并獲取列表,以便可以將其傳遞給 mapPartition 函數(shù)。

我想避免迭代驅(qū)動程序上的每一行,這就是我這樣想的原因。

在 Python 中使用 eval()函數(shù)(如果已使用):我得到以下輸出:

x = "[{u'date': u'2015-02-08', u'by': u'abc@gg.com', u'value': u'NA'}, {u'date': u'2016-02-08', u'by': u'dfg@yaa.com', u'value': u'applicable'}, {u'date': u'2017-02-08', u'by': u'wrwe@hot.com', u'value': u'ufc'}]"

list = eval(x)

for i in list:  print i

輸出:(這也是我在 PySpark 中想要的)

{u'date': u'2015-02-08', u'by': u'abc@gg.com', u'value': u'NA'}
{u'date': u'2016-02-08', u'by': u'dfg@yaa.com', u'value': u'applicable'}
{u'date': u'2017-02-08', u'by': u'wrwe@hot.com', u'value': u'ufc'}

如何在 PySpark 中做到這一點?

實例擴展:

df.schema: StructType(List(StructField(id,StringType,true),StructField(recs,StringType,true)))
|id     | recs |

|ABC|[66, [["AB", 10]]]
|XYZ|[66, [["XY", 10], ["YZ", 20]]]
|DEF|[66, [["DE", 10], ["EF", 20], ["FG", 30]]]  

我正試著把這些單子弄平

|id | like_id
|ABC|AB|
|XYZ|XY|
|XYZ|YZ|
|DEF|DE|
|DEF|EF|
|DEF|FG|

到此這篇關(guān)于從PySpark中的字符串獲取列表方法講解的文章就介紹到這了,更多相關(guān)如何從 PySpark 中的字符串獲取列表內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • OpenCV計算平均值cv::mean實例代碼

    OpenCV計算平均值cv::mean實例代碼

    函數(shù)cv::mean計算數(shù)組元素的平均值M,每個通道都是獨立的,并返回這個平均值,這篇文章主要給大家介紹了關(guān)于OpenCV計算平均值cv::mean的相關(guān)資料,需要的朋友可以參考下
    2021-08-08
  • 詳解pandas apply 并行處理的幾種方法

    詳解pandas apply 并行處理的幾種方法

    這篇文章主要介紹了詳解pandas apply 并行處理的幾種方法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習或者工作具有一定的參考學(xué)習價值,需要的朋友們下面隨著小編來一起學(xué)習學(xué)習吧
    2021-02-02
  • python爬蟲要用到的庫總結(jié)

    python爬蟲要用到的庫總結(jié)

    在本篇內(nèi)容中小編給大家整理的是關(guān)于python爬蟲要用到的庫總結(jié)內(nèi)容,需要的朋友們可以學(xué)習下。
    2020-07-07
  • Python實現(xiàn)選擇排序

    Python實現(xiàn)選擇排序

    選擇法也算是入門的一種排序算法,比起冒泡法,它的方法巧妙了一些,它的出發(fā)點在于“挑”,每次挑選數(shù)組的最值,與前置元素換位,然后繼續(xù)挑選剩余元素的最值并重復(fù)操作。個人認為選擇排序的意義不在于排序本身,而在于挑選和置換的方法,對于一些問題很有幫助。
    2017-06-06
  • Python socket實現(xiàn)的簡單通信功能示例

    Python socket實現(xiàn)的簡單通信功能示例

    這篇文章主要介紹了Python socket實現(xiàn)的簡單通信功能,結(jié)合實例形式分析了Python socket通信的相關(guān)概念、原理、客戶端與服務(wù)器端實現(xiàn)技巧以及socketserver模塊多并發(fā)簡單實現(xiàn)方法,需要的朋友可以參考下
    2018-08-08
  • 用TensorFlow實現(xiàn)lasso回歸和嶺回歸算法的示例

    用TensorFlow實現(xiàn)lasso回歸和嶺回歸算法的示例

    本篇文章主要介紹了用TensorFlow實現(xiàn)lasso回歸和嶺回歸算法的示例,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-05-05
  • python中的opencv?圖像梯度

    python中的opencv?圖像梯度

    這篇文章主要介紹了python中的opencv?圖像梯度,圖像梯度計算的是圖像變化的速度,圖像梯度計算需要求導(dǎo)數(shù),但是圖像梯度一般通過計算像素值的差來得到梯度的近似值,下文詳細介紹需要的小伙伴可以參考一下
    2022-06-06
  • pycharm?使用conda虛擬環(huán)境的詳細配置過程

    pycharm?使用conda虛擬環(huán)境的詳細配置過程

    這篇文章主要介紹了pycharm?使用conda虛擬環(huán)境,本文給大家介紹的非常詳細,對大家的學(xué)習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2023-03-03
  • PyTorch中的C++擴展實現(xiàn)

    PyTorch中的C++擴展實現(xiàn)

    這篇文章主要介紹了PyTorch中的C++擴展實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習或者工作具有一定的參考學(xué)習價值,需要的朋友們下面隨著小編來一起學(xué)習學(xué)習吧
    2020-04-04
  • Python代碼部署的三種加密方案

    Python代碼部署的三種加密方案

    本文主要介紹了Python代碼部署的三種加密方案,主要介紹了代碼混淆、代碼編譯、代碼打包這三種,具有一定的參考價值,感興趣的可以了解一下
    2023-02-02

最新評論