pandas將list數(shù)據(jù)拆分成行或列的實(shí)現(xiàn)
數(shù)據(jù)
import numpy as np import pandas as pd data = [{'Name': '小明', 'Chinese': [70, 80], 'Math': [90, 80]}, {'Name': '小紅', 'Chinese': [70, 80, 90], 'Math': [90, 80, 70]}] data = pd.DataFrame(data) data
拆分成行
def split_row(data, column): '''拆分成行 :param data: 原始數(shù)據(jù) :param column: 拆分的列名 :type data: pandas.core.frame.DataFrame :type column: str ''' row_len = list(map(len, data[column].values)) rows = [] for i in data.columns: if i == column: row = np.concatenate(data[i].values) else: row = np.repeat(data[i].values, row_len) rows.append(row) return pd.DataFrame(np.dstack(tuple(rows))[0], columns=data.columns) split_row(data, column='Chinese')
拆分成列
from copy import deepcopy def split_col(data, column): '''拆分成列 :param data: 原始數(shù)據(jù) :param column: 拆分的列名 :type data: pandas.core.frame.DataFrame :type column: str ''' data = deepcopy(data) max_len = max(list(map(len, data[column].values))) # 最大長度 new_col = data[column].apply(lambda x: x + [None]*(max_len - len(x))) # 補(bǔ)空值,None可換成np.nan new_col = np.array(new_col.tolist()).T # 轉(zhuǎn)置 for i, j in enumerate(new_col): data[column + str(i)] = j return data split_col(data, column='Chinese')
其他情況
1. 批量處理+不要原列
def split_col(data, columns): '''拆分成列 :param data: 原始數(shù)據(jù) :param columns: 拆分的列名 :type data: pandas.core.frame.DataFrame :type columns: list ''' for c in columns: new_col = data.pop(c) max_len = max(list(map(len, new_col.values))) # 最大長度 new_col = new_col.apply(lambda x: x + [None]*(max_len - len(x))) # 補(bǔ)空值,None可換成np.nan new_col = np.array(new_col.tolist()).T # 轉(zhuǎn)置 for i, j in enumerate(new_col): data[c + str(i)] = j split_col(data, columns=['Chinese','Math']) data
2. 帶int和list數(shù)據(jù)
轉(zhuǎn)成這樣:
import numpy as np import pandas as pd data = [{'Name': '小愛', 'Chinese': 70, 'Math': 90}, {'Name': '小明', 'Chinese': [70, 80], 'Math': [90, 80]}, {'Name': '小紅', 'Chinese': [70, 80, 90], 'Math': [90, 80, 70]}] data = pd.DataFrame(data) def split_col(data, columns): '''拆分成列 :param data: 原始數(shù)據(jù) :param columns: 拆分的列名 :type data: pandas.core.frame.DataFrame :type columns: list ''' for c in columns: new_col = data.pop(c) max_len = max(list(map(lambda x:len(x) if isinstance(x, list) else 1, new_col.values))) # 最大長度 new_col = new_col.apply(lambda x: x+[None]*(max_len - len(x)) if isinstance(x, list) else [x]+[None]*(max_len - 1)) # 補(bǔ)空值,None可換成np.nan new_col = np.array(new_col.tolist()).T # 轉(zhuǎn)置 for i, j in enumerate(new_col): data[c + str(i)] = j split_col(data, columns=['Chinese','Math']) data
參考文獻(xiàn)
Python Pandas list(列表)數(shù)據(jù)列拆分成多行的方法
到此這篇關(guān)于pandas將list數(shù)據(jù)拆分成行或列的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas list數(shù)據(jù)拆分內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Win10下python 2.7與python 3.7雙環(huán)境安裝教程圖解
這篇文章主要介紹了Win10下python 2.7與python 3.7雙環(huán)境安裝教程,本文圖文并茂給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-10-10Python用tkinter實(shí)現(xiàn)自定義記事本的方法詳解
這篇文章主要為大家詳細(xì)介紹了Python用tkinter實(shí)現(xiàn)自定義記事本的方法,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助2022-03-03Python+Tkinter實(shí)現(xiàn)股票K線圖的繪制
K線圖又稱蠟燭圖,常用說法是“K線”。K線是以每個(gè)分析周期的開盤價(jià)、最高價(jià)、最低價(jià)和收盤價(jià)繪制而成。本文將利用Python+Tkinter實(shí)現(xiàn)股票K線圖的繪制,需要的可以參考一下2022-08-08python遍歷迭代器自動(dòng)鏈?zhǔn)教幚頂?shù)據(jù)的實(shí)例代碼
迭代器也是用來遍歷對象成員的,下面這篇文章主要給大家介紹了關(guān)于python遍歷迭代器自動(dòng)鏈?zhǔn)教幚頂?shù)據(jù)的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-01-01一步步教你用Python實(shí)現(xiàn)2048小游戲
相信2048這個(gè)游戲?qū)Υ蠹襾碚f一定不陌生,下面這篇文章就主要給大家介紹了怎么用Python實(shí)現(xiàn)2048小游戲,文中通過注釋與示例代碼介紹的很詳細(xì),相信對大家的理解和學(xué)習(xí)具有一定的參考借鑒價(jià)值,有需要的朋友們一起來看看吧。2017-01-01python下paramiko模塊實(shí)現(xiàn)ssh連接登錄Linux服務(wù)器
這篇文章主要介紹了python下paramiko模塊實(shí)現(xiàn)ssh連接登錄Linux服務(wù)器的方法,實(shí)例分析了paramiko模塊實(shí)現(xiàn)ssh連接的具體用法,需要的朋友可以參考下2015-06-06Pytorch: 自定義網(wǎng)絡(luò)層實(shí)例
今天小編就為大家分享一篇Pytorch: 自定義網(wǎng)絡(luò)層實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01