python 使用pandas同時對多列進行賦值
如dataframe
data1['月份']=int(month) #加入月份和企業(yè)名稱 data1['企業(yè)']=parmentname
可以增加單列,并賦值,如果想同時對多列進行賦值
data1['月份','企業(yè)']=int(month) , parmentname #加入月份和企業(yè)名稱
會出錯
ValueError: Length of values does not match length of index
data[['合計','平均']]='數(shù)據(jù)','月份'
類似這樣的,也無效
KeyError: “None of [Index([‘合計', ‘平均'], dtype=‘object')] are in the [columns]”
只有下例中:
import pandas as pd chengji=[[100,95,100,99],[90,98,99,100],[88,95,98,88],[99,98,97,87],[96.5,90,96,85],[94,94,93,91],[91, 99, 92, 87], [85, 88, 85, 90], [90, 92, 99, 88], [90, 88, 89, 81], [85, 89, 89, 82], [95, 87, 86, 88], [90, 97, 97, 98], [80, 92, 89, 98], [80, 98, 85, 81], [98, 88, 95, 92]] data=pd.DataFrame(chengji,columns=['語文','英語','數(shù)學(xué)','政治']) print (data) # data1=data[['數(shù)學(xué)','語文','英語','政治']] #排序 # data1=data1.reset_index(drop=True) #序列重建 # data1.index.names=['序號'] #序列重命名 # data1.index=data1.index+1 #序列從1開始 # print (data1) data=pd.DataFrame(chengji,columns=['語文','英語','數(shù)學(xué)','政治'],index=[i for i in range(1,len(chengji)+1)]) print (data) data[['合計','平均']]=data.apply(lambda x: (x.sum(), x.sum()/4),axis=1,result_type='expand') print (data[:]) data=pd.DataFrame(chengji,columns=['語文','英語','數(shù)學(xué)','政治'],index=[i for i in range(1,len(chengji)+1)]) print (data) data[['合計','平均']]=data.apply(lambda x:('數(shù)據(jù)','月份'),axis=1,result_type='expand') print (data[:])
應(yīng)用apply 并設(shè)置result_type=‘expand' 參數(shù)才可以。
先前的例子,用如下的方法就行了
data1[['月份','企業(yè)']]=data1.apply(lambda x:(int(month),parmentname),axis=1,result_type='expand') # data1['月份']=int(month) #加入月份和企業(yè)名稱 # data1['企業(yè)']=parmentname #print (data1)
后記:
如果'月份','企業(yè)'列存在,用如下也可,上例中,直接可以創(chuàng)建不存在的列。
data1.lco[:,['月份','企業(yè)']]=int(month),parmentname
或
data1[['月份','企業(yè)']]=int(month),parmentname
今天又遇到一個從某列截取字符串長度寫到另一列的,也一并寫到這里:
貨品列在原表中無,取貨品代碼的前12位。
totaldata = totaldata.reset_index(drop=False) totaldata['貨品'] = totaldata['貨品代碼'].apply(lambda x:x[:12])
后記:2020.5.17又遇到想新增兩列并賦值的問題
import numpy as np import pandas as pd from pandas import Series chengji = [['N', 95, 0], ['N', 100, 88], ['N', 88, 100], ['N', 66, 0]] data = pd.DataFrame(chengji, columns=['p', 'x', 'g']) data[['序號','列名']]=data[['p','x']] #pd.DataFrame(data[['p','x']])# .apply(lambda x : x ) print(data)
補充:pandas 的apply返回多列,并賦值
代碼如下:
import pandas as pd df_tmp = pd.DataFrame([ {"a":"data1", "cnt":100},{"a":"data2", "cnt":200}, ]) df_tmp a cnt data1 100 data2 200
方法一:使用apply 的參數(shù)result_type 來處理
def formatrow(row): a = row["a"] + str(row["cnt"]) b = str(row["cnt"]) + row["a"] return a, b df_tmp[["fomat1", "format2"]] = df_tmp.apply(formatrow, axis=1, result_type="expand") df_tmp a cnt fomat1 format2 data1 100 data1100 100data1 data2 200 data2200 200data2
方法二:使用zip打包返回結(jié)果來處理
df_tmp["fomat1-1"], df_tmp["format2-2"] = zip(*df_tmp.apply(formatrow, axis=1)) df_tmp a cnt fomat1 format2 fomat1-1 format2-2 data1 100 data1100 100data1 data1100 100data1 data2 200 data2200 200data2 data2200 200data2
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Python-jenkins模塊之folder相關(guān)操作介紹
這篇文章主要介紹了Python-jenkins模塊之folder相關(guān)操作介紹,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05Python開發(fā)中爬蟲使用代理proxy抓取網(wǎng)頁的方法示例
這篇文章主要介紹了Python開發(fā)中爬蟲使用代理proxy抓取網(wǎng)頁的方法,結(jié)合具體實例形式分析了urllib模塊代理與requests模塊代理兩種實現(xiàn)技巧,需要的朋友可以參考下2017-09-09Python中使用PyHook監(jiān)聽鼠標(biāo)和鍵盤事件實例
這篇文章主要介紹了Python中使用PyHook監(jiān)聽鼠標(biāo)和鍵盤事件實例,這個庫依賴于另一個Python庫PyWin32,并且只能運行在Windows平臺,需要的朋友可以參考下2014-07-07Python利用內(nèi)置庫實現(xiàn)數(shù)據(jù)的加密與校驗
這篇文章主要為大家詳細(xì)介紹了如何使用Python內(nèi)置庫實現(xiàn)數(shù)據(jù)的加密和校驗,為開發(fā)者提供全方位的數(shù)據(jù)安全解決方案,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2023-12-12