python 使用pandas同時對多列進行賦值

更新時間：2021年03月12日 17:35:26 作者：weixin_45903952

這篇文章主要介紹了python 使用pandas同時對多列進行賦值操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

如dataframe

 data1['月份']=int(month) #加入月份和企業(yè)名稱
 data1['企業(yè)']=parmentname

可以增加單列，并賦值，如果想同時對多列進行賦值

data1['月份','企業(yè)']=int(month) , parmentname   #加入月份和企業(yè)名稱

會出錯

ValueError: Length of values does not match length of index

data[['合計','平均']]='數(shù)據(jù)','月份'

類似這樣的，也無效

KeyError: “None of [Index([‘合計', ‘平均'], dtype=‘object')] are in the [columns]”

只有下例中：

import pandas as pd
chengji=[[100,95,100,99],[90,98,99,100],[88,95,98,88],[99,98,97,87],[96.5,90,96,85],[94,94,93,91],[91, 99, 92, 87], [85, 88, 85, 90], [90, 92, 99, 88], [90, 88, 89, 81], [85, 89, 89, 82], [95, 87, 86, 88], [90, 97, 97, 98], [80, 92, 89, 98], [80, 98, 85, 81], [98, 88, 95, 92]]
data=pd.DataFrame(chengji,columns=['語文','英語','數(shù)學','政治'])
print (data)
# data1=data[['數(shù)學','語文','英語','政治']]    #排序
# data1=data1.reset_index(drop=True)   #序列重建
# data1.index.names=['序號']     #序列重命名
# data1.index=data1.index+1    #序列從1開始
# print (data1)
data=pd.DataFrame(chengji,columns=['語文','英語','數(shù)學','政治'],index=[i for i in range(1,len(chengji)+1)])
print (data)
data[['合計','平均']]=data.apply(lambda x: (x.sum(), x.sum()/4),axis=1,result_type='expand')
print (data[:])
data=pd.DataFrame(chengji,columns=['語文','英語','數(shù)學','政治'],index=[i for i in range(1,len(chengji)+1)])
print (data)
data[['合計','平均']]=data.apply(lambda x:('數(shù)據(jù)','月份'),axis=1,result_type='expand')
print (data[:])

應用apply 并設置result_type=‘expand' 參數(shù)才可以。

先前的例子，用如下的方法就行了

data1[['月份','企業(yè)']]=data1.apply(lambda x:(int(month),parmentname),axis=1,result_type='expand')
  # data1['月份']=int(month)   #加入月份和企業(yè)名稱
  # data1['企業(yè)']=parmentname
  #print (data1)

后記：

如果'月份','企業(yè)'列存在，用如下也可,上例中，直接可以創(chuàng)建不存在的列。

data1.lco[:,['月份','企業(yè)']]=int(month),parmentname

或

data1[['月份','企業(yè)']]=int(month),parmentname

今天又遇到一個從某列截取字符串長度寫到另一列的，也一并寫到這里：

貨品列在原表中無，取貨品代碼的前12位。

totaldata = totaldata.reset_index(drop=False)
totaldata['貨品'] = totaldata['貨品代碼'].apply(lambda x:x[:12])

后記：2020.5.17又遇到想新增兩列并賦值的問題

import numpy as np
import pandas as pd
from pandas import Series
 
chengji = [['N', 95, 0], ['N', 100, 88], ['N', 88, 100], ['N', 66, 0]]
data = pd.DataFrame(chengji, columns=['p', 'x', 'g'])
data[['序號','列名']]=data[['p','x']] #pd.DataFrame(data[['p','x']])# .apply(lambda x : x )
print(data)

補充：pandas 的apply返回多列，并賦值

代碼如下：

import pandas as pd
df_tmp = pd.DataFrame([
 {"a":"data1", "cnt":100},{"a":"data2", "cnt":200},
])
df_tmp
a cnt
data1 100
data2 200

方法一：使用apply 的參數(shù)result_type 來處理

def formatrow(row):
 a = row["a"] + str(row["cnt"])
 b = str(row["cnt"]) + row["a"]
 return a, b 
 
df_tmp[["fomat1", "format2"]] = df_tmp.apply(formatrow, axis=1, result_type="expand")
df_tmp
a cnt fomat1 format2
data1 100 data1100 100data1
data2 200 data2200 200data2

方法二：使用zip打包返回結果來處理

df_tmp["fomat1-1"], df_tmp["format2-2"] = zip(*df_tmp.apply(formatrow, axis=1))
df_tmp
a cnt fomat1 format2 fomat1-1 format2-2
data1 100 data1100 100data1 data1100 100data1
data2 200 data2200 200data2 data2200 200data2

以上為個人經(jīng)驗，希望能給大家一個參考，也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方，望不吝賜教。

您可能感興趣的文章: