在Pandas中更改DataFrame中的值
Pandas如何更改DataFrame中的值
1.構(gòu)造DataFrame
import pandas as pd import numpy as np dates = pd.date_range('20200315', periods = 5) df = pd.DataFrame(np.arange(20).reshape((5,4)), index = dates, columns = ['A','B','C','D']) print(df) #輸出 A B C D 2020-03-15 0 1 2 3 2020-03-16 4 5 6 7 2020-03-17 8 9 10 11 2020-03-18 12 13 14 15 2020-03-19 16 17 18 19
2.運用loc、iloc更改值
我們可以利用索引或者標簽確定需要修改值的位置。
df.loc['20200318','C'] = 20200318 #標簽索引 df.iloc[2,3] = 20200318 #數(shù)字索引 print(df) #輸出 A B C D 2020-03-15 0 1 2 3 2020-03-16 4 5 6 7 2020-03-17 8 9 10 20200318 2020-03-18 12 13 20200318 15 2020-03-19 16 17 18 19
3.運用條件判斷更改值
如果現(xiàn)在的判斷條件是這樣, 我們想要更改B中的數(shù), 而更改的位置是取決于 C的. 對于C大于6的位置. 更改B在相應(yīng)位置上的數(shù)為0.
df.B[df.C>6] = 0 #C字段中大于6的那些行在B字段中全都設(shè)為0 print(df) #輸出 A B C D 2020-03-15 0 1 2 3 2020-03-16 4 5 6 7 2020-03-17 8 0 10 20200318 2020-03-18 12 0 20200318 15 2020-03-19 16 0 18 19
4.在DataFrame中添加一列
如果對整列做批處理, 加上一列 ‘E’, 并將 E 列全改為 NaN, 如下:
df['E'] = np.nan print(df) #輸出 A B C D E 2020-03-15 0 1 2 3 NaN 2020-03-16 4 5 6 7 NaN 2020-03-17 8 9 10 11 NaN 2020-03-18 12 13 14 15 NaN 2020-03-19 16 17 18 19 NaN
用上面的方法也可以加上 Series 序列(但是長度必須對齊)。
df['F'] = pd.Series([11,22,33,44,55],index = pd.date_range('20200315',periods = 5)) print(df) #輸出 A B C D E F 2020-03-15 0 1 2 3 NaN 11 2020-03-16 4 5 6 7 NaN 22 2020-03-17 8 9 10 11 NaN 33 2020-03-18 12 13 14 15 NaN 44 2020-03-19 16 17 18 19 NaN 55
pandas Dataframe批量修改值
在使用dataframe的時候 有時候會碰到需要批量修改數(shù)據(jù)的時候,今天主要說明兩種情況
一.使用iloc對某幾行某幾列進行全部修該
二.對數(shù)據(jù)進行判定后,相互+/-/*某個數(shù),使用內(nèi)置函數(shù)
1.使用iloc對數(shù)據(jù)進行批量修改
使用iloc最簡單的就是將數(shù)據(jù)批量修改為某個特定的值以下是我隨便寫入的數(shù)據(jù)
現(xiàn)在將[‘d’,‘e’]列,[2,3,4]行的數(shù)據(jù)全部修改為0
import pandas as pd data = pd.read_excel('some_chaneg.xlsx') data1 = data data1.iloc[2:5,3:] = 0 data1
.iloc用法[],先行后列,并且都是不包含最后一個元素,例如取[2,3,4]就是[2:5],列同樣遵循此規(guī)則
2.對數(shù)據(jù)進行判定后,相互+/-/某個數(shù)
*第一種方法:使用內(nèi)置函數(shù)where函數(shù)
Series.where(cond, other=nan, inplace=False, axis=None, level=None, errors='rais',...)
解釋下來就是如果cond為真,則保持原來的值,否則替換為other,這里的cond和other參數(shù)由我們自己寫入控制
# data2為data數(shù)據(jù)的一部分 data2 = data.iloc[0:,1:] print(data2) data2.where(data2>25, data2+5,inplace=True)
選取data2中<25的數(shù)據(jù),全部加上5
第二種方法:使用mask函數(shù)
mask和where剛好相反
mask(cond, other=nan)
- where:替換條件(condition)為False處的值
- mask:替換條件(condition)為True處的值
還是以data2舉例
data2.mask(data2<25, data2+5, inplace=True)
第三種方法:replace函數(shù)
replace可以替換文本值,也可以使用字典替換多個值,
也可以使用正則表達式嵌套方法,替換很多不同的值
替換文本值
# 替換文本值 data3 = data data3.replace('wange', 'sheng', inplace=True) data3
替換多個值
將所有的0和1互換
# 替換多個值# 將所有的0和1互換data3.replace({<!-- -->1:0,0:1},inplace=True) # 替換多個值 # 將所有的0和1互換 data3.replace({1:0,0:1},inplace=True)
運用正則表達式
將所有含英文字母的全部變成Anonymous
# 切記使用正則表達式的時候,一定要添加上regex=True data3.replace('[a-zA-Z]+','Anonymous',regex=True,inplace=True)
總結(jié)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python使用re模塊實現(xiàn)okenizer(表達式分詞器)
這篇文章主要介紹了Python使用re模塊實現(xiàn)okenizer,我們這里講解用正則表達式構(gòu)建簡單的表達式分詞器(tokenizer),它能夠?qū)⒈磉_式字符串從左到右解析為標記(tokens)流,需要的朋友可以參考下2022-04-04python GUI庫圖形界面開發(fā)之PyQt5打印控件QPrinter詳細使用方法與實例
這篇文章主要介紹了python GUI庫圖形界面開發(fā)之PyQt5打印控件QPrinter詳細使用方法與實例,需要的朋友可以參考下2020-02-02Python實現(xiàn)向服務(wù)器請求壓縮數(shù)據(jù)及解壓縮數(shù)據(jù)的方法示例
這篇文章主要介紹了Python實現(xiàn)向服務(wù)器請求壓縮數(shù)據(jù)及解壓縮數(shù)據(jù)的方法,涉及Python文件傳輸及zip文件相關(guān)操作技巧,需要的朋友可以參考下2017-06-06Windows系統(tǒng)配置python腳本開機啟動的3種方法分享
這篇文章主要介紹了Windows系統(tǒng)配置python腳本開機啟動的3種方法分享,本文講解了開始菜單啟動項實現(xiàn)、開機腳本、通過一個服務(wù)調(diào)用該腳本三種方法,需要的朋友可以參考下2015-03-03Python3實現(xiàn)將文件歸檔到zip文件及從zip文件中讀取數(shù)據(jù)的方法
這篇文章主要介紹了Python3實現(xiàn)將文件歸檔到zip文件及從zip文件中讀取數(shù)據(jù)的方法,涉及Python針對zip文件操作的相關(guān)技巧,需要的朋友可以參考下2015-05-05