Python?pandas.replace的用法詳解
更新時間:2022年06月24日 10:30:47 作者:羊羊豬
在處理數據的時候,很多時候會遇到批量替換的情況,如果一個一個去修改效率過低,也容易出錯,replace()是很好的方法,下面這篇文章主要給大家介紹了關于Python?pandas.replace用法的相關資料,需要的朋友可以參考下
1. pandas.replace()介紹
Series.replace(to_replace=None, value=NoDefault.no_default, inplace=False, limit=None, regex=False, method=NoDefault.no_default)
- to_replace: 需要替換的值
- value:替換后的值
- inplace: 是否在原數據表上更改,默認 inplace=False
- limit:向前或向后填充的最大尺寸間隙,用于填充缺失值
- regex: 是否模糊查詢,用于正則表達式查找,默認 regex=False
- method: 填充方式,用于填充缺失值(The method to use when for replacement, when to_replace is a scalar, list or tuple and value is None.)
- pad: 向前填充
- ffill: 向前填充
- bfill: 向后填充
Example
2. 單值替換
2.1 全局替換
df.replace(1, 10)
2.2 選定條件替換
df['attr_1'].replace('場景.季節(jié).冬天', '冬天', inplace=True)
3. 多值替換
3.1 多個值替換同一個值
df.replace([3, 11, 137], 4)
3.2 多個值替換不同值
列表List
df.replace([3, 11, 137, 1], [1, 111, 731, 10])
字典映射
# 修改不同列 df.replace({'場景.普通運動.跑步':'跑步', 11:100})
# 修改同一列 df.replace({'attr_1':{'場景.普通運動.跑步':'跑步', '場景.戶外休閑.爬山':'爬山'}})
4. 模糊查詢替換
df.replace('場景.','', regex=True) df.replace(regex='場景.', value=' ')
df.replace(regex={'場景.': '', '方案.':''}) df.replace(regex=['場景.', '方案.'], value='')
也可以這樣
df['Attr_B'] = df['Attr_B'].str.replace('夾克', '大衣') df
5. 缺失值替換
5.1 method的用法 (向前/后填充)
Example
向前填充(以他的前一行的值填充)
s.replace(np.nan, method='pad') s.replace(np.nan, method='ffill')
向后填充(以他的后一行的值填充)
s.replace(np.nan, method='bfill')
5.2 limit的用法 (限制最大填充間隔)
連著多個空值時,limit為幾填充幾個
Example
s.replace(np.nan, method='ffill', limit=1)
s.replace(np.nan, method='ffill', limit=2)
補充:使用實例代碼
#Series對象值替換 s = df.iloc[2]#獲取行索引為2數據 #單值替換 s.replace('?',np.nan)#用np.nan替換? s.replace({'?':'NA'})#用NA替換? #多值替換 s.replace(['?',r'$'],[np.nan,'NA'])#列表值替換 s.replace({'?':np.nan,'$':'NA'})#字典映射 #同缺失值填充方法類似 s.replace(['?','$'],method='pad')#向前填充 s.replace(['?','$'],method='ffill')#向前填充 s.replace(['?','$'],method='bfill')#向后填充 #limit參數控制填充次數 s.replace(['?','$'],method='bfill',limit=1) #DataFrame對象值替換 #單值替換 df.replace('?',np.nan)#用np.nan替換? df.replace({'?':'NA'})#用NA替換? #按列指定單值替換 df.replace({'EMPNO':'?'},np.nan)#用np.nan替換EMPNO列中? df.replace({'EMPNO':'?','ENAME':'.'},np.nan)#用np.nan替換EMPNO列中?和ENAME中. #多值替換 df.replace(['?','.','$'],[np.nan,'NA','None'])##用np.nan替換?用NA替換. 用None替換$ df.replace({'?':'NA','$':None})#用NA替換? 用None替換$ df.replace({'?','$'},{'NA',None})#用NA替換? 用None替換$ #正則替換 df.replace(r'\?|\.|\$',np.nan,regex=True)#用np.nan替換?或.或$原字符 df.replace([r'\?',r'\$'],np.nan,regex=True)#用np.nan替換?和$ df.replace([r'\?',r'\$'],[np.nan,'NA'],regex=True)#用np.nan替換?用NA替換$符號 df.replace(regex={r'\?':None}) #value參數顯示傳遞 df.replace(regex=[r'\?|\.|\$'],value=np.nan)#用np.nan替換?或.或$原字符
總結
到此這篇關于Python pandas.replace用法的文章就介紹到這了,更多相關Python pandas.replace用法內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
解決python 輸出到csv 出現(xiàn)多空行的情況
這篇文章主要介紹了解決python 輸出到csv 出現(xiàn)多空行的情況,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03Python+OpenCV 圖像邊緣檢測四種實現(xiàn)方法
本文主要介紹了通過OpenCV中Sobel算子、Schaar算子、Laplacian算子以及Canny分別實現(xiàn)圖像邊緣檢測并總結了四者的優(yōu)缺點,感興趣的同學可以參考一下2021-11-11