pandas.str.replace 不起作用的解決方法
背景
最近在處理別人給的數(shù)據(jù)時,大概 700w+ 行數(shù)據(jù),發(fā)現(xiàn)有的字段里面存在換行符、斜杠等一些特殊字符,于是想著就用Python來處理下,因為Pandas處理數(shù)據(jù)還是很方便,結(jié)果發(fā)現(xiàn)這些轉(zhuǎn)義字符: \n
、\r
、\
一直替換不掉,后來經(jīng)過研究成功替換,分享出來供大家參考
演示數(shù)據(jù)
python 與 pandas版本
特意說一下版本,現(xiàn)在不同的版本功能可能不一樣
問題復(fù)現(xiàn)
因為涉及到字符串替換,所以直接想到的方法是用 pandas.Series.str.replace
來進行替換,但是一直不能成功,即使雙斜杠也不行
問題解決
在上面第7個單元格運行時,報了一個錯誤,FutureWarning: The default value of regex will change from True to False in a future version.
,于是就翻看了 pandas.Series.str.replace
的官方文檔:http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.replace.html,文檔中寫了 regex:bool, default True
,正則默認是開啟的,個人經(jīng)驗:正則表達式來處理轉(zhuǎn)義字符是比較麻煩的事,因為里面的斜杠不知道要寫幾個,總是記不住
經(jīng)過測試如下幾種方法,可行:
方法1:明確使用正則來處理,并且使用原字符 r
方法2:明確使用正則來處理,正常的寫法,經(jīng)測試需要4個斜杠
方法3:不使用正則來處理,但是在處理單個斜杠時,必須用2個
到此這篇關(guān)于pandas.str.replace 不起作用的解決方法的文章就介紹到這了,更多相關(guān)pandas.str.replace 不起作用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
OpenCV+face++實現(xiàn)實時人臉識別解鎖功能
這篇文章主要為大家詳細介紹了OpenCV+face++實現(xiàn)實時人臉識別解鎖功能,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-08-08教你用Python+selenium搭建自動化測試環(huán)境
今天給大家?guī)淼氖顷P(guān)于Python的相關(guān)知識,文章圍繞著如何用Python+selenium搭建自動化測試環(huán)境展開,文中有非常詳細的介紹,需要的朋友可以參考下2021-06-06使用 Python 處理3萬多條數(shù)據(jù)只要幾秒鐘
在工作中經(jīng)常遇到大量的數(shù)據(jù)需要整合、去重、按照特定格式導(dǎo)出等情況。這篇文章主要介紹了使用 Python 處理3萬多條數(shù)據(jù)只要幾秒鐘的相關(guān)知識,需要的朋友可以參考下2020-01-01pytorch交叉熵損失函數(shù)的weight參數(shù)的使用
這篇文章主要介紹了pytorch交叉熵損失函數(shù)的weight參數(shù)的使用,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-05-05