python解決pandas處理缺失值為空字符串的問題
踩坑記錄:
用pandas來做csv的缺失值處理時候發(fā)現(xiàn)奇怪BUG,就是excel打開csv文件,明明有的格子沒有任何東西,當然,我就想到用pandas的dropna()或者fillna()來處理缺失值。
但是pandas讀取csv文件后發(fā)現(xiàn)那個空的地方isnull()竟然是false,就是說那個地方有東西。。。
后來經過排查發(fā)現(xiàn)看似什么都沒有的地方有空字符串,故pandas認為那兒不是缺失值,所以就不能用dropna()或者fillna()來處理。
解決思路:先用正則將空格匹配出來,然后全部替換為NULL,再在用pandas讀取csv時候指定 read_csv(na_values='NULL')就是將NULL認為是nan處理,接下來就可以用dropna()或者fillna()來處理了
以上這篇python解決pandas處理缺失值為空字符串的問題就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
如何用python腳本實現(xiàn)一次獲取token,多次使用token
這篇文章主要介紹了如何用python腳本實現(xiàn)一次獲取token,多次使用token問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08Pycharm中配置遠程Docker運行環(huán)境的教程圖解
這篇文章主要介紹了Pycharm中配置遠程Docker運行環(huán)境,本文通過圖文并茂的形式給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-06-06python基礎之while循環(huán)、for循環(huán)詳解及舉例
所謂循環(huán)結構就是程序中控制某條或某些指令重復執(zhí)行的結構,下面這篇文章主要給大家介紹了關于python基礎之while循環(huán)、for循環(huán)的相關資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2022-04-04pytorch torch.nn.AdaptiveAvgPool2d()自適應平均池化函數詳解
今天小編就為大家分享一篇pytorch torch.nn.AdaptiveAvgPool2d()自適應平均池化函數詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01