python缺失值填充方法示例代碼
1.找到缺失值
導(dǎo)入數(shù)據(jù)集
df=pd.read_csv("nba.csv") df.head(10)
替換異常值(數(shù)據(jù)集中異常值為“-”)
把數(shù)據(jù)集中的異常值用“NaN”替換
# 將空值形式的缺失值轉(zhuǎn)換成可識(shí)別的類(lèi)型 data = data.replace('-', np.NaN)
2.計(jì)算缺失值的數(shù)量
用# isnull() 函數(shù),確認(rèn)各列是否有缺失值1.
null_all = df.isnull().sum() print(null_all)
.sum();表示可以顯示各個(gè)列的缺失值數(shù)量。
null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,
.any()表示只要按行或列計(jì)算,有缺失值就算入
.all()表示所在行或列全為缺失值才計(jì)入
.sum()表示計(jì)算列缺失值時(shí),一列有多個(gè)缺失值,同理,計(jì)算行缺失,計(jì)算有多少個(gè)行。
3.處理缺失值
3.1:df.dropna():直接刪除行列
df表示數(shù)據(jù)集的名稱(chēng)
- dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)
括號(hào)內(nèi)上述參數(shù)都是函數(shù)默認(rèn)。
axis=0:表示對(duì)行進(jìn)行刪除操作,axis=1:對(duì)列刪除進(jìn)行操作
how=‘any’:表示維度 存在“缺失值”就刪除相應(yīng)行/列操作;how=‘all’:進(jìn)行相關(guān)行或列刪除操作時(shí),只有所有維度缺失才刪除。
thresh=None:等于幾表示有幾個(gè)缺失值存在才會(huì)刪除所在的行或列。
inplace=False:表示對(duì)原來(lái)的數(shù)據(jù)集不進(jìn)行操作,True時(shí)表示對(duì)原來(lái)的數(shù)據(jù)集也進(jìn)行操作。
3.2:df.fillna()填充缺失值
- fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
axis : {0 or ‘index’, 1 or ‘columns’}
method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:將前面的值填充于后面位置。
backfill’, 'bfill:表示將后面的值填充于前面位置。
data.fillna(data.mean())#平均值填充 data.fillna(data.median())#中位數(shù)填充
3.3:KNN填充
from sklearn.impute import KNNImputer imputer = KNNImputer(n_neighbors=4)#鄰居樣本求平均數(shù) df1=imputer.fit_transform(df)
4.查看數(shù)據(jù)集的末尾
df.tail(10)
查看末尾10行
總結(jié)
到此這篇關(guān)于python缺失值填充方法的文章就介紹到這了,更多相關(guān)python缺失值填充方法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python數(shù)據(jù)預(yù)處理時(shí)缺失值的不同處理方式總結(jié)
- Python?數(shù)據(jù)清洗刪除缺失值替換缺失值詳情
- python?sklearn與pandas實(shí)現(xiàn)缺失值數(shù)據(jù)預(yù)處理流程詳解
- Python處理缺失值的8種不同方法實(shí)例
- Python缺失值處理方法
- Python3?DataFrame缺失值的處理方法
- python如何去除異常值和缺失值的插值
- Python?Pandas中缺失值NaN的判斷,刪除及替換
- Python數(shù)據(jù)分析之缺失值檢測(cè)與處理詳解
- Python數(shù)據(jù)分析的八種處理缺失值方法詳解
- python缺失值的解決方法總結(jié)
- Python中查找缺失值的三種方法
相關(guān)文章
Python實(shí)現(xiàn)查找系統(tǒng)盤(pán)中需要找的字符
這篇文章主要介紹了Python實(shí)現(xiàn)查找系統(tǒng)盤(pán)中需要找的字符,涉及Python字符查找的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-07-07Python實(shí)現(xiàn)將Excel轉(zhuǎn)換成xml的方法示例
這篇文章主要介紹了Python實(shí)現(xiàn)將Excel轉(zhuǎn)換成xml的方法,涉及Python針對(duì)Excel文件的讀取、遍歷、節(jié)點(diǎn)設(shè)置與xml生成等相關(guān)操作技巧,需要的朋友可以參考下2018-08-08Python格式化字符串f-string概覽(小結(jié))
這篇文章主要介紹了Python格式化字符串f-string概覽(小結(jié)),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-06-06詳解Python中常用的激活函數(shù)(Sigmoid、Tanh、ReLU等)
激活函數(shù) (Activation functions) 對(duì)于人工神經(jīng)網(wǎng)絡(luò)模型去學(xué)習(xí)、理解非常復(fù)雜和非線性的函數(shù)來(lái)說(shuō)具有十分重要的作用,這篇文章主要介紹了Python中常用的激活函數(shù)(Sigmoid、Tanh、ReLU等),需要的朋友可以參考下2023-04-04對(duì)python3中的RE(正則表達(dá)式)-詳細(xì)總結(jié)
今天小編就為大家分享一篇對(duì)python3中的RE(正則表達(dá)式)-詳細(xì)總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07python?Pydub簡(jiǎn)單易用的音頻處理庫(kù)使用實(shí)例探索
Pydub是一個(gè)簡(jiǎn)單易用的Python庫(kù),它讓音頻處理變得像處理列表或字符串一樣簡(jiǎn)單,你可以用Pydub來(lái)剪輯、合并、調(diào)整音頻文件,以及執(zhí)行許多其他的音頻處理任務(wù),它支持多種音頻格式,包括常見(jiàn)的MP3、WAV和AAC2024-01-01Python爬蟲(chóng)爬取一個(gè)網(wǎng)頁(yè)上的圖片地址實(shí)例代碼
這篇文章主要介紹了Python爬蟲(chóng)爬取一個(gè)網(wǎng)頁(yè)上的圖片地址實(shí)例代碼,具有一定借鑒價(jià)值,需要的朋友可以參考下2018-01-01