快捷導(dǎo)航

python缺失值填充方法示例代碼

更新時間：2022年12月23日 16:03:37 作者：開始學(xué)習(xí)的同學(xué)

常見的數(shù)據(jù)缺失填充方式分為很多種,比如刪除法、均值法、回歸法、KNN、MICE、EM等,下面這篇文章主要給大家介紹了關(guān)于python缺失值填充方法的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下

1.找到缺失值

導(dǎo)入數(shù)據(jù)集

df=pd.read_csv("nba.csv")
df.head(10)

替換異常值（數(shù)據(jù)集中異常值為“-”）

把數(shù)據(jù)集中的異常值用“NaN”替換

# 將空值形式的缺失值轉(zhuǎn)換成可識別的類型
data = data.replace('-', np.NaN)

2.計算缺失值的數(shù)量

用# isnull() 函數(shù)，確認(rèn)各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

.sum();表示可以顯示各個列的缺失值數(shù)量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值，

.any()表示只要按行或列計算，有缺失值就算入
.all()表示所在行或列全為缺失值才計入
.sum()表示計算列缺失值時，一列有多個缺失值，同理，計算行缺失，計算有多少個行。

3.處理缺失值

3.1:df.dropna():直接刪除行列

df表示數(shù)據(jù)集的名稱

dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括號內(nèi)上述參數(shù)都是函數(shù)默認(rèn)。

axis=0:表示對行進(jìn)行刪除操作，axis=1:對列刪除進(jìn)行操作
how=‘any’：表示維度 存在“缺失值”就刪除相應(yīng)行/列操作；how=‘all’：進(jìn)行相關(guān)行或列刪除操作時，只有所有維度缺失才刪除。
thresh=None：等于幾表示有幾個缺失值存在才會刪除所在的行或列。
inplace=False：表示對原來的數(shù)據(jù)集不進(jìn)行操作，True時表示對原來的數(shù)據(jù)集也進(jìn)行操作。

3.2:df.fillna()填充缺失值

fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill：將前面的值填充于后面位置。
backfill’, 'bfill：表示將后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位數(shù)填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#鄰居樣本求平均數(shù)
df1=imputer.fit_transform(df)

4.查看數(shù)據(jù)集的末尾

df.tail(10)

查看末尾10行

總結(jié)

到此這篇關(guān)于python缺失值填充方法的文章就介紹到這了,更多相關(guān)python缺失值填充方法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python缺失值填充方法示例代碼

目錄

1.找到缺失值

2.計算缺失值的數(shù)量

3.處理缺失值

3.1:df.dropna():直接刪除行列

3.2:df.fillna()填充缺失值

3.3:KNN填充

4.查看數(shù)據(jù)集的末尾

總結(jié)

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具