pandas如何統(tǒng)計某一列或某一行的缺失值數(shù)目
更新時間:2022年05月12日 11:43:24 作者:WGS.
這篇文章主要介紹了pandas如何統(tǒng)計某一列或某一行的缺失值數(shù)目,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
統(tǒng)計某一列或某一行的缺失值數(shù)目
1.使用isnull()
import pandas as pd # 首先導(dǎo)入數(shù)據(jù) df = pd.read_csv('123.csv' , encoding='gbk') # 計算data每一行有多少個缺失值的值,即按行統(tǒng)計缺失值 rows_null = df.isnull().sum(axis=1)? # 下面則是按列統(tǒng)計缺失值 col_null = df.isnull().sum(axis=0) #統(tǒng)計整個df的缺失值 all_null = df.isnull().sum().sum() # 統(tǒng)計某一列的缺失值 idx_null = df['列名'].isnull().sum(axis=0)
2.使用count
import pandas as pd # 首先導(dǎo)入數(shù)據(jù) df = pd.read_csv('123.csv' , encoding='gbk') # 計算data每一行有多少個非空的值,即按行統(tǒng)計非空值 rows_not_null = df.count(axis=1)? # 下面則是按列統(tǒng)計非空值 cols_not_null = df.count(axis=0) cols_null = df.shape[1] - cols_not_null # 統(tǒng)計某一列的非空值 col_not_null = df['列名'].count(axis=0)
利用pandas處理缺失值
處理缺失值
def missing_values(dataframe): ? ? missing_ratio = (dataframe.isnull().sum() / len(dataframe))*100 ? ? missing_ratio = missing_ratio.drop(missing_ratio[missing_ratio == 0].index).sort_values(ascending=False) ? ? missing_count = dataframe.isnull().sum() ? ? missing_count = missing_count.drop(missing_count[missing_count == 0].index).sort_values(ascending=False) ? ? info = pd.DataFrame({'Missing Ratio': missing_ratio, 'Missing Count': missing_count}) ? ? return info
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
您可能感興趣的文章:
- pandas數(shù)據(jù)清洗實現(xiàn)刪除的項目實踐
- pandas實現(xiàn)數(shù)據(jù)讀取&清洗&分析的項目實踐
- 詳解Python如何利用Pandas與NumPy進(jìn)行數(shù)據(jù)清洗
- 利用pandas進(jìn)行數(shù)據(jù)清洗的方法
- pandas數(shù)據(jù)處理清洗實現(xiàn)中文地址拆分案例
- Pandas 數(shù)據(jù)處理,數(shù)據(jù)清洗詳解
- pandas數(shù)據(jù)清洗,排序,索引設(shè)置,數(shù)據(jù)選取方法
- pandas返回缺失值位置的方法實例教程
- pandas中DataFrame檢測重復(fù)值的實現(xiàn)
- pandas數(shù)據(jù)清洗(缺失值和重復(fù)值的處理)
相關(guān)文章
Django 創(chuàng)建后臺,配置sqlite3教程
今天小編就為大家分享一篇Django 創(chuàng)建后臺,配置sqlite3教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-11-11用python + hadoop streaming 分布式編程(一) -- 原理介紹,樣例程序與本地調(diào)試
Hadoop 是一個實現(xiàn)了 MapReduce 計算模型的開源分布式并行編程框架,借助于 Hadoop, 程序員可以輕松地編寫分布式并行程序,將其運(yùn)行于計算機(jī)集群上,完成海量數(shù)據(jù)的計算。2014-07-07matplotlib命令與格式之tick坐標(biāo)軸日期格式(設(shè)置日期主副刻度)
這篇文章主要介紹了matplotlib命令與格式之tick坐標(biāo)軸日期格式(設(shè)置日期主副刻度),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08