腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

軟件下載

android MAC 驅(qū)動下載字體下載 DLL

源碼下載

PHP ASP.NET ASP JSP

軟件編程

C# JAVA C 語言 Delphi Android

網(wǎng)絡(luò)編程

PHP ASP.NET ASP JavaScript

在線工具

CSS格式化 JS格式化 Html轉(zhuǎn)化為Js

數(shù)據(jù)庫

MYSQL MSSQL oracle DB2 MARIADB

CMS

PHPCMS DEDECMS 帝國CMS WordPress

常用工具

PHP開發(fā)工具 python Photoshop 必備軟件

python重復(fù)值處理得方法

更新時間：2022年05月18日 16:48:05 作者：??FizzH????

這篇文章主要介紹了python重復(fù)值處理得方法，文章圍繞主題展開詳細的內(nèi)容介紹，具有一定的參考價值，需要的小伙伴可以參考一下

前言：

如果大家接觸過數(shù)據(jù)分析，那么大家可能都知道，最讓人頭疼的就是在數(shù)據(jù)錄入的過程中，不可避免的會產(chǎn)生重復(fù)值，缺失值和異常值了，python也提供了一些方法讓我們處理這些值。下面讓我們一塊來學(xué)習(xí)一下吧~

今天，先處理重復(fù)值，首先創(chuàng)建一個包含重復(fù)值的DataFrame,如下：

import pandas as pd
data = pd.DataFrame([[1,2],[1,2],[3,4]],columns = ['a','b'])
print(data)

我們將其打印出來，結(jié)果如下：

可以看出來第一第二行是重復(fù)的，這里的數(shù)據(jù)量比較少，可以直接肉眼觀察，但如果數(shù)據(jù)量多的時候，我們就需要用到diplicated()函數(shù)來查詢了，我們用它來查查上面data的重復(fù)值。

data[data.duplicated()]

我們可以看出，它把索引為1的行打印了出來，如果有3行一樣的呢？我們下面來試試！

import pandas as pd
data = pd.DataFrame([[1,2],[1,2],[1,2],[3,4]],columns = ['a','b'])
data[data.duplicated()]

其結(jié)果如下：

可以看出，重復(fù)項出了第一個出現(xiàn)的數(shù)據(jù)外，都會顯示出來。

如果想統(tǒng)計出一共有多少行重復(fù)了，我們就可以用到sum()函數(shù)，代碼如下：

data.duplicated().sum()

很多情況下，我們都需要刪除掉重復(fù)的數(shù)據(jù)，這時候我們就可以用到drop_duplicated()函數(shù)，我們將data的重復(fù)行刪除掉試試！

data.drop_duplicated()

剛執(zhí)行代碼時發(fā)生了錯誤，原來是duplicates而不是duplicated!

但是要注意，用drop_duplicates()刪除重復(fù)項并不會影響data的結(jié)構(gòu)，如果你要把data結(jié)構(gòu)改掉就要重新賦值。如果要用來刪除某列的重復(fù)值的話，直接在括號內(nèi)加上列名即可。

如下：

到此這篇關(guān)于python重復(fù)值處理得方法的文章就介紹到這了,更多相關(guān)python 重復(fù)值內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

python重復(fù)值處理得方法

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具