欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解pandas如何去掉、過(guò)濾數(shù)據(jù)集中的某些值或者某些行?

 更新時(shí)間:2019年05月15日 16:31:44   作者:kingsam_  
這篇文章主要介紹了pandas如何去掉、過(guò)濾數(shù)據(jù)集中的某些值或者某些行?,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

摘要在進(jìn)行數(shù)據(jù)分析與清理中,我們可能常常需要在數(shù)據(jù)集中去掉某些異常值。具體來(lái)說(shuō),看看下面的例子。


0.導(dǎo)入我們需要使用的包

import pandas as pd

pandas是很常用的數(shù)據(jù)分析,數(shù)據(jù)處理的包。anaconda已經(jīng)有這個(gè)包了,純凈版python的可以自行pip安裝。

1.去掉某些具體值

數(shù)據(jù)集df中,對(duì)于屬性appPlatform(最后一列),我們想刪除掉取值為2的那些樣本。如何做?非常簡(jiǎn)單。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]


當(dāng)然,有時(shí)候我們需要去掉不止一個(gè)值,這個(gè)時(shí)候只需要在isin([])的列表中添加。更具體來(lái)說(shuō),例如,對(duì)于appID這個(gè)屬性,我們想去掉appID=278和appID=382的樣本。

df[(True-df['appID'].isin([278,382]))]


另外,我們有時(shí)候并不只是考慮某一列,還需要考慮另外若干列的情況。例如,我們需要過(guò)濾掉appPlatform=2而且appID=278和appID=382的樣本呢?非常簡(jiǎn)單。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其實(shí),在這里我們看到,就是由兩部分組成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。兩者取邏輯關(guān)系 與(&)


2.過(guò)濾掉某個(gè)范圍的值

上面我們是了解了如何取掉某個(gè)具體值,下面,我們要看看如何過(guò)濾掉某個(gè)范圍的值。對(duì)于數(shù)據(jù)集df,我們想過(guò)濾掉creativeID(第一列)中ID值大于10000的樣本。

df[df['creativeID']<=10000]


另外,如果要考慮多列的話,其實(shí)和上面一樣,將兩種情況做邏輯與(&)就可以,不過(guò)值得注意的是,每個(gè)條件要用括號(hào)()括起來(lái)。

以上所述是小編給大家介紹的pandas如何去掉、過(guò)濾數(shù)據(jù)集中的某些值或者某些行詳解整合,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!

相關(guān)文章

  • Python動(dòng)刷新12306火車票的代碼(附源碼)

    Python動(dòng)刷新12306火車票的代碼(附源碼)

    這篇文章主要介紹了Python動(dòng)刷新12306火車票的完整代碼,非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友參考下吧
    2018-01-01
  • Pyqt5 實(shí)現(xiàn)多線程文件搜索的案例

    Pyqt5 實(shí)現(xiàn)多線程文件搜索的案例

    這篇文章主要介紹了Pyqt5 實(shí)現(xiàn)多線程文件搜索的案例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2021-03-03
  • 利用python實(shí)現(xiàn)在微信群刷屏的方法

    利用python實(shí)現(xiàn)在微信群刷屏的方法

    今天小編就為大家分享一篇利用python實(shí)現(xiàn)在微信群刷屏的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-02-02
  • Python使用Mechanize模塊編寫爬蟲的要點(diǎn)解析

    Python使用Mechanize模塊編寫爬蟲的要點(diǎn)解析

    這篇文章主要介紹了Python使用Mechanize模塊編寫爬蟲的要點(diǎn)解析,作者還講解了Mechanize程序占用內(nèi)存過(guò)高問(wèn)題的相關(guān)解決方法,需要的朋友可以參考下
    2016-03-03
  • Python中工作日類庫(kù)Busines Holiday的介紹與使用

    Python中工作日類庫(kù)Busines Holiday的介紹與使用

    Python語(yǔ)言是通過(guò)區(qū)分類庫(kù)的方式來(lái)劃分功能。用戶根據(jù)自身的需要加載合適的類庫(kù),來(lái)完成需要的功能。下面這篇文章主要給大家介紹了關(guān)于Python中工作日類庫(kù)Busines Holiday使用的相關(guān)資料,需要的朋友可以參考借鑒。
    2017-07-07
  • Python socket實(shí)現(xiàn)的文件下載器功能示例

    Python socket實(shí)現(xiàn)的文件下載器功能示例

    這篇文章主要介紹了Python socket實(shí)現(xiàn)的文件下載器功能,結(jié)合實(shí)例形式分析了Python使用socket模塊實(shí)現(xiàn)的文件下載器客戶端與服務(wù)器端相關(guān)操作技巧,需要的朋友可以參考下
    2019-11-11
  • Python實(shí)現(xiàn)將DNA序列存儲(chǔ)為tfr文件并讀取流程介紹

    Python實(shí)現(xiàn)將DNA序列存儲(chǔ)為tfr文件并讀取流程介紹

    為什么要在實(shí)驗(yàn)過(guò)程中存儲(chǔ)文件,因?yàn)橛行┧惴ǖ膬?nèi)容存在一些重復(fù)計(jì)算的步驟,這些步驟往往消耗很大一部分時(shí)間,在有大量參數(shù)的情況時(shí),需要在多次不同參數(shù)的情況下重復(fù)試驗(yàn),因此可以考慮將一些不涉及參數(shù)運(yùn)算的部分結(jié)果存入文件中
    2022-09-09
  • 對(duì)Python w和w+權(quán)限的區(qū)別詳解

    對(duì)Python w和w+權(quán)限的區(qū)別詳解

    今天小編就為大家分享一篇對(duì)Python w和w+權(quán)限的區(qū)別詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-01-01
  • 淺析python 字典嵌套

    淺析python 字典嵌套

    這篇文章主要介紹了python 字典嵌套的相關(guān)資料,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下
    2020-09-09
  • Python Map 函數(shù)的使用

    Python Map 函數(shù)的使用

    這篇文章主要介紹了Python Map 函數(shù)的使用,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下
    2020-08-08

最新評(píng)論