pandas篩選數(shù)值列和非數(shù)值列方式
pandas篩選數(shù)值列和非數(shù)值列
篩選數(shù)值類(lèi)型的列
numeric_columns = df.select_dtypes(include=['number']).columns
df為dataframe類(lèi)型的數(shù)據(jù)。
篩選非數(shù)值類(lèi)型的列
non_numeric_columns = df.select_dtypes(exclude=['number']).columns.to_list()
含數(shù)值列就用include,不要數(shù)值列就用exclude。
Pandas常見(jiàn)篩選數(shù)據(jù)的五種方法其一邏輯篩選
Pandas的數(shù)據(jù)操作中,最基本的就是操作的篩選了,但是對(duì)新學(xué)員來(lái)說(shuō)的這又是一個(gè)難點(diǎn),因?yàn)榉椒ū容^多,不容易記。聊聊pandas中的一些常用的數(shù)據(jù)篩選操作。
邏輯篩選數(shù)據(jù)
切片([ ]),loc,iloc,這三種都是支持邏輯表達(dá)式的,選其中一種比較常用的,邏輯運(yùn)算符 與或非(& | ~)any,all
展示使用的數(shù)據(jù)結(jié)構(gòu)
import pandas as pd PATH = '/tmp/MSD0921.xlsx' dataframe = pd.read_excel(PATH,engine='openpyxl', nrows=50)
| SD1 | SD2 | SD3 | SD4 | SD5 | SD6 | SD7 | SD8 | |
|---|---|---|---|---|---|---|---|---|
| 0 | 4 | 7 | 2 | 1 | 2 | 6 | 7 | 6 |
| 1 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 |
| 2 | 1 | 7 | 1 | 1 | 1 | 6 | 6 | 6 |
| 3 | 6 | 6 | 3 | 2 | 2 | 2 | 2 | 2 |
| 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 |
| ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 258 | 1 | 5 | 2 | 1 | 1 | 7 | 7 | 6 |
| 259 | 1 | 7 | 7 | 4 | 2 | 1 | 7 | 1 |
| 260 | 1 | 3 | 5 | 4 | 5 | 5 | 5 | 6 |
| 261 | 1 | 3 | 5 | 5 | 5 | 5 | 3 | 2 |
| 262 | 1 | 7 | 7 | 7 | 7 | 7 | 7 | 7 |
1、篩選出某一列大于某一個(gè)數(shù)的所有數(shù)據(jù),例如:SD1>=7
"""篩選出SD1列中大于等于7的數(shù)據(jù)""" dataframe[dataframe['SD1'] >= 7]

2、篩選出某一列大于或者小于另一列的輸有數(shù)據(jù),例如:SD1 < SD2
"""篩選出SD1列小于SD2列所有數(shù)據(jù)""" dataframe.loc[dataframe['SD1'] < dataframe['SD2']]

3、篩選出某些列的值大于或小于某些值的所有數(shù)據(jù),例如:SD1 >6并且SD1<3,使用 &
"""篩選出SD1大于6,并且SD2小于3的所有數(shù)據(jù)""" dataframe.loc[(dataframe['SD1'] > 6) & ( dataframe['SD2'] < 3)]

4、篩選出某些列的值大于或小于某些值的所有數(shù)據(jù),例如:SD1 >6或者SD1<3,使用 |
"""篩選出SD1小于6,或者SD2小于3的所有數(shù)據(jù),并集""" dataframe.loc[(dataframe['SD1'] > 6) | ( dataframe['SD2'] < 3)]

注意:需要注意的是在進(jìn)行或(|)、與(&)、非(~)運(yùn)算時(shí),各個(gè)獨(dú)立邏輯表達(dá)式需要用括號(hào)括起來(lái)
除了上邊的與或之外,pandas還提供了 all,any,對(duì)邏輯計(jì)算后的布爾值在進(jìn)行判斷,所有都為T(mén)rue,all才返回True,反之亦然,any滿足其中之一即可。all,any可傳參數(shù)axis,1為行方向,0為列方向。利用此方法可對(duì)整體數(shù)據(jù)邏輯判斷。
5、篩選出某些列的值同時(shí)大于或同時(shí)小于某值的所有數(shù)據(jù),例如SD1>6 SD2>6
"""篩選出SD1, SD2同時(shí)大于6的所有數(shù)據(jù)""" dataframe[(dataframe.loc[:,['SD1', 'SD2']] > 6).all(1)]

邏輯解讀: dataframe.loc[:,['SD1', 'SD2']] > 6,這個(gè)邏輯計(jì)算的是SD1,SD2同時(shí)大于6返回的布爾值,逗號(hào)前的冒號(hào)表示所有行,返回的是False或者True的一個(gè)dataframe數(shù)據(jù),整體在進(jìn)行.all(1),操作返回的是SD1,SD2都為T(mén)rue的為T(mén)rue,否者為False所有行數(shù)。在使用切片 [ ],進(jìn)行取數(shù)據(jù)。

總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
利用python爬取斗魚(yú)app中照片方法實(shí)例
最近在學(xué)習(xí)python,通過(guò)實(shí)踐是學(xué)習(xí)的一個(gè)好辦法,下面這篇文章就來(lái)給大家介紹了關(guān)于利用python爬取斗魚(yú)app中照片的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友下面來(lái)一起看看吧。2017-12-12
openstack中的rpc遠(yuǎn)程調(diào)用的方法
今天通過(guò)本文給大家分享openstack中的rpc遠(yuǎn)程調(diào)用的方法,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2021-07-07
在Python的列表中利用remove()方法刪除元素的教程
這篇文章主要介紹了在Python的列表中利用remove()方法刪除元素的教程,是Python入門(mén)中的基礎(chǔ)知識(shí),注意其和pop()方法的區(qū)別,需要的朋友可以參考下2015-05-05
python GUI庫(kù)圖形界面開(kāi)發(fā)之PyQt5信號(hào)與槽的高級(jí)使用技巧裝飾器信號(hào)與槽詳細(xì)使用方法與實(shí)例
這篇文章主要介紹了python GUI庫(kù)圖形界面開(kāi)發(fā)之PyQt5信號(hào)與槽的高級(jí)使用技巧裝飾器信號(hào)與槽詳細(xì)使用方法與實(shí)例,需要的朋友可以參考下2020-03-03

