利用python3篩選excel中特定的行(行值滿足某個條件/行值屬于某個集合)
前言
做數(shù)據(jù)分析的時候通常我們并不是對真?zhèn)€excel文件進行操作,換言之,每一列都是一個特征,我們需要針對分析。遇到這類問題的時候,我們通常想得到一列中所有符合條件的數(shù)據(jù),挑出來,然后組成一個單獨的文件進行分析。比如一列中我們希望找到所有大于100的所有行,又比如 我們希望得到一列中包含某個特定字母的所有行,那么我們應該怎么辦呢,這里就說一下。
在這之前我們先介紹一個pandas里面一個函數(shù) loc()
英文解釋是這樣的:Purely label-location based indexer for selection by label.
.loc[] is primarily label based, but may also be used with a boolean array.
最通俗的講就是標簽索引器
了解了這個函數(shù)(具體用法下面兩個例子就可以懂),我們可兩個例子 就可以選擇我們想要的行了
問題一:我們想要“behavior_type”列中所有為3或4的行
import pandas as pd import numpy as np import csv for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): print(df.loc[df['behavior_type']>1,:])
從這個程序我們可以得出 .loc() 前面是我們的整個索引目標,括號中為索引標簽(我們回到loc英文解釋第二局話,可以索引布爾型) ,那么這么簡單一句話就可以把所以為3,4的行輸出了.后面的冒號代表從開始到最后索引
print(df.loc[df['behavior_type'].isin([3,4]),:])
注意 這里的isin([ ])有小括號 也有中括號集合的形式。
我們也可以利用isin代替大于號性質(zhì)是一樣的,該標簽下所有為3,4的集合的布爾型 然后再索引
print(df[df['behavior_type'].isin([3,4])])
提到isin 我們想到了一個更為簡單的方法,直接索引即可
問題一:我們想要“user_geohash”列中所有含有字母‘qo'的行
print(df.loc[df['user_geohash'].str.contains('qo')])
是不是已經(jīng)想到了 利用loc就可以了,只要后面加上字符串str.contains()函數(shù)即可。
那么到這里所有的問題迎刃而解,那么我們想要索取特定行呢 我們想要索取特定列呢
沒問題 讓我們繼續(xù)深入了解loc函數(shù)
df是一個dataframe,列名為A B C D
具體值如下:
A B C D
0 ss 小紅 8
1 aa 小明 d
4 f f
6 ak 小紫 7
dataframe里的屬性是不定的,空值默認為NA。
一、選取標簽為A和C的列,并且選完類型還是dataframe
df = df.loc[:, ['A', 'C']] df = df.iloc[:, [0, 2]]
二、選取標簽為C并且只取前兩行,選完類型還是dataframe
df = df.loc[0:2, ['A', 'C']] df = df.iloc[0:2, [0, 2]]
聰明的你發(fā)現(xiàn)loc的用法了嗎?
總結
到此這篇關于利用python3篩選excel中特定的行(行值滿足某個條件/行值屬于某個集合)的文章就介紹到這了,更多相關python3篩選excel特定的行內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
詳解Python執(zhí)行py文件是否需要可執(zhí)行權限
這篇文章主要通過幾個案例為大家詳細介紹一下在Python中執(zhí)行py文件是否需要可執(zhí)行權限,文中的示例代碼講解詳細,對我們學習Python有一定幫助,需要的可以了解一下2023-03-03Python的math模塊中的常用數(shù)學函數(shù)整理
這篇文章主要介紹了Python的math模塊中的常用數(shù)學函數(shù)整理,同時對運算符的運算優(yōu)先級作了一個羅列,需要的朋友可以參考下2016-02-02python lambda函數(shù)及三個常用的高階函數(shù)
這篇文章主要介紹了python lambda函數(shù)及三個常用的高階函數(shù),本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2020-02-02python監(jiān)控進程狀態(tài),記錄重啟時間及進程號的實例
今天小編就為大家分享一篇python監(jiān)控進程狀態(tài),記錄重啟時間及進程號的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-07-07