欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

利用python3篩選excel中特定的行(行值滿足某個條件/行值屬于某個集合)

 更新時間:2020年09月04日 10:10:07   作者:妖白  
這篇文章主要給大家介紹了關于利用python3篩選excel中特定的行(行值滿足某個條件/行值屬于某個集合)的相關資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

前言

做數(shù)據(jù)分析的時候通常我們并不是對真?zhèn)€excel文件進行操作,換言之,每一列都是一個特征,我們需要針對分析。遇到這類問題的時候,我們通常想得到一列中所有符合條件的數(shù)據(jù),挑出來,然后組成一個單獨的文件進行分析。比如一列中我們希望找到所有大于100的所有行,又比如 我們希望得到一列中包含某個特定字母的所有行,那么我們應該怎么辦呢,這里就說一下。

在這之前我們先介紹一個pandas里面一個函數(shù) loc()

英文解釋是這樣的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的講就是標簽索引器

了解了這個函數(shù)(具體用法下面兩個例子就可以懂),我們可兩個例子 就可以選擇我們想要的行了

問題一:我們想要“behavior_type”列中所有為3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

從這個程序我們可以得出 .loc() 前面是我們的整個索引目標,括號中為索引標簽(我們回到loc英文解釋第二局話,可以索引布爾型) ,那么這么簡單一句話就可以把所以為3,4的行輸出了.后面的冒號代表從開始到最后索引

  print(df.loc[df['behavior_type'].isin([3,4]),:]) 

注意 這里的isin([ ])有小括號 也有中括號集合的形式。

我們也可以利用isin代替大于號性質(zhì)是一樣的,該標簽下所有為3,4的集合的布爾型 然后再索引

  print(df[df['behavior_type'].isin([3,4])])

提到isin 我們想到了一個更為簡單的方法,直接索引即可

問題一:我們想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已經(jīng)想到了 利用loc就可以了,只要后面加上字符串str.contains()函數(shù)即可。

那么到這里所有的問題迎刃而解,那么我們想要索取特定行呢 我們想要索取特定列呢

沒問題 讓我們繼續(xù)深入了解loc函數(shù)

df是一個dataframe,列名為A B C D

具體值如下:

A    B    C     D
0    ss   小紅  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的屬性是不定的,空值默認為NA。

一、選取標簽為A和C的列,并且選完類型還是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、選取標簽為C并且只取前兩行,選完類型還是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]] 

聰明的你發(fā)現(xiàn)loc的用法了嗎?

總結

到此這篇關于利用python3篩選excel中特定的行(行值滿足某個條件/行值屬于某個集合)的文章就介紹到這了,更多相關python3篩選excel特定的行內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

最新評論