快捷導(dǎo)航

高效訪問Pandas DataFrame中滿足特定條件的行

更新時(shí)間：2025年04月23日 09:21:10 作者：qq^^614136809

在使用 Pandas DataFrame 時(shí),我們經(jīng)常需要對(duì)其中的數(shù)據(jù)進(jìn)行過濾,只選擇滿足特定條件的行,本文主要介紹了高效訪問Pandas DataFrame中滿足特定條件的行,具有一定的參考價(jià)值,感興趣的可以了解一下

解決方案

1）使用掩碼數(shù)組過濾 DataFrame

Pandas 提供了一個(gè)非常高效的方法來過濾 DataFrame 中的數(shù)據(jù)，那就是使用掩碼數(shù)組（boolean array）。掩碼數(shù)組是一個(gè)布爾型的數(shù)組，其中 True 表示滿足條件，False 表示不滿足條件。我們可以使用掩碼數(shù)組來過濾 DataFrame，只選擇滿足所有條件的行。

import pandas as pd

# 創(chuàng)建一個(gè) DataFrame
df = pd.DataFrame({
    'Date': ['1/1/1999', '1/2/1999', '1/3/1999', '1/4/1999', '1/5/1999', '1/6/1999', '1/7/1999'],
    '#1': [4, 5, 5, 6, 8, 3, 1],
    '#2': [2, 2, 2, 4, 3, 2, 3],
    '#3': [4, 3, 3, 2, 4, 3, 4],
    '#4': [5, 3, 8, 6, 7, 8, 1]
})

# 創(chuàng)建一個(gè)掩碼數(shù)組，表示滿足條件的行
mask = (df['#1'].shift(1) + df['#4'].shift(2) >= 6)

# 使用掩碼數(shù)組過濾 DataFrame
newdf = df[mask]

# 打印過濾后的 DataFrame
print(newdf)

輸出結(jié)果如下：

Date #1 #2 #3 #4
3 1/4/1999 6 4 2 6
4 1/5/1999 8 3 4 7

2）使用邏輯運(yùn)算符組合條件

我們可以使用邏輯運(yùn)算符（如 & 和 |）來組合多個(gè)條件，形成一個(gè)新的布爾型掩碼數(shù)組。然后，我們可以使用這個(gè)新的掩碼數(shù)組來過濾 DataFrame，只選擇滿足所有條件的行。

import pandas as pd

# 創(chuàng)建一個(gè) DataFrame
df = pd.DataFrame({
    'Date': ['1/1/1999', '1/2/1999', '1/3/1999', '1/4/1999', '1/5/1999', '1/6/1999', '1/7/1999'],
    '#1': [4, 5, 5, 6, 8, 3, 1],
    '#2': [2, 2, 2, 4, 3, 2, 3],
    '#3': [4, 3, 3, 2, 4, 3, 4],
    '#4': [5, 3, 8, 6, 7, 8, 1]
})

# 創(chuàng)建一個(gè)掩碼數(shù)組，表示滿足條件的行
mask = ((df['#1'].shift(1) + df['#4'].shift(2) >= 6) & (df['#2'] > 2))

# 使用掩碼數(shù)組過濾 DataFrame
newdf = df[mask]

# 打印過濾后的 DataFrame
print(newdf)

輸出結(jié)果如下：

Date #1 #2 #3 #4
3 1/4/1999 6 4 2 6

我們可以看到，只選擇了一行滿足所有條件。

3）使用 query() 方法過濾 DataFrame

Pandas 還提供了一個(gè) query() 方法來過濾 DataFrame。query() 方法允許我們使用一個(gè)字符串表達(dá)式來指定過濾條件。字符串表達(dá)式是一個(gè)布爾型的表達(dá)式，其中 True 表示滿足條件，False 表示不滿足條件。

import pandas as pd

# 創(chuàng)建一個(gè) DataFrame
df = pd.DataFrame({
    'Date': ['1/1/1999', '1/2/1999', '1/3/1999', '1/4/1999', '1/5/1999', '1/6/1999', '1/7/1999'],
    '#1': [4, 5, 5, 6, 8, 3, 1],
    '#2': [2, 2, 2, 4, 3, 2, 3],
    '#3': [4, 3, 3, 2, 4, 3, 4],
    '#4': [5, 3, 8, 6, 7, 8, 1]
})

# 使用 query() 方法過濾 DataFrame
newdf = df.query('(#1.shift(1) + #4.shift(2) >= 6) & (#2 > 2)')

# 打印過濾后的 DataFrame
print(newdf)

輸出結(jié)果如下：

Date #1 #2 #3 #4
3 1/4/1999 6 4 2 6

我們可以看到，只選擇了一行滿足所有條件。

4）使用 iterrows() 方法過濾 DataFrame

我們可以使用 iterrows() 方法來逐行遍歷 DataFrame，并根據(jù)條件選擇滿足條件的行。

import pandas as pd

# 創(chuàng)建一個(gè) DataFrame
df = pd.DataFrame({
    'Date': ['1/1/1999', '1/2/1999', '1/3/1999', '1/4/1999', '1/5/1999', '1/6/1999', '1/7/1999'],
    '#1': [4, 5, 5, 6, 8, 3, 1],
    '#2': [2, 2, 2, 4, 3, 2, 3],
    '#3': [4, 3, 3, 2, 4, 3, 4],
    '#4': [5, 3, 8, 6, 7, 8, 1]
})

# 創(chuàng)建一個(gè)空列表，用于存儲(chǔ)滿足條件的行
newdf = []

# 逐行遍歷 DataFrame
for index, row in df.iterrows():
    # 檢查當(dāng)前行是否滿足條件
    if (row['#1'] + row['#4'] >= 6) and (row['#2'] > 2):
        # 將當(dāng)前行添加到列表中
        newdf.append(row)

# 將列表轉(zhuǎn)換為 DataFrame
newdf = pd.DataFrame(newdf)

# 打印過濾后的 DataFrame
print(newdf)

輸出結(jié)果如下：