pandas按若干個(gè)列的組合條件篩選數(shù)據(jù)的方法
還是用圖說(shuō)話
A文件:
比如,我想篩選出“設(shè)計(jì)井別”、“投產(chǎn)井別”、“目前井別”三列數(shù)據(jù)都為11的數(shù)據(jù),結(jié)果如下:
當(dāng)然,這里的篩選條件可以根據(jù)用戶需要自由調(diào)整,代碼如下:
# -*- coding: utf-8 -*- """ Created on Wed Nov 29 10:46:31 2017 @author: wq """ import pandas as pd #input.csv是那個(gè)大文件,有很多很多行 df1 = pd.read_csv(u'input.csv', encoding='gbk') #加encoding=‘gbk'是因?yàn)槲募写嬖谥形?,不加可能出現(xiàn)亂碼 #這里的篩選條件可以根據(jù)用戶需要進(jìn)行修改 outfile = df1[(df1[u'設(shè)計(jì)井別']=='11') & (df1[u'投產(chǎn)井別']=='11') &(df1[u'目前井別']=='11')] outfile.to_csv('outfile.csv', index=False, encoding='gbk')
有時(shí)我們也會(huì)有相反的一個(gè)需求,需要?jiǎng)h除“設(shè)計(jì)井別”、“投產(chǎn)井別”、“目前井別”三列數(shù)據(jù)都為11的那些行,效果如下:
代碼如下:
#input.csv是那個(gè)大文件,有很多很多行 df1 = pd.read_csv(u'input.csv', encoding='gbk') df2 = pd.read_csv(u'outfile.csv', encoding='gbk') #加encoding=‘gbk'是因?yàn)槲募写嬖谥形?,不加可能出現(xiàn)亂碼 index = ~df1[u'漢字井號(hào)'].isin(df2[u'漢字井號(hào)']) df4 = df1[index] df4.to_csv('outfile1.csv', index=False, encoding='gbk')
以上這篇pandas按若干個(gè)列的組合條件篩選數(shù)據(jù)的方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python 判斷是否為質(zhì)數(shù)或素?cái)?shù)的實(shí)例
下面小編就為大家?guī)?lái)一篇Python 判斷是否為質(zhì)數(shù)或素?cái)?shù)的實(shí)例。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-10-10Python處理JSON時(shí)的值報(bào)錯(cuò)及編碼報(bào)錯(cuò)的兩則解決實(shí)錄
這篇文章主要介紹了Python處理JSON時(shí)的值報(bào)錯(cuò)及編碼報(bào)錯(cuò)的兩則解決實(shí)錄,在這里還是想建議一下使用Python 3.x版本,Python 3默認(rèn)的Unicode編碼能在實(shí)際使用中為我們省去不少問(wèn)題,需要的朋友可以參考下2016-06-06Python使用re模塊實(shí)現(xiàn)正則表達(dá)式操作指南
在Python中需要通過(guò)正則表達(dá)式對(duì)字符串進(jìn)?匹配的時(shí)候,可以使??個(gè)python自帶的模塊,名字為re,下面這篇文章主要給大家介紹了關(guān)于Python使用re模塊實(shí)現(xiàn)正則表達(dá)式操作的相關(guān)資料,需要的朋友可以參考下2022-07-07python?基于aiohttp的異步爬蟲(chóng)實(shí)戰(zhàn)詳解
這篇文章主要為大家介紹了python?基于aiohttp的異步爬蟲(chóng)實(shí)戰(zhàn)詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-09-09