python數(shù)據(jù)處理之如何選取csv文件中某幾行的數(shù)據(jù)
前言
有些人看到這個(gè)問題覺得不是問題,是嘛,不就是df.col[]函數(shù)嘛,其實(shí)忽略了一個(gè)重點(diǎn),那就是我們要省去把csv文件全部讀取這個(gè)過程,因?yàn)槿绻诿媾R億萬級(jí)別的大規(guī)模數(shù)據(jù),得到的結(jié)果就是boom,boom,boom。
我們要使用一下現(xiàn)成的函數(shù)里面的參數(shù)nrows,和skiprows,一個(gè)代表你要讀幾行,一個(gè)代表你從哪開始讀,這就可以了,比如從第3行讀取4個(gè)
示例代碼
import pandas as pd df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9],'b':[22,33,44,55,66,77,88,99,10]}) df.to_csv('test.csv') dt = pd.read_csv('test.csv',skiprows=5,nrows=3) print(dt) out: 4 5 66 0 5 6 77 1 6 7 88 2 7 8 99 3 8 9 10
就可以了,不過這個(gè)列頭不知道是怎么回事,順便如果想根據(jù)列值找index,可以參考下面的
然后
df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]}, index=[10,20,30,40,50]) print(df) a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist() print(a) df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]}, index=[10,20,30,40,50]) print(df) a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist() print(a)
問題得到了解決
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。
相關(guān)文章
PyInstaller如何打包依賴文件至目標(biāo)程序目錄
這篇文章主要介紹了PyInstaller如何打包依賴文件至目標(biāo)程序目錄,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-02-02BeautifulSoup中find和find_all的使用詳解
這篇文章主要介紹了BeautifulSoup中find和find_all的使用詳解,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12Python面向?qū)ο笾瓷?自省機(jī)制實(shí)例分析
這篇文章主要介紹了Python面向?qū)ο笾瓷?自省機(jī)制,結(jié)合實(shí)例形式分析了Python面向?qū)ο蟪绦蛟O(shè)計(jì)中的反射/自省機(jī)制概念、原理及相關(guān)屬性操作技巧,需要的朋友可以參考下2018-08-08