欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas提升計(jì)算效率的一些方法匯總

 更新時(shí)間:2021年05月30日 12:18:22   作者:rs_gis  
理解 pandas 的函數(shù),要對(duì)函數(shù)式編程有一定的概念和理解,下面這篇文章主要給大家介紹了關(guān)于pandas提升計(jì)算效率的相關(guān)資料,需要的朋友可以參考下

前言

Pandas是為一次性處理整個(gè)行或列的矢量化操作而設(shè)計(jì)的,循環(huán)遍歷每個(gè)單元格、行或列并不是它的設(shè)計(jì)用途。所以,在使用Pandas時(shí),你應(yīng)該考慮高度可并行化的矩陣運(yùn)算。

一、避免使用for循環(huán)

盡量使用列號(hào)或者行號(hào)進(jìn)行矩陣檢索,避免使用for循環(huán)。

1.1使用for循環(huán)

import os
import pandas as pd
import datetime

path = r'E:\科研文件\shiyan\LZQ\LZQ_all_sampledata.csv'
def read_csv(target_csv):
    target = pd.read_csv(path,header=None,sep=',')
    return target

start_time = datetime.datetime.now()
a = read_csv(path)
for i in range(10000):
    b = a.iloc[i]
end_time = datetime.datetime.now()

print(end_time-start_time)

耗時(shí):0:00:02.455211

1.2使用行號(hào)檢索

path = r'E:\科研文件\shiyan\LZQ\LZQ_all_sampledata.csv'

def read_csv(target_csv):
    target = pd.read_csv(path,header=None,sep=',')
    return target

start_time = datetime.datetime.now()

a = read_csv(path)

b = a.iloc[10000]

end_time = datetime.datetime.now()

print(end_time-start_time)

耗時(shí):0:00:00.464756

二、使用for循環(huán)的條件下提高效率

2.0 如果必須使用for循環(huán)如何提高效率

我們可以做的最簡(jiǎn)單但非常有價(jià)值的加速是使用Pandas的內(nèi)置 .iterrows() 函數(shù)。

在上一節(jié)中編寫for循環(huán)時(shí),我們使用了 range() 函數(shù)。然而,當(dāng)我們?cè)赑ython中對(duì)大范圍的值進(jìn)行循環(huán)時(shí),生成器往往要快得多。

Pandas的 .iterrows() 函數(shù)在內(nèi)部實(shí)現(xiàn)了一個(gè)生成器函數(shù),該函數(shù)將在每次迭代中生成一行Dataframe。更準(zhǔn)確地說,.iterrows() 為DataFrame中的每一行生成(index, Series)的對(duì)(元組)。這實(shí)際上與在原始Python中使用 enumerate() 之類的東西是一樣的,但運(yùn)行速度要快得多!

生成器(Generators)
生成器函數(shù)允許你聲明一個(gè)行為類似迭代器的函數(shù),也就是說,它可以在for循環(huán)中使用。這大大簡(jiǎn)化了代碼,并且比簡(jiǎn)單的for循環(huán)更節(jié)省內(nèi)存。

當(dāng)你想要處理一個(gè)龐大的列表時(shí),比如10億個(gè)浮點(diǎn)數(shù),問題就出現(xiàn)了。使用for循環(huán),在內(nèi)存中創(chuàng)建了大量的內(nèi)存huge列表,并不是每個(gè)人都有無限的RAM來存儲(chǔ)這樣的東西!

生成器將創(chuàng)建元素時(shí),僅在需要時(shí)將它們存儲(chǔ)在內(nèi)存中。一次一個(gè)。這意味著,如果必須創(chuàng)建10億個(gè)浮點(diǎn)數(shù),那么只能一次將它們存儲(chǔ)在內(nèi)存中。Python中的range()函數(shù)使用生成器來構(gòu)建列表。

也就是說,如果你想多次迭代列表并且它足夠小以適應(yīng)內(nèi)存,那么使用for循環(huán)和range函數(shù)會(huì)更好。這是因?yàn)槊看卧L問list值時(shí),生成器和range都會(huì)重新生成它們,而range是一個(gè)靜態(tài)列表,并且內(nèi)存中已存在整數(shù)以便快速訪問。

2.1使用range

import os
import pandas as pd
import datetime

path = r'E:\科研文件\shiyan\LZQ\LZQ_all_sampledata.csv'

def read_csv(target_csv):
    target = pd.read_csv(path,header=None,sep=',')
    return target

start_time = datetime.datetime.now()

a = read_csv(path)

for data_row in range(a.shape[0]):
    b = a.iloc[data_row]

end_time = datetime.datetime.now()

print(end_time-start_time)

耗時(shí):0:00:07.642816

2.2使用 .iterrows() 代替 range

import os
import pandas as pd
import datetime
path = r'E:\科研文件\shiyan\LZQ\LZQ_all_sampledata.csv'

def read_csv(target_csv):
    target = pd.read_csv(path,header=None,sep=',')
    return target

start_time = datetime.datetime.now()

a = read_csv(path)

for index,data_row in a.iterrows():
    b = data_row

end_time = datetime.datetime.now()

print(end_time-start_time)

耗時(shí):0:00:03.513161

三、使用.apply

iterrows()函數(shù)極大地提高了速度,但我們還遠(yuǎn)遠(yuǎn)沒有完成。請(qǐng)始終記住,當(dāng)使用為向量操作設(shè)計(jì)的庫(kù)時(shí),可能有一種方法可以在完全沒有for循環(huán)的情況下最高效地完成任務(wù)。

為我們提供此功能的Pandas功能是 .apply() 函數(shù)。apply()函數(shù)接受另一個(gè)函數(shù)作為輸入,并沿著DataFrame的軸(行、列等)應(yīng)用它。在傳遞函數(shù)的這種情況下,lambda通??梢苑奖愕貙⑺袃?nèi)容打包在一起。

參考鏈接

四、其他方式

博客鏈接

總結(jié)

到此這篇關(guān)于pandas提升計(jì)算效率的文章就介紹到這了,更多相關(guān)pandas計(jì)算效率內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python用pandas讀寫和追加csv文件

    python用pandas讀寫和追加csv文件

    大家好,本篇文章主要講的是python用pandas讀寫和追加csv文件,感興趣的同學(xué)趕快來看一看吧,對(duì)你有幫助的話記得收藏一下
    2022-02-02
  • python使用websocket庫(kù)發(fā)送WSS請(qǐng)求

    python使用websocket庫(kù)發(fā)送WSS請(qǐng)求

    WebSocket是一種在客戶端和服務(wù)器之間進(jìn)行雙向通信的協(xié)議,Python中有許多WebSocket庫(kù)可供選擇,其中一個(gè)常用的是websocket庫(kù),使用該庫(kù)可以輕松地發(fā)送WSS請(qǐng)求,需要的朋友可以參考下
    2023-10-10
  • 解決python spyder 突然打不開的問題

    解決python spyder 突然打不開的問題

    這篇文章主要介紹了解決python spyder 突然打不開的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2021-05-05
  • python合并兩個(gè)字典的方法總結(jié)

    python合并兩個(gè)字典的方法總結(jié)

    在Python中,有多種方法可以通過使用各種函數(shù)和構(gòu)造函數(shù)來合并字典,在本文中,我們將討論一些合并字典的方法,有需要的小伙伴可以參考一下·
    2023-09-09
  • python tkinter制作用戶登錄界面的簡(jiǎn)單實(shí)現(xiàn)

    python tkinter制作用戶登錄界面的簡(jiǎn)單實(shí)現(xiàn)

    這篇文章主要介紹了python tkinter制作用戶登錄界面的簡(jiǎn)單實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-04-04
  • 一文詳解Python中的重試機(jī)制

    一文詳解Python中的重試機(jī)制

    本文將給大家介紹一個(gè)第三方庫(kù)-Tenacity(標(biāo)題中的重試機(jī)制并并不準(zhǔn)確,它不是 Python 的內(nèi)置模塊,因此并不能稱之為機(jī)制),它實(shí)現(xiàn)了幾乎我們可以使用到的所有重試場(chǎng)景,快跟隨小編一起學(xué)習(xí)一下吧
    2022-07-07
  • Python基礎(chǔ)之Socket通信原理

    Python基礎(chǔ)之Socket通信原理

    這篇文章主要介紹了Python基礎(chǔ)之Socket通信原理,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)python基礎(chǔ)的小伙伴們有非常好的幫助,需要的朋友可以參考下
    2021-04-04
  • python自動(dòng)生成sql語句的腳本

    python自動(dòng)生成sql語句的腳本

    這篇文章主要介紹了python自動(dòng)生成sql語句的腳本,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-02-02
  • Python Numpy中數(shù)組的集合操作詳解

    Python Numpy中數(shù)組的集合操作詳解

    這篇文章主要為大家詳細(xì)介紹了Python Numpy中數(shù)組的一些集合操作方法,文中的示例代碼講解詳細(xì),對(duì)我們學(xué)習(xí)Python有一定幫助,需要的可以參考一下
    2022-08-08
  • pycharm 如何查看某一函數(shù)源碼的快捷鍵

    pycharm 如何查看某一函數(shù)源碼的快捷鍵

    這篇文章主要介紹了在pycharm中實(shí)現(xiàn)查看某一函數(shù)源碼的快捷鍵,具有很好的參考價(jià)值,希望能給大家做個(gè)參考,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-05-05

最新評(píng)論