欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

解決python存數(shù)據(jù)庫(kù)速度太慢的問(wèn)題

 更新時(shí)間:2021年04月07日 10:43:07   作者:馬里奧愛(ài)學(xué)習(xí)  
這篇文章主要介紹了解決python存數(shù)據(jù)庫(kù)速度太慢的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

問(wèn)題

在項(xiàng)目中遇到一個(gè)問(wèn)題,需要從文本中讀取三萬(wàn)條數(shù)據(jù)寫入mysql數(shù)據(jù)庫(kù),文件中為用@分割的sql語(yǔ)句,但是在讀取的過(guò)程中發(fā)現(xiàn)速度過(guò)慢,三萬(wàn)八千條數(shù)據(jù)需要220秒,問(wèn)題代碼片段如下:

def read_to_mysql(filecata, targetDir):
 '''
 用來(lái)寫入數(shù)據(jù)庫(kù),寫入后會(huì)剪貼掉文件
 filecata 為保存有文件地址的list,已去掉尾部的空格
 :param filecata: 文件目錄
 :param targetDir: 要復(fù)制的目標(biāo)目錄
 :return:
 '''
 root_dir = os.path.abspath(os.path.join(os.getcwd(), "./"))
 config = configparser.ConfigParser()
 config.read(root_dir + "/config.ini")
 __host = config.get("DatabaseOfWRT", "host")
 __database_name = config.get("DatabaseOfWRT", "database")
 __user_name = config.get("DatabaseOfWRT", "username")
 __user_passwaord = config.get("DatabaseOfWRT", "password")
 __charset = config.get("DatabaseOfWRT", "charset")
 conn = pymysql.connect(
  host=__host,
  user=__user_name, password=__user_passwaord,
  database=__database_name,
  charset=__charset
 )
 cursor = conn.cursor()
 with open(filecata, "r", encoding='utf-8') as f:
  data = f.read() # 讀取文件
  data_list = data.split('@')
  del data_list[-1]
  starttime = int(time.time())
  for data_str in data_list:
   data_str = str(data_str)
   sql = data_str + ';'
   cursor.execute(sql)
   conn.commit()
   print(flag)
 copy_del_file(filecata, targetDir) # 用來(lái)剪切的函數(shù),此處不影響,因而省略
 cursor.close()
 conn.close()

解決方案

經(jīng)測(cè)試發(fā)現(xiàn),影響速度的主要原因是commit(),因?yàn)闆](méi)過(guò)幾秒提交一次即可,但是因?yàn)樘峤坏淖址L(zhǎng)度有限制,所以要設(shè)置一個(gè)合理的時(shí)間讀取,代碼修改如下:

def read_to_mysql(filecata, targetDir):
 '''
 用來(lái)寫入數(shù)據(jù)庫(kù),寫入后會(huì)剪貼掉文件
 filecata 為保存有文件地址的list,已去掉尾部的空格
 :param filecata:
 :param targetDir: 要復(fù)制的目標(biāo)目錄
 :return:
 '''
 root_dir = os.path.abspath(os.path.join(os.getcwd(), "./"))
 config = configparser.ConfigParser()
 config.read(root_dir + "/config.ini")
 __host = config.get("DatabaseOfWRT", "host")
 __database_name = config.get("DatabaseOfWRT", "database")
 __user_name = config.get("DatabaseOfWRT", "username")
 __user_passwaord = config.get("DatabaseOfWRT", "password")
 __charset = config.get("DatabaseOfWRT", "charset")
 conn = pymysql.connect(
  host=__host,
  user=__user_name, password=__user_passwaord,
  database=__database_name,
  charset=__charset
 )
 cursor = conn.cursor()
 with open(filecata, "r", encoding='utf-8') as f:
  data = f.read() # 讀取文件
  data_list = data.split('@')
  del data_list[-1]
  starttime = int(time.time())
  for data_str in data_list:
   endtime = int(time.time())
   data_str = str(data_str)
   sql = data_str + ';'
   cursor.execute(sql)
   if endtime - starttime ==10: # 每過(guò)十秒提交一次
    starttime = int(time.time())
    conn.commit()
 conn.commit()
 copy_del_file(filecata, targetDir)
 cursor.close()
 conn.close()
 return flag

此時(shí)寫入三萬(wàn)八千條數(shù)據(jù)需要9秒

補(bǔ)充:python 連數(shù)據(jù)庫(kù)cursur.fetchall ()速度慢的解決方案

解決游標(biāo)遍歷慢的方法:

一行一行去遍歷,而不是一下全部讀取出來(lái)

將cursur.fetchall()更改為for i in cursur:

補(bǔ)充:python 讀取文件時(shí)速度的問(wèn)題

"""舉例 讀取文件"""
# 第一種方式
with open('test.txt', 'r', encoding='utf-8') as f:
 info = f.readlines()
 for line in info:
 pass
# 第二種方式
with open('test.txt', 'r', encoding='utf-8') as f:
 for line in f:
 pass

對(duì)于以上兩種方式讀取文件,各自有各自的用途,當(dāng)用兩種方式都可以時(shí),第二種方式的效率是第一種的幾個(gè)量級(jí), readlines()將文件內(nèi)容讀取到內(nèi)存的list中,操作雖然方便,但是消耗內(nèi)存,運(yùn)行效率慢。

原生的f是將文件內(nèi)容讀到生成器中, 當(dāng)需要操作時(shí),從生成器中循環(huán)出來(lái),速度很快,操作大文件時(shí)建議用第二種方式!

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。

相關(guān)文章

  • Keras - GPU ID 和顯存占用設(shè)定步驟

    Keras - GPU ID 和顯存占用設(shè)定步驟

    這篇文章主要介紹了Keras - GPU ID 和顯存占用設(shè)定步驟,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-06-06
  • Python實(shí)現(xiàn)超快窗口截圖功能詳解

    Python實(shí)現(xiàn)超快窗口截圖功能詳解

    這篇文章主要為大家詳細(xì)介紹了如何利用Python語(yǔ)言實(shí)現(xiàn)超快窗口截圖功能,可以自動(dòng)獲取當(dāng)前活動(dòng)窗口并展示截圖,感興趣的可以了解一下
    2022-05-05
  • python中numpy?常用操作總結(jié)

    python中numpy?常用操作總結(jié)

    這篇文章主要介紹了python中numpy常用操作總結(jié),NumPy是Python語(yǔ)言的一個(gè)擴(kuò)充程序庫(kù),支持大量高維度數(shù)組與矩陣運(yùn)算,此外也針對(duì)數(shù)組運(yùn)算提供大量的數(shù)學(xué)函數(shù)庫(kù)
    2022-09-09
  • python3.9.1環(huán)境安裝的方法(圖文)

    python3.9.1環(huán)境安裝的方法(圖文)

    這篇文章主要介紹了python3.9.1環(huán)境安裝的方法(圖文),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2021-02-02
  • numpy展平數(shù)組ndarray.flatten()詳解

    numpy展平數(shù)組ndarray.flatten()詳解

    這篇文章主要介紹了numpy展平數(shù)組ndarray.flatten()詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-06-06
  • 快速上手Python Kafka庫(kù)安裝攻略

    快速上手Python Kafka庫(kù)安裝攻略

    想要在Python中使用Kafka庫(kù)嗎?不用擔(dān)心,我們的安裝指南將幫助你快速上手,無(wú)論你是初學(xué)者還是有經(jīng)驗(yàn)的開(kāi)發(fā)者,這篇指南都能滿足你的需求,跟著我們一起來(lái)探索如何輕松安裝Python Kafka庫(kù)吧!
    2023-12-12
  • 利用python將?Matplotlib?可視化插入到?Excel表格中

    利用python將?Matplotlib?可視化插入到?Excel表格中

    這篇文章主要介紹了利用python將?Matplotlib?可視化?插入到?Excel?表格中,通過(guò)使用xlwings模塊來(lái)控制Excel插入圖表,具體詳細(xì)需要的朋友可以參考下面文章內(nèi)容
    2022-06-06
  • python 通過(guò)郵件控制實(shí)現(xiàn)遠(yuǎn)程控制電腦操作

    python 通過(guò)郵件控制實(shí)現(xiàn)遠(yuǎn)程控制電腦操作

    這篇文章主要介紹了python 通過(guò)郵件控制電腦實(shí)現(xiàn)遠(yuǎn)程控制操作,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-03-03
  • python matplotlib工具欄源碼探析三之添加、刪除自定義工具項(xiàng)的案例詳解

    python matplotlib工具欄源碼探析三之添加、刪除自定義工具項(xiàng)的案例詳解

    這篇文章主要介紹了python matplotlib工具欄源碼探析三之添加、刪除自定義工具項(xiàng)的案例詳解,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-02-02
  • Python基于百度云文字識(shí)別API

    Python基于百度云文字識(shí)別API

    這篇文章主要介紹了Python基于百度云文字識(shí)別API,用Python實(shí)現(xiàn)最簡(jiǎn)單的文字識(shí)別,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-12-12

最新評(píng)論