欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

讓Python更加充分的使用Sqlite3

 更新時間:2017年12月11日 11:39:53   作者:圣潔之子  
這篇文章主要為大家詳細(xì)介紹了Python更加充分的使用Sqlite3的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下

我最近在涉及大量數(shù)據(jù)處理的項目中頻繁使用 sqlite3。我最初的嘗試根本不涉及任何數(shù)據(jù)庫,所有的數(shù)據(jù)都將保存在內(nèi)存中,包括字典查找、迭代和條件等查詢。這很好,但可以放入內(nèi)存的只有那么多,并且將數(shù)據(jù)從磁盤重新生成或加載到內(nèi)存是一個繁瑣又耗時的過程。

我決定試一試sqlite3。因為只需打開與數(shù)據(jù)庫的連接,這樣可以增加可處理的數(shù)據(jù)量,并將應(yīng)用程序的加載時間減少到零。此外,我可以通過 SQL 查詢替換很多Python邏輯語句。

我想分享一些關(guān)于這次經(jīng)歷的心得和發(fā)現(xiàn)。

TL;DR

  • 使用大量操作 (又名 executemany)。
  • 你不需要使用光標(biāo) (大部分時間)。
  • 光標(biāo)可被迭代。
  • 使用上下文管理器。
  • 使用編譯指示 (當(dāng)它有意義)。
  • 推遲索引創(chuàng)建。
  • 使用占位符來插入 python 值。

1. 使用大量操作

如果你需要在數(shù)據(jù)庫中一次性插入很多行,那么你真不應(yīng)該使用 execute。sqlite3 模塊提供了批量插入的方式:executemany。

而不是像這樣做:

for row in iter_data():
connection.execute('INSERT INTO my_table VALUES (?)', row)

你可以利用這個事實,即 executemany 接受元組的生成器作為參數(shù):

connection.executemany(
 'INSERT INTO my_table VALUE (?)',
  iter_data()
)

這不僅更簡潔,而且更高效。實際上,sqlite3 在幕后利用 executemany 實現(xiàn) execute,但后者插入一行而不是多行。

我寫了一個小的基準(zhǔn)測試,將一百萬行插入空表(數(shù)據(jù)庫在內(nèi)存中):
executemany: 1.6 秒
execute: 2.7 秒

2. 你不需要游標(biāo)

一開始我經(jīng)常搞混的事情就是,光標(biāo)管理。在線示例和文檔中通常如下:

connection = sqlite3.connect(':memory:')
cursor = connection.cursor()
# Do something with cursor

但大多數(shù)情況下,你根本不需要光標(biāo),你可以直接使用連接對象(本文末尾會提到)。像execute和executemany類似的操作可以直接在連接上調(diào)用。以下是一個證明此事的示例:

import sqlite3
connection = sqlite3(':memory:')
# Create a table
connection.execute('CREATE TABLE events(ts, msg)')
# Insert values
connection.executemany(
 'INSERT INTO events VALUES (?,?)',
  [
    (1, 'foo'),
    (2, 'bar'),
    (3, 'baz')
  ]
)
# Print inserted rows
for row in connnection.execute('SELECT * FROM events'):
  print(row)

3. 光標(biāo)(Cursor)可被用于迭代

你可能經(jīng)常會看到使用fetchone或fetchall來處理SELECT查詢結(jié)果的示例。但是我發(fā)現(xiàn)處理這些結(jié)果的最自然的方式是直接在光標(biāo)上迭代:

for row in connection.execute('SELECT * FROM events'):
 print(row)

這樣一來,只要你得到足夠的結(jié)果,你就可以終止查詢,并且不會引起資源浪費。當(dāng)然,如果事先知道你需要多少結(jié)果,可以改用LIMIT SQL語句,但Python生成器是非常方便的,可以讓你將數(shù)據(jù)生成與數(shù)據(jù)消耗分離。

4. 使用Context Managers(上下文管理器)

即使在處理SQL事務(wù)的中間,也會發(fā)生討厭的事情。為了避免手動處理回滾或提交,你可以簡單地使用連接對象作為上下文管理器。 在以下示例中,我們創(chuàng)建了一個表,并錯誤地插入了重復(fù)的值:

import sqlite3
connection = sqlite3.connect(':memory:')
with connection:
  connection.execute(
 'CREATE TABLE events(ts, msg, PRIMARY KEY(ts, msg))')
try:
  with connection:
    connection.executemany('INSERT INTO events VALUES (?, ?)', [
      (1, 'foo'),
      (2, 'bar'),
      (3, 'baz'),
      (1, 'foo'),
    ])
except (sqlite3.OperationalError, sqlite3.IntegrityError) as e:
  print('Could not complete operation:', e)
# No row was inserted because transaction failed
for row in connection.execute('SELECT * FROM events'):
  print(row)
connection.close()

5. 使用Pragmas

…當(dāng)它真的有用時

在你的程序中有幾個 pragma 可用于調(diào)整 sqlite3 的行為。特別地,其中一個可以改善性能的是synchronous:

connection.execute('PRAGMA synchronous = OFF')

你應(yīng)該知道這可能是危險的。如果應(yīng)用程序在事務(wù)中間意外崩潰,數(shù)據(jù)庫可能會處于不一致的狀態(tài)。所以請小心使用! 但是如果你要更快地插入很多行,那么這可能是一個選擇。

6. 推遲索引創(chuàng)建

假設(shè)你需要在數(shù)據(jù)庫上創(chuàng)建幾個索引,而你需要在插入很多行的同時創(chuàng)建索引。把索引的創(chuàng)建推遲到所有行的插入之后可以導(dǎo)致實質(zhì)性的性能改善。

7. 使用占位符插入 Python 值

使用 Python 字符串操作將值包含到查詢中是很方便的。但是這樣做非常不安全,而 sqlite3 給你提供了更好的方法來做到這一點:

# Do not do this!
my_timestamp = 1
c.execute("SELECT * FROM events WHERE ts = '%s'" % my_timestamp)
# Do this instead
my_timestamp = (1,)
c.execute('SELECT * FROM events WHERE ts = ?', my_timestamp)

此外,使用Python%s(或格式或格式的字符串常量)的字符串插值對于executemany來說并不是總是可行。所以在此嘗試沒有什么真正意義!

請記住,這些小技巧可能會(也可能不會)給你帶來好處,具體取決于特定的用例。你應(yīng)該永遠(yuǎn)自己去嘗試,決定是否值得這么做。

英文:remusao,譯文:oschina

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。

相關(guān)文章

  • Django 模板中常用的過濾器實現(xiàn)

    Django 模板中常用的過濾器實現(xiàn)

    在模版中,有時候需要對一些數(shù)據(jù)進(jìn)行處理以后才能使用。一般在Python中我們是通過函數(shù)的形式來完成的。而在模版中,則是通過過濾器來實現(xiàn)的,本文就來介紹一下如何實現(xiàn)
    2021-05-05
  • 在win64上使用bypy進(jìn)行百度網(wǎng)盤文件上傳功能

    在win64上使用bypy進(jìn)行百度網(wǎng)盤文件上傳功能

    這篇文章主要介紹了在win64上使用bypy進(jìn)行百度網(wǎng)盤文件上傳功能,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-01-01
  • Python實現(xiàn)批量自動整理文件

    Python實現(xiàn)批量自動整理文件

    本文將利用Python制作一個批量自動整理文件的小工具,可以自定義整理某一個路徑下面的所有需要被整理的文件。感興趣的小伙伴可以了解一下
    2022-03-03
  • python繪制餅圖和直方圖的方法

    python繪制餅圖和直方圖的方法

    這篇文章主要為大家詳細(xì)介紹了python繪制餅圖和直方圖的方法,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2022-04-04
  • python獲取的html中都是\\u003e實現(xiàn)轉(zhuǎn)成正確字符

    python獲取的html中都是\\u003e實現(xiàn)轉(zhuǎn)成正確字符

    這篇文章主要介紹了python獲取的html中都是\\u003e實現(xiàn)轉(zhuǎn)成正確字符方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-07-07
  • Django如何重置migration的幾種情景

    Django如何重置migration的幾種情景

    這篇文章主要介紹了Django如何重置migration的幾種情景,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-02-02
  • Python數(shù)據(jù)傳輸黏包問題

    Python數(shù)據(jù)傳輸黏包問題

    這篇文章主要介紹了Python數(shù)據(jù)傳輸黏包問題,黏包指數(shù)據(jù)與數(shù)據(jù)之間沒有明確的分界線,導(dǎo)致不能正確的讀取數(shù)據(jù),更多相關(guān)內(nèi)容需要的小伙伴可以參考一下
    2022-04-04
  • Python2包含中文報錯的解決方法

    Python2包含中文報錯的解決方法

    這篇文章主要給大家介紹了關(guān)于Python2包含中文報錯的解決方法,文中通過示例代碼詳細(xì)介紹了解決的方法,相信會對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2018-07-07
  • 詳細(xì)探究Python中的字典容器

    詳細(xì)探究Python中的字典容器

    這篇文章主要介紹了Python中的字典容器,本文來自于IBM官方網(wǎng)站技術(shù)文檔,需要的朋友可以參考下
    2015-04-04
  • Python實現(xiàn)多子圖繪制系統(tǒng)的示例詳解

    Python實現(xiàn)多子圖繪制系統(tǒng)的示例詳解

    這篇文章主要介紹了如何利用python實現(xiàn)多子圖繪制系統(tǒng),文中的示例代碼講解詳細(xì),具有一定的的參考價值,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-09-09

最新評論