讓Python更加充分的使用Sqlite3
我最近在涉及大量數(shù)據(jù)處理的項目中頻繁使用 sqlite3。我最初的嘗試根本不涉及任何數(shù)據(jù)庫,所有的數(shù)據(jù)都將保存在內(nèi)存中,包括字典查找、迭代和條件等查詢。這很好,但可以放入內(nèi)存的只有那么多,并且將數(shù)據(jù)從磁盤重新生成或加載到內(nèi)存是一個繁瑣又耗時的過程。
我決定試一試sqlite3。因為只需打開與數(shù)據(jù)庫的連接,這樣可以增加可處理的數(shù)據(jù)量,并將應(yīng)用程序的加載時間減少到零。此外,我可以通過 SQL 查詢替換很多Python邏輯語句。
我想分享一些關(guān)于這次經(jīng)歷的心得和發(fā)現(xiàn)。
TL;DR
- 使用大量操作 (又名 executemany)。
- 你不需要使用光標(biāo) (大部分時間)。
- 光標(biāo)可被迭代。
- 使用上下文管理器。
- 使用編譯指示 (當(dāng)它有意義)。
- 推遲索引創(chuàng)建。
- 使用占位符來插入 python 值。
1. 使用大量操作
如果你需要在數(shù)據(jù)庫中一次性插入很多行,那么你真不應(yīng)該使用 execute。sqlite3 模塊提供了批量插入的方式:executemany。
而不是像這樣做:
for row in iter_data(): connection.execute('INSERT INTO my_table VALUES (?)', row)
你可以利用這個事實,即 executemany 接受元組的生成器作為參數(shù):
connection.executemany( 'INSERT INTO my_table VALUE (?)', iter_data() )
這不僅更簡潔,而且更高效。實際上,sqlite3 在幕后利用 executemany 實現(xiàn) execute,但后者插入一行而不是多行。
我寫了一個小的基準(zhǔn)測試,將一百萬行插入空表(數(shù)據(jù)庫在內(nèi)存中):
executemany: 1.6 秒
execute: 2.7 秒
2. 你不需要游標(biāo)
一開始我經(jīng)常搞混的事情就是,光標(biāo)管理。在線示例和文檔中通常如下:
connection = sqlite3.connect(':memory:') cursor = connection.cursor() # Do something with cursor
但大多數(shù)情況下,你根本不需要光標(biāo),你可以直接使用連接對象(本文末尾會提到)。像execute和executemany類似的操作可以直接在連接上調(diào)用。以下是一個證明此事的示例:
import sqlite3 connection = sqlite3(':memory:') # Create a table connection.execute('CREATE TABLE events(ts, msg)') # Insert values connection.executemany( 'INSERT INTO events VALUES (?,?)', [ (1, 'foo'), (2, 'bar'), (3, 'baz') ] ) # Print inserted rows for row in connnection.execute('SELECT * FROM events'): print(row)
3. 光標(biāo)(Cursor)可被用于迭代
你可能經(jīng)常會看到使用fetchone或fetchall來處理SELECT查詢結(jié)果的示例。但是我發(fā)現(xiàn)處理這些結(jié)果的最自然的方式是直接在光標(biāo)上迭代:
for row in connection.execute('SELECT * FROM events'): print(row)
這樣一來,只要你得到足夠的結(jié)果,你就可以終止查詢,并且不會引起資源浪費。當(dāng)然,如果事先知道你需要多少結(jié)果,可以改用LIMIT SQL語句,但Python生成器是非常方便的,可以讓你將數(shù)據(jù)生成與數(shù)據(jù)消耗分離。
4. 使用Context Managers(上下文管理器)
即使在處理SQL事務(wù)的中間,也會發(fā)生討厭的事情。為了避免手動處理回滾或提交,你可以簡單地使用連接對象作為上下文管理器。 在以下示例中,我們創(chuàng)建了一個表,并錯誤地插入了重復(fù)的值:
import sqlite3 connection = sqlite3.connect(':memory:') with connection: connection.execute( 'CREATE TABLE events(ts, msg, PRIMARY KEY(ts, msg))') try: with connection: connection.executemany('INSERT INTO events VALUES (?, ?)', [ (1, 'foo'), (2, 'bar'), (3, 'baz'), (1, 'foo'), ]) except (sqlite3.OperationalError, sqlite3.IntegrityError) as e: print('Could not complete operation:', e) # No row was inserted because transaction failed for row in connection.execute('SELECT * FROM events'): print(row) connection.close()
5. 使用Pragmas
…當(dāng)它真的有用時
在你的程序中有幾個 pragma 可用于調(diào)整 sqlite3 的行為。特別地,其中一個可以改善性能的是synchronous:
connection.execute('PRAGMA synchronous = OFF')
你應(yīng)該知道這可能是危險的。如果應(yīng)用程序在事務(wù)中間意外崩潰,數(shù)據(jù)庫可能會處于不一致的狀態(tài)。所以請小心使用! 但是如果你要更快地插入很多行,那么這可能是一個選擇。
6. 推遲索引創(chuàng)建
假設(shè)你需要在數(shù)據(jù)庫上創(chuàng)建幾個索引,而你需要在插入很多行的同時創(chuàng)建索引。把索引的創(chuàng)建推遲到所有行的插入之后可以導(dǎo)致實質(zhì)性的性能改善。
7. 使用占位符插入 Python 值
使用 Python 字符串操作將值包含到查詢中是很方便的。但是這樣做非常不安全,而 sqlite3 給你提供了更好的方法來做到這一點:
# Do not do this! my_timestamp = 1 c.execute("SELECT * FROM events WHERE ts = '%s'" % my_timestamp) # Do this instead my_timestamp = (1,) c.execute('SELECT * FROM events WHERE ts = ?', my_timestamp)
此外,使用Python%s(或格式或格式的字符串常量)的字符串插值對于executemany來說并不是總是可行。所以在此嘗試沒有什么真正意義!
請記住,這些小技巧可能會(也可能不會)給你帶來好處,具體取決于特定的用例。你應(yīng)該永遠(yuǎn)自己去嘗試,決定是否值得這么做。
英文:remusao,譯文:oschina
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- Python操作sqlite3快速、安全插入數(shù)據(jù)(防注入)的實例
- Python標(biāo)準(zhǔn)庫之sqlite3使用實例
- python操作數(shù)據(jù)庫之sqlite3打開數(shù)據(jù)庫、刪除、修改示例
- Python SQLite3數(shù)據(jù)庫操作類分享
- Python Sqlite3以字典形式返回查詢結(jié)果的實現(xiàn)方法
- SQLite3中文編碼 Python的實現(xiàn)
- Python sqlite3事務(wù)處理方法實例分析
- Python簡單操作sqlite3的方法示例
- Python實現(xiàn)讀取TXT文件數(shù)據(jù)并存進(jìn)內(nèi)置數(shù)據(jù)庫SQLite3的方法
- 詳解Python 數(shù)據(jù)庫 (sqlite3)應(yīng)用
相關(guān)文章
在win64上使用bypy進(jìn)行百度網(wǎng)盤文件上傳功能
這篇文章主要介紹了在win64上使用bypy進(jìn)行百度網(wǎng)盤文件上傳功能,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下2020-01-01python獲取的html中都是\\u003e實現(xiàn)轉(zhuǎn)成正確字符
這篇文章主要介紹了python獲取的html中都是\\u003e實現(xiàn)轉(zhuǎn)成正確字符方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-07-07Python實現(xiàn)多子圖繪制系統(tǒng)的示例詳解
這篇文章主要介紹了如何利用python實現(xiàn)多子圖繪制系統(tǒng),文中的示例代碼講解詳細(xì),具有一定的的參考價值,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2023-09-09