python讀寫LMDB文件的方法
LMDB的全稱是Lightning Memory-Mapped Database(快如閃電的內(nèi)存映射數(shù)據(jù)庫(kù)),它的文件結(jié)構(gòu)簡(jiǎn)單,包含一個(gè)數(shù)據(jù)文件和一個(gè)鎖文件:
LMDB文件可以同時(shí)由多個(gè)進(jìn)程打開,具有極高的數(shù)據(jù)存取速度,訪問(wèn)簡(jiǎn)單,不需要運(yùn)行單獨(dú)的數(shù)據(jù)庫(kù)管理進(jìn)程,只要在訪問(wèn)數(shù)據(jù)的代碼里引用LMDB庫(kù),訪問(wèn)時(shí)給文件路徑即可。
讓系統(tǒng)訪問(wèn)大量小文件的開銷很大,而LMDB使用內(nèi)存映射的方式訪問(wèn)文件,使得文件內(nèi)尋址的開銷非常小,使用指針運(yùn)算就能實(shí)現(xiàn)。數(shù)據(jù)庫(kù)單文件還能減少數(shù)據(jù)集復(fù)制/傳輸過(guò)程的開銷。
在python中使用lmdb: linux中,可以使用指令‘pip install lmdb' 安裝lmdb包。
1. 生成一個(gè)空的lmdb數(shù)據(jù)庫(kù)文件
# -*- coding: utf-8 -*- import lmdb # 如果train文件夾下沒(méi)有data.mbd或lock.mdb文件,則會(huì)生成一個(gè)空的,如果有,不會(huì)覆蓋 # map_size定義最大儲(chǔ)存容量,單位是kb,以下定義1TB容量 env = lmdb.open("./train",map_size=1099511627776) env.close()
2. LMDB數(shù)據(jù)的添加、修改、刪除
# -*- coding: utf-8 -*- import lmdb # map_size定義最大儲(chǔ)存容量,單位是kb,以下定義1TB容量 env = lmdb.open("./train", map_size=1099511627776) txn = env.begin(write=True) # 添加數(shù)據(jù)和鍵值 txn.put(key = '1', value = 'aaa') txn.put(key = '2', value = 'bbb') txn.put(key = '3', value = 'ccc') # 通過(guò)鍵值刪除數(shù)據(jù) txn.delete(key = '1') # 修改數(shù)據(jù) txn.put(key = '3', value = 'ddd') # 通過(guò)commit()函數(shù)提交更改 txn.commit() env.close()
3. 查詢lmdb數(shù)據(jù)庫(kù)內(nèi)容
# -*- coding: utf-8 -*- import lmdb env = lmdb.open("./train") # 參數(shù)write設(shè)置為True才可以寫入 txn = env.begin(write=True) ############################################添加、修改、刪除數(shù)據(jù) # 添加數(shù)據(jù)和鍵值 txn.put(key = '1', value = 'aaa') txn.put(key = '2', value = 'bbb') txn.put(key = '3', value = 'ccc') # 通過(guò)鍵值刪除數(shù)據(jù) txn.delete(key = '1') # 修改數(shù)據(jù) txn.put(key = '3', value = 'ddd') # 通過(guò)commit()函數(shù)提交更改 txn.commit() ############################################查詢lmdb數(shù)據(jù) txn = env.begin() # get函數(shù)通過(guò)鍵值查詢數(shù)據(jù) print txn.get(str(2)) # 通過(guò)cursor()遍歷所有數(shù)據(jù)和鍵值 for key, value in txn.cursor(): print (key, value) ############################################ env.close()
4. 讀取已有.mdb文件內(nèi)容
# -*- coding: utf-8 -*- import lmdb env_db = lmdb.Environment('trainC') # env_db = lmdb.open("./trainC") txn = env_db.begin() # get函數(shù)通過(guò)鍵值查詢數(shù)據(jù),如果要查詢的鍵值沒(méi)有對(duì)應(yīng)數(shù)據(jù),則輸出None print txn.get(str(200)) for key, value in txn.cursor(): #遍歷 print (key, value) env_db.close()
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python隨機(jī)數(shù)random模塊使用指南
本文給大家分享的是Python隨機(jī)數(shù)random模塊的幾個(gè)常用的方法,非常的簡(jiǎn)單,小伙伴們喜歡的話,后續(xù)繼續(xù)深入探討2016-09-09Python實(shí)現(xiàn)新型冠狀病毒傳播模型及預(yù)測(cè)代碼實(shí)例
在本篇文章里小編給大家整理的是關(guān)于Python實(shí)現(xiàn)新型冠狀病毒傳播模型及預(yù)測(cè)代碼內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。2020-02-02Python小白學(xué)習(xí)爬蟲常用請(qǐng)求報(bào)頭
在本篇文章里小編給大家整理了關(guān)于Python小白學(xué)習(xí)爬蟲常用請(qǐng)求報(bào)頭的相關(guān)知識(shí)點(diǎn),需要的朋友們可以學(xué)習(xí)下。2020-06-06淺析Python中壓縮zipfile與解壓縮tarfile模塊的使用
Python?提供了兩個(gè)標(biāo)準(zhǔn)庫(kù)模塊來(lái)處理文件的壓縮和解壓縮操作:zipfile和tarfile,本文將分享?這兩個(gè)模塊的使用方法,感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2023-10-10