python讀寫LMDB文件的方法


原文:https://www.jb51.net/article/142985.htm

LMDB的全稱是Lightning Memory-Mapped Database(快如閃電的內存映射數據庫),它的文件結構簡單,包含一個數據文件和一個鎖文件:

LMDB文件可以同時由多個進程打開,具有極高的數據存取速度,訪問簡單,不需要運行單獨的數據庫管理進程,只要在訪問數據的代碼里引用LMDB庫,訪問時給文件路徑即可。

讓系統訪問大量小文件的開銷很大,而LMDB使用內存映射的方式訪問文件,使得文件內尋址的開銷非常小,使用指針運算就能實現。數據庫單文件還能減少數據集復制/傳輸過程的開銷。

在python中使用lmdb: linux中,可以使用指令‘pip install lmdb' 安裝lmdb包。

1. 生成一個空的lmdb數據庫文件

1 # -*- coding: utf-8 -*- 
2 import lmdb 
3   
4 # 如果train文件夾下沒有data.mbd或lock.mdb文件,則會生成一個空的,如果有,不會覆蓋 
5 # map_size定義最大儲存容量,單位是kb,以下定義1TB容量 
6 env = lmdb.open("./train",map_size=1099511627776) 
7 env.close()

 

 2. LMDB數據的添加、修改、刪除

 1 # -*- coding: utf-8 -*- 
 2 import lmdb 
 3   
 4 # map_size定義最大儲存容量,單位是kb,以下定義1TB容量 
 5 env = lmdb.open("./train", map_size=1099511627776) 
 6   
 7 txn = env.begin(write=True) 
 8   
 9 # 添加數據和鍵值 
10 txn.put(key = '1', value = 'aaa') 
11 txn.put(key = '2', value = 'bbb') 
12 txn.put(key = '3', value = 'ccc') 
13   
14 # 通過鍵值刪除數據 
15 txn.delete(key = '1') 
16   
17 # 修改數據 
18 txn.put(key = '3', value = 'ddd') 
19   
20 # 通過commit()函數提交更改 
21 txn.commit() 
22 env.close()

 

3. 查詢lmdb數據庫內容

 1 # -*- coding: utf-8 -*- 
 2 import lmdb 
 3   
 4 env = lmdb.open("./train") 
 5   
 6 # 參數write設置為True才可以寫入 
 7 txn = env.begin(write=True) 
 8 ############################################添加、修改、刪除數據 
 9   
10 # 添加數據和鍵值 
11 txn.put(key = '1', value = 'aaa') 
12 txn.put(key = '2', value = 'bbb') 
13 txn.put(key = '3', value = 'ccc') 
14   
15 # 通過鍵值刪除數據 
16 txn.delete(key = '1') 
17   
18 # 修改數據 
19 txn.put(key = '3', value = 'ddd') 
20   
21 # 通過commit()函數提交更改 
22 txn.commit() 
23 ############################################查詢lmdb數據 
24 txn = env.begin() 
25   
26 # get函數通過鍵值查詢數據 
27 print txn.get(str(2)) 
28   
29 # 通過cursor()遍歷所有數據和鍵值 
30 for key, value in txn.cursor(): 
31   print (key, value) 
32     
33 ############################################ 
34   
35 env.close()

 

4. 讀取已有.mdb文件內容

 1 # -*- coding: utf-8 -*- 
 2 import lmdb 
 3   
 4 env_db = lmdb.Environment('trainC') 
 5 # env_db = lmdb.open("./trainC") 
 6   
 7 txn = env_db.begin() 
 8   
 9 # get函數通過鍵值查詢數據,如果要查詢的鍵值沒有對應數據,則輸出None 
10 print txn.get(str(200)) 
11   
12 for key, value in txn.cursor(): #遍歷 
13   print (key, value) 
14   
15 env_db.close()

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM