python3使用json、pickle和sqlite3持久化存儲字典對象


技術背景

在各種python的項目中,我們時常要持久化的在系統中存儲各式各樣的python的數據結構,常用的比如字典等。尤其是在雲服務類型中的python項目中,要持久化或者臨時的在緩存中儲存一些用戶認證信息和日志信息等,最典型的比如在數據庫中存儲用戶的token信息。在本文中我們將針對三種類型的python持久化存儲方案進行介紹,分別是json、pickle和python自帶的數據庫sqlite3。

使用json存儲字典對象

json格式的數據存儲也是雲服務項目中常用的類型,具備十分輕量級和易使用的特性,這里我們展示一個案例:如何使用json格式存儲一個用python產生的斐波那契數列。斐波那契數列中的每一個元素,都等於前一個數和前前一個數的和,即:\(f(n)=f(n-1)+f(n-2)\),而最常見的斐波那契數列的前兩位數都是1。如下是一個產生斐波那契數列的python代碼:

# json_dic.py

import json
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]
print (number)

代碼的執行結果如下:

[dechin@dechin-manjaro store_class]$ python3 json_dic.py 
{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}

我們可以從結果中看到,第10個斐波那契數是55。接下來我們來看看這樣的一個字典,如何持久化的存儲到json格式的文件中,以下是一個使用的示例:

# json_dic.py

import json
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]

with open('number.json', 'w') as file:
    json.dump(number, file)

with open('number.json', 'r') as file:
    data = json.load(file)

print (data)

執行這個python文件,我們可以獲得如下所示的輸出:

[dechin@dechin-manjaro store_class]$ python3 json_dic.py 
{'1': 1, '2': 1, '3': 2, '4': 3, '5': 5, '6': 8, '7': 13, '8': 21, '9': 34, '10': 55}

這里我們發現在當前目錄下產生了一個json的文件:

[dechin@dechin-manjaro store_class]$ ll
總用量 8
-rw-r--r-- 1 dechin dechin 265  3月 20 12:32 json_dic.py
-rw-r--r-- 1 dechin dechin  85  3月 20 12:32 number.json

我們可以看一下這個json文件中存儲了什么樣的數據:

[dechin@dechin-manjaro store_class]$ cat number.json 
{"1": 1, "2": 1, "3": 2, "4": 3, "5": 5, "6": 8, "7": 13, "8": 21, "9": 34, "10": 55}

在驗證了相關的數據已經被持久化存儲了之后,同時我們也注意到一個問題,我們產生斐波那契數列的時候,索引\(1,2,3...\)使用的是整型變量,但是存儲到json格式之后,變成了字符串格式。我們可以使用如下的案例來說明這其中的區別:

# json_dic.py

import json
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]

with open('number.json', 'w') as file:
    json.dump(number, file)

with open('number.json', 'r') as file:
    data = json.load(file)

print (data)
print (number[10])
print (data['10'])
print (data[10])

執行的輸出如下:

[dechin@dechin-manjaro store_class]$ python3 json_dic.py 
{'1': 1, '2': 1, '3': 2, '4': 3, '5': 5, '6': 8, '7': 13, '8': 21, '9': 34, '10': 55}
55
55
Traceback (most recent call last):
  File "json_dic.py", line 16, in <module>
    print (data[10])
KeyError: 10

這里的輸出就有一個報錯信息,這是因為我們使用了整型索引變量來尋找json存儲的字典對象中對應的值,但是因為前面存儲的時候這些整型的索引已經被轉換成了字符串的索引,因此實際上在存儲的對象中已經不存在整型的鍵值,所以執行結果會報錯,而如果輸入的是字符串類型的鍵值,則成功的找到了第10個斐波那契數。

使用pickle存儲字典對象

關於斐波那契數列的信息,在上一章節中已經介紹,這里我們直接進入pickle的使用案例:

# pickle_dic.py

import pickle
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]

with open('number.pickle', 'wb') as file:
    pickle.dump(number, file)

with open('number.pickle', 'rb') as file:
    data = pickle.load(file)

print (data)

這里注意一個細節,在json格式的存儲中我們使用的文件打開格式是w,而在pickle這里我們使用的存儲文件打開格式是wb,pickle的讀取也是用的rb的二進制的讀取格式。上述代碼的執行輸出結果如下:

[dechin@dechin-manjaro store_class]$ python3 pickle_dic.py 
{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}

這里我們可以發現,由pickle所存儲的字典格式中的整型的索引也被成功的存儲起來,在當前目錄下產生了一個名為number.pickle的文件就是持久化存儲的對象。

[dechin@dechin-manjaro store_class]$ ll
總用量 12
-rw-r--r-- 1 dechin dechin 320  3月 20 12:45 json_dic.py
-rw-r--r-- 1 dechin dechin  85  3月 20 12:46 number.json
-rw-r--r-- 1 dechin dechin  56  3月 20 12:44 number.pickle
-rw-r--r-- 1 dechin dechin 279  3月 20 12:44 pickle_dic.py

類似於json格式中的持久化讀取驗證,我們也可以簡單修改一個類似的pickle的案例:

# pickle_dic.py

import pickle
number = {1:1, 2:1}
for i in range(3, 11):
    number[i] = number[i - 1] + number[i - 2]

with open('number.pickle', 'wb') as file:
    pickle.dump(number, file)

with open('number.pickle', 'rb') as file:
    data = pickle.load(file)

print (data)
print (number[10])
print (data[10])

執行結果如下所示:

{1: 1, 2: 1, 3: 2, 4: 3, 5: 5, 6: 8, 7: 13, 8: 21, 9: 34, 10: 55}
55
55

從結果中我們發現存儲后的對象用一樣的讀取格式被成功讀取。

使用sqlite3存儲字典對象

在常用的Linux操作系統中都會自帶sqlite3數據庫,如果是windows和Mac的操作系統,可以按照這個教程中給的方案進行安裝。

SQLite是一個進程內的庫,實現了自給自足的、無服務器的、零配置的、事務性的 SQL 數據庫引擎。它是一個零配置的數據庫,這意味着與其他數據庫不一樣,您不需要在系統中配置。

就像其他數據庫,SQLite引擎不是一個獨立的進程,可以按應用程序需求進行靜態或動態連接。SQLite直接訪問其存儲文件。

同時在python3的庫中一般也自帶了sqlite3,不需要自己安裝,下面我們用ipython演示一下如何在python中使用sqlite3數據庫:

[dechin@dechin-manjaro store_class]$ ipython
Python 3.8.5 (default, Sep  4 2020, 07:30:14) 
Type 'copyright', 'credits' or 'license' for more information
IPython 7.19.0 -- An enhanced Interactive Python. Type '?' for help.

In [1]: import sqlite3

In [2]: conn = sqlite3.connect('test_sqlite3.db') # 如果有db文件就讀取,沒有就創建

In [3]: cur = conn.cursor()

In [8]: sql_test_1 = '''CREATE TABLE number
   ...:         (i NUMBER,
   ...:          n NUMBER);''' # 創建一個名為number的表,有兩列數據i和n作為鍵值對

In [9]: cur.execute(sql_test_1) # 執行字符串指令
Out[9]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [10]: sql_test_2 = "INSERT INTO number VALUES(1,1)" # 插入新的數據

In [11]: cur.execute(sql_test_2)
Out[11]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [12]: sql_test_2 = "INSERT INTO number VALUES(2,1)"

In [13]: sql_test_3 = "INSERT INTO number VALUES(2,1)"

In [14]: cur.execute(sql_test_3)
Out[14]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [15]: sql_test_4 = "SELECT * FROM number WHERE i=1" # 檢索數據

In [16]: cur.execute(sql_test_4)
Out[16]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [17]: cur.fetchall()
Out[17]: [(1, 1)]

In [18]: sql_test_5 = "SELECT * FROM number WHERE i>=1"

In [19]: cur.execute(sql_test_5)
Out[19]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [20]: cur.fetchall() # 讀取檢索返回值
Out[20]: [(1, 1), (2, 1)]

In [21]: for i in range(3, 11):
    ...:     sql_test_6 = "SELECT * FROM number WHERE i={}".format(i-1)
    ...:     cur.execute(sql_test_6)
    ...:     select_result1 = cur.fetchall()[0][1]
    ...:     sql_test_7 = "SELECT * FROM number WHERE i={}".format(i-2)
    ...:     cur.execute(sql_test_7)
    ...:     select_result2 = cur.fetchall()[0][1]
    ...:     cur.execute("INSERT INTO number VALUES({},{})".format(i, select_result1+select_res
    ...: ult2))
    ...: 

In [22]: sql_test_8 = "SELECT * FROM number WHERE i>=1"

In [23]: cur.execute(sql_test_8)
Out[23]: <sqlite3.Cursor at 0x7f6fb14acc70>

In [24]: cur.fetchall()
Out[24]: 
[(1, 1),
 (2, 1),
 (3, 2),
 (4, 3),
 (5, 5),
 (6, 8),
 (7, 13),
 (8, 21),
 (9, 34),
 (10, 55)]

In [25]: exit() # 退出ipython

在上述示例中我們演示了如何使用sqlite3創建數據庫和表,以及對表的內容的一些常用操作。在執行完上述示例后,會在當前目錄下產生一個新的db文件:

[dechin@dechin-manjaro store_class]$ ll
總用量 24
-rw-r--r-- 1 dechin dechin  320  3月 20 12:45 json_dic.py
-rw-r--r-- 1 dechin dechin   85  3月 20 12:46 number.json
-rw-r--r-- 1 dechin dechin   56  3月 20 12:47 number.pickle
-rw-r--r-- 1 dechin dechin  315  3月 20 12:47 pickle_dic.py
-rw-r--r-- 1 dechin dechin 8192  3月 20 13:05 test_sqlite3.db

如果在運行過程中出現如下所示的報錯,就代表有其他的進程正在占用這個db文件,因此會有進程將這個數據庫進行鎖定:

Traceback (most recent call last):
  File "sqlite3_dic.py", line 15, in <module>
    cur.execute("INSERT INTO number VALUES(1,1)")
sqlite3.OperationalError: database is locked

解決的辦法是,首先用fuser查看這個db文件被哪個用戶所占用:

[dechin@dechin-manjaro store_class]$ fuser test_sqlite3.db 
/home/dechin/projects/2021-python/store_class/test_sqlite3.db:  5120

我們查看到是5120這個進程占用了數據庫文件,也是這個進程將數據庫鎖定了。通常這種情況出現的原因是,在python中執行的數據庫操作指令未成功完成,導致數據庫的進程沒有結束,而我們也無法再通過這個進程向數據庫中輸入新的指令。因此我們只能通過將該進程殺死的方案來解決這個問題:

[dechin@dechin-manjaro store_class]$ kill -9 5120

還有一個需要注意的點是,上面所用到的數據庫操作實際上並未真正的被保存到數據庫文件中,需要經過commit之后才會被保存到數據庫文件中。接下來我們還是用斐波那契數列的例子來演示數據庫操作的使用:

# sqlite3_dic.py

import sqlite3
from tqdm import trange

conn = sqlite3.connect('test_sqlite3.db')
cur = conn.cursor()
try:
    sql_test_1 = '''CREATE TABLE number
                    (i NUMBER,
                     n NUMBER);'''
    cur.execute(sql_test_1)
except:
    pass
cur.execute("INSERT INTO number VALUES(1,1)")
cur.execute("INSERT INTO number VALUES(2,1)")
for i in trange(3, 11):
    sql_test_6 = "SELECT * FROM number WHERE i={}".format(i - 1)
    cur.execute(sql_test_6)
    select_result1 = cur.fetchall()[0][1]
    sql_test_7 = "SELECT * FROM number WHERE i={}".format(i - 2)
    cur.execute(sql_test_7)
    select_result2 = cur.fetchall()[0][1]
    cur.execute("INSERT INTO number VALUES({},{})".format(i, select_result1 + select_result2))

cur.execute("SELECT * FROM number WHERE i=10")
print (cur.fetchall())
conn.commit()
cur.close()
conn.close()

在上述用例中我們補充了commit操作和close操作,一方面持久化的保存了數據,另一方面也避免因為程序中其他地方的問題而導致了前面所提到的數據庫被鎖定的問題。我們看一下這個用例的執行輸出情況:

[dechin@dechin-manjaro store_class]$ python3 sqlite3_dic.py 
100%|█████████████████████████████████████████████████████████| 8/8 [00:00<00:00, 31775.03it/s]
[(10, 55)]

第10個斐波那契數被成功輸出,在數據庫的輸出中,使用的格式是一個列表包含多個元組的形式。其中每一個元組代表一個滿足檢索條件的鍵值對,每一個元組中的元素代表每一列的值。

前面提到了持久化保存的問題,我們也用一個簡單示例來驗證剛才經過commit之后是否被成功的保存起來了:

# test_recall_sqlite3.py

import sqlite3
from tqdm import trange

conn = sqlite3.connect('test_sqlite3.db')
cur = conn.cursor()
cur.execute("SELECT * FROM number WHERE i=10")
print (cur.fetchall())
conn.commit()
cur.close()
conn.close()

執行輸出如下:

[dechin@dechin-manjaro store_class]$ python3 test_recall_sqlite3.py 
[(10, 55)]

這個結果表明前面存儲下來的斐波那契數列已經被持久化的保存到了數據庫文件中,我們只要鏈接上該數據庫就可以隨時的讀取該數據。

總結概要

本文介紹了三種python的字典對象持久化存儲方案,包含json、pickle和數據庫sqlite,並且配合一個實際案例斐波那契數列來演示了不同解決方案的使用方法。這里三種方案實際上各有優劣,推薦的使用場景為:在輕量級、日常使用中可以重點使用json格式進行對象的存儲,我們也可以很方便的在系統上直接查看json格式的文件內容;在多用戶或多進程使用的案例中,推薦使用pickle的方案,可以更高性能、更低開銷的持久化存儲python對象;如果是需要對外提供服務的,我們推薦可以直接使用sqlite,對外可以提供一個數據庫查詢的解決方案,便不需要在本地存儲大量的數據或者可以更方便的對大規模數據進行處理。

版權聲明

本文首發鏈接為:https://www.cnblogs.com/dechinphy/p/sqlite.html
作者ID:DechinPhy
更多原著文章請參考:https://www.cnblogs.com/dechinphy/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM