Python3中使用PyMongo的方法詳解
轉自 https://www.sohu.com/a/289583885_99987664 這篇文章。寫的很好。
本文主要給大家介紹的是關於在Python3使用PyMongo的方法,分享出來供大家參考學習,下面話不多說了,來一起看看詳細介紹:
MongoDB存儲
在這里我們來看一下Python3下MongoDB的存儲操作,在本節開始之前請確保你已經安裝好了MongoDB並啟動了其服務,另外安裝好了Python的PyMongo庫。
沒有安裝的朋友們可以參考:https://www.jianshu.com/p/c6eac5b9224e
本人對於Python學習創建了一個小小的學習圈子,為各位提供了一個平台,大家一起來討論學習Python。歡迎各位到來Python學習群:960410445一起討論視頻分享學習。Python是未來的發展方向,正在挑戰我們的分析能力及對世界的認知方式,因此,我們與時俱進,迎接變化,並不斷的成長,掌握Python核心技術,才是掌握真正的價值所在。
連接MongoDB
連接MongoDB我們需要使用PyMongo庫里面的MongoClient,一般來說傳入MongoDB的IP及端口即可,第一個參數為地址host,第二個參數為端口port,端口如果不傳默認是27017。
這樣我們就可以創建一個MongoDB的連接對象了。
另外MongoClient的第一個參數host還可以直接傳MongoDB的連接字符串,以mongodb開頭,例如:
client = MongoClient('mongodb://localhost:27017/')
可以達到同樣的連接效果。
指定數據庫
MongoDB中還分為一個個數據庫,我們接下來的一步就是指定要操作哪個數據庫,在這里我以test數據庫為例進行說明,所以下一步我們需要在程序中指定要使用的數據庫。
db =client.test
調用client的test屬性即可返回test數據庫,當然也可以這樣來指定:
db =client['test']
兩種方式是等價的。
指定集合
MongoDB的每個數據庫又包含了許多集合Collection,也就類似與關系型數據庫中的表,下一步我們需要指定要操作的集合,在這里我們指定一個集合名稱為students,學生集合。還是和指定數據庫類似,指定集合也有兩種方式。
collection =db.students
collection =db['students']
插入數據
接下來我們便可以進行數據插入了,對於students這個Collection,我們新建一條學生數據,以字典的形式表示:
在這里我們指定了學生的學號、姓名、年齡和性別,然后接下來直接調用collection的insert()方法即可插入數據。
在MongoDB中,每條數據其實都有一個_id屬性來唯一標識,如果沒有顯式指明_id,MongoDB會自動產生一個ObjectId類型的_id屬性。insert()方法會在執行后返回的_id值。
運行結果:
5932a68615c2606814c91f3d
當然我們也可以同時插入多條數據,只需要以列表形式傳遞即可,示例如下:
返回的結果是對應的_id的集合,運行結果:
[ObjectId('5932a80115c2606a59e8a048'), ObjectId('5932a80115c2606a59e8a049')]
實際上在PyMongo 3.X版本中,insert()方法官方已經不推薦使用了,當然繼續使用也沒有什么問題,官方推薦使用insert_one()和insert_many()方法將插入單條和多條記錄分開。
運行結果:
<pymongo.results.InsertOneResultobject at 0x10d68b558>
5932ab0f15c2606f0c1cf6c5
返回結果和insert()方法不同,這次返回的是InsertOneResult對象,我們可以調用其inserted_id屬性獲取_id。
對於insert_many()方法,我們可以將數據以列表形式傳遞即可,示例如下:
insert_many()方法返回的類型是InsertManyResult,調用inserted_ids屬性可以獲取插入數據的_id列表,運行結果:
查詢
插入數據后我們可以利用find_one()或find()方法進行查詢,find_one()查詢得到是單個結果,find()則返回多個結果。
在這里我們查詢name為Mike的數據,它的返回結果是字典類型,運行結果:
可以發現它多了一個_id屬性,這就是MongoDB在插入的過程中自動添加的。
我們也可以直接根據ObjectId來查詢,這里需要使用bson庫里面的ObjectId。
其查詢結果依然是字典類型,運行結果:
{'_id': ObjectId('593278c115c2602667ec6bae'), 'id': '20170101', 'name': 'Jordan', 'age': 20, 'gender': 'male'}
當然如果查詢結果不存在則會返回None。
對於多條數據的查詢,我們可以使用find()方法,例如在這里查找年齡為20的數據,示例如下:
運行結果:
返回結果是Cursor類型,相當於一個生成器,我們需要遍歷取到所有的結果,每一個結果都是字典類型。
如果要查詢年齡大於20的數據,則寫法如下:
results =collection.find({'age': {'$gt': 20}})
在這里查詢的條件鍵值已經不是單純的數字了,而是一個字典,其鍵名為比較符號$gt,意思是大於,鍵值為20,這樣便可以查詢出所有年齡大於20的數據。
在這里將比較符號歸納如下表:
另外還可以進行正則匹配查詢,例如查詢名字以M開頭的學生數據,示例如下:
results =collection.find({'name': {'$regex': '^M.*'}})
在這里使用了$regex來指定正則匹配,^M.*代表以M開頭的正則表達式,這樣就可以查詢所有符合該正則的結果。
在這里將一些功能符號再歸類如下: