MongoDB的一些高級語法
在前面的博客中,我們了解一些Mongodb中最基礎的用法,只介紹了簡單的增刪查改,在這篇博客中,我將介紹一下稍微復雜一點的語法。
AND 和 OR操作
AND操作
在前面的博客中,我們介紹了查找命令,其中可以指令多個查詢條件,當所有條件都符合時,就可以查詢到數據。那么,如果我們只想只要有一個條件符合,就返回想要的數據,那么我們應該怎么做呢?
db.getCollection('test_data_1').find({"字段1":"固定值1","字段2":"固定值2"})
在上面的命令中,實際上是一個隱式的AND,因為需要同時滿足。但是又沒有出現AND這個關鍵詞,所以被稱為“隱式AND操作”。下面,就讓我們來將隱式轉為顯式,只需要使用“$and”即可。
db.getCollection('test_data_1').find(
{
"$and":[
{"字段1":"固定值1"},
{"字段2":"固定值2"}
]
}
)
OR操作
or操作就是為了查詢只符合其中任一條件的數據。命令語法和顯式的AND操作一樣。
db.getCollection('test_data_1').find(
{
"$or":[
{"字段1":"固定值1"},
{"字段2":"固定值2"}
]
}
)
其中,我們需要知道,盡管存在隱式的AND操作,但是,對於OR操作來說,不存在隱式的OR操作。 同時or操作時會遵循一個"短路原則":只要前面的條件滿足了,那后面的條件直接跳過(類似編程中的||)。
嵌入式文檔
下面便是一個嵌入式文檔的例子:
我們可以看到在studyInfo中,還有着score和project。其中,studyInfo被稱為嵌入式文檔,studyInfo下面的字段被稱為嵌套字段

插入
下面是一個插入語句的示例。
db.getCollection('test_data_1').insertOne(
{
"age":18,
"adress":"Hunan",
"studyInfo":{
"score":59,
"project":"LOL"
}
}
)
查詢
查詢語句
如果我們需要根據嵌入式文檔中的嵌套字段的條件去查詢,那么下面這樣使用就行了。如果嵌套字段里面還有嵌入式文檔,一路點點點過去就行了。
db.getCollection('test_data_1').find(
{
"studyInfo.score":59
},
// 不返回studyInfo.score
{
"studyInfo.score":0
}
)
數組(Array)字段
插入
在下面中,like字段保存的就是一個數組,所以我們使用**[]**將"apple","orange","fruit"括起來。
db.getCollection('test_data_1').insertOne(
{
"name":"Array",
"like":["apple","orange","fruit"]
}
)
使用Robo3T可視化工具查看,顯示如下:

查詢
其中,like的類型為Array。但是如果我們查詢的時候需要根據like中某個值作為篩選目標的時候,我們怎么辦呢?我們無需進行其他任何操作(和以前的查詢一模一樣)。例如查詢所有喜歡orange的人:
db.getCollection('test_data_1').find({"like":"orange"})
也就是說它的查詢與以前沒有任何區別。但是,既然是數組,總有一定其他的操作,例如查詢字段數組為長度的記錄:
db.getCollection('test_data_1').find({"like":{"$size":3}})
上面是查詢like字段的數組長度為3的記錄。
注意:“$size”只能查詢某一個具體長度的數組,而不能查詢范圍,如果進行范圍查詢的話,會報錯:

當然,既然有數組,那么必然會有索引,在mongodb中,數組的第一個元素的索引為0,和大部分的編程的情況是一樣的。
我們可以通過“字段名.索引”來定位元素。例如查詢:
db.getCollection('test_data_1').find(
{
"like.0":"apple"
}
)
聚合(Aggregation)
聚合的功能很簡單,就是讓Mongodb來處理數據,然后返回被處理好的數據。
聚合的操作命令是“aggregation”,基本格式是:
db.getCollection('test_data_1').aggregation([階段1,階段2,階段3……])
集中,階段可以為零個(那么就相當於findi命令),也可以為任意數量。其中,階段中間有點類似linux或者unix中的管道

也就是說,前面一個階段的輸出,是后面一個結點的輸入。
下面是來自菜鳥教程的一些關鍵字的用法。
- $project:修改輸入文檔的結構。可以用來重命名、增加或刪除域,也可以用於創建計算結果以及嵌套文檔。
- $match:用於過濾數據,只輸出符合條件的文檔。$match使用MongoDB的標准查詢操作。
- $limit:用來限制MongoDB聚合管道返回的文檔數。
- $skip:在聚合管道中跳過指定數量的文檔,並返回余下的文檔。
- $unwind:將文檔中的某一個數組類型字段拆分成多條,每條包含數組中的一個值。
- $group:將集合中的文檔分組,可用於統計結果。
- $sort:將輸入文檔排序后輸出。
- $geoNear:輸出接近某一地理位置的有序文檔。
下面我將在一些數據的處理方面來介紹一下其中的一些命令。
篩選數據
篩選數據的功能乍一看和find的功能差不多,然后仔細一看,還真的和find的功能一模一樣。篩選數據的關鍵字是“ $match”
db.getCollection('test_data_1').aggregate([{"$match":{和find完全一樣的過濾表達式}}])
下面是返回like字段數組的第一個元素為“apple”的記錄(和上面數組字段里面查詢返回的結果一模一樣)。
db.getCollection('test_data_1').aggregate([{"$match":{"like.0":"apple"}}])
那么,這樣做有什么意義呢?返回的結果和find的命令一樣,還比find麻煩,這樣做豈不是多此一舉。的確,如果我們僅僅這樣做,還不如使用find,它的強大之處在於與其他關鍵字進行組合。因為進行數據處理,一般第一步都是進行篩選。
修改字段
前面我們介紹了$project的介紹,那么修改字段我們將使用$projecto來操作。
$project:修改輸入文檔的結構。可以用來重命名、增加或刪除域,也可以用於創建計算結果以及嵌套文檔。
正如上面所介紹的,$project的功能很強大,可以做到很多事情。
-
修改返回的字段
下面返回的字段中不包含_id和like 字段
db.getCollection('test_data_1').aggregate([ {"$project":{"_id":0,"like":0}} ])
下面是結合$match的使用,其中前面的$match的返回的輸出是$project的輸入
db.getCollection('test_data_1').aggregate([ {"$match":{"like":{"$size":3}}}, {"$project":{"_id":0,"like":0}} ])
這個的作用也和find中的返回返回部分字段的操作差不多,這個操作沒有什么讓人新奇的地方,下面將介紹它的其他強大之處。
注意事項
包括現有字段
_id
字段默認包含在輸出文檔中。- 如果指定包含文檔中不存在的字段, $project 將忽略該字段包含,並且不會將該字段添加到文檔中。
取消_id字段
- 默認情況下,
_id
字段包含在輸出文檔中。要從輸出文檔中排除_id
字段,必須在 $project 中明確指定對_id
字段的抑制。
排除字段
-
如果指定排除某個或多個字段,則在輸出文檔中返回所有其他字段。
-
如果指定排除
_id
以外的字段,則不能使用任何其他 $project 規范表單:即,如果排除字段,則不能指定包含字段,重置現有字段的值或添加新字段。
-
添加新的字段
如果我想返回的結果中添加新的字段,怎么辦?在project中直接添加就行
db.getCollection('test_data_1').aggregate([ {"$project":{ "name":1, "_id":0, // 添加的新的字段 "add":"GG" } } ])
不過值得注意的是:
如果指定排除
_id
以外的字段,則不能使用任何其他 $project 規范表單:即,如果排除字段,則不能指定包含字段,重置現有字段的值或添加新字段。也就是說,如果排除了除“_id”以外的字段,那么,就GG了。就沒辦法添加字段了。
並且值得注意的是,添加新的字段的時候,如果舊的字段不設置為1,則不會返回。(也就是說,如果添加了新的字段,想要返回本來存在字段,必須將字段設置為1)
-
重命名字段
重命名字段和添加新的字段差不多,簡單點來說,我們可以使用“$舊的字段名”來表示字段的數據。示例如下
db.getCollection('test_data_1').aggregate([ {"$project":{ // 添加新的字段,新的字段的數據是name字段的數據 "add":"$name" } } ])
結果如下:
這個對於嵌套文檔有着非常好的效果,可以看下面的兩個例子
使用find 使用聚合
-
處理特殊字符
這里有說兩個問題,如果我需要修改一個字段的數據為1,或者為$project呢?可以知道,這些值與mongodbe自身的語法沖突了(所有以“$”開頭的普通字符串和數字都不能添加)。這個時候我們可以使用" $literal"關鍵字。
分組操作
分組操作所對應的關鍵字是“$group”,它的作用是根據給出的字段key,它所有的key的值相同的記錄放在一起進行運算。
去重
在上一篇博客中使用了去重函數“distinct”,使用該函數后,返回的是一個數組。不過,現在我們可以使用“$group”去重。操作如下所示:
db.getCollection('test_data_1').aggregate(
[
{
"$group":{"_id":"$被g去重的字段名"}
}
]
)
其中,“_id”是必不可少的,不能用其他的去替代。而這個返回的也不是一個數組,而是很多條記錄。

分組操作運算
首先先說一下運算的關鍵字,關鍵字包括(來自菜鳥教程):
表達式 | 描述 | 實例 |
---|---|---|
$sum | 計算總和。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) |
$avg | 計算平均值 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}]) |
$min | 獲取集合中所有文檔對應值得最小值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}]) |
$max | 獲取集合中所有文檔對應值得最大值。 | db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}]) |
$push | 在結果文檔中插入值到一個數組中。 | db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}]) |
$addToSet | 在結果文檔中插入值到一個數組中,但不創建副本。 | db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}]) |
$first | 根據資源文檔的排序獲取第一個文檔數據。 | db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}]) |
$last | 根據資源文檔的排序獲取最后一個文檔數據 | db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}]) |
大家看那個實例估計也明白怎么操作了。首先我們先去重,然后再指定名字,最后進行計算:
計算的方法:{$關鍵字:$已有的字段名}
下面便是計算age的平均值,然后以“aver_age”返回。

原則上,“$sum”和“$avg”的值對應的值應該是數字,如果使用非數字,則“$sum”會返回0,“$avg”會返回“null”。注意,字符串是可以比較大小的。其中,“$sum”的值還可以使用數字“1”,例如
"count":{"$sum":1}
,則返回的就是每個分組有多少條記錄。
拆分數組
拆分數組使用的關鍵字是“$unwind”,它的作用是把一條包含數組的記錄拆分為很對條記錄,其中,每一條記錄擁有數組中的一個元素。
下面是數組like和infos進行拆分,其中拆分的結果數量是like數組的長度乘以infos數組的長度。
db.getCollection('test_data_1').aggregate(
[
{"$unwind":"$like"},
{"$unwind":"$infos"},
]
)

聯集合查詢
Mongodb中的聯集合查詢類似SQL中的聯表查詢,在聯集合查詢中,有兩個概念,主集合和被查集合。簡單點來說,就是主集合提供字段key,然后被查集合通過字段key查出需要的字段。
db.getCollection('主集合名').aggregate([
"$lookup":{
"from":"被查集合名",
"localField":"主集合提供的字段key",
"foreginField":"被查集合接受的字段",
"as":"為查出來的字段命名",
}
]
)
下面是兩個文檔,一個為user,一個為login
現在我們通過login中的id從user中拿出字段:
db.getCollection('login').aggregate([
{ "$lookup":{
"from":"user",
"localField":"loginId",
"foreignField":"id",
"as":"login_name",
}
}
]
)
返回結果如下:

其中,login_name為聯結合查出來的數據,為一個數組。
當然,對於這個結果的樣式我們是不太滿意的,因為我我們只想拿出name,這個時候我們就需要使用前面的知識來解決這個問題了。
db.getCollection('login').aggregate([
{ "$lookup":{
"from":"user",
"localField":"loginId",
"foreignField":"id",
"as":"login_name",
}
}, {
"$unwind":"$login_name"
},
{
"$project":{
"_id":0,
"loginId":1,
"name":"$login_name.name"
}
}
])
返回的結果如圖所示:

參考資料
參考書籍:《左手Mongodb,右手Redis》
菜鳥教程:https://www.runoob.com/mongodb/mongodb-tutorial.html
docs4dev:https://www.docs4dev.com/docs/zh/mongodb/v3.6/reference