sql術語/概念	MongoDB術語/概念	解釋/說明
database	database	數據庫
table	collection	數據庫表/集合
row	document	數據記錄行/文檔
column	field	數據字段/域
index	index	索引
table joins		表連接,MongoDB不支持
primary key	primary key	主鍵,MongoDB自動將_id字段設置為主鍵

sql術語/概念

MongoDB術語/概念

解釋/說明

database

數據庫

table

collection

數據庫表/集合

row

document

數據記錄行/文檔

column

field

數據字段/域

index

索引

table joins

表連接,MongoDB不支持

primary key

主鍵,MongoDB自動將_id字段設置為主鍵

MongoDB的單個實例可以容納多個獨立的數據庫，每一個都有自己的集合和權限，不同的數據庫也放置在不同的文件中

MongoDB 與 RDBMS Where 語句比較

如果你熟悉常規的 SQL 數據，通過下表可以更好的理解 MongoDB 的條件語句查詢：

操作	格式	范例	RDBMS中的類似語句
等於	`{<key>:<value>`}	`db.col.find({"by":"菜鳥教程"}).pretty()`	`where by = '菜鳥教程'`
小於	`{<key>:{$lt:<value>}}`	`db.col.find({"likes":{$lt:50}}).pretty()`	`where likes < 50`
小於或等於	`{<key>:{$lte:<value>}}`	`db.col.find({"likes":{$lte:50}}).pretty()`	`where likes <= 50`
大於	`{<key>:{$gt:<value>}}`	`db.col.find({"likes":{$gt:50}}).pretty()`	`where likes > 50`
大於或等於	`{<key>:{$gte:<value>}}`	`db.col.find({"likes":{$gte:50}}).pretty()`	`where likes >= 50`
不等於	`{<key>:{$ne:<value>}}`	`db.col.find({"likes":{$ne:50}}).pretty()`	`where likes != 50`

操作

格式

范例

RDBMS中的類似語句

等於

{<key>:<value>}

db.col.find({"by":"菜鳥教程"}).pretty()

where by = '菜鳥教程'

小於

{<key>:{$lt:<value>}}

db.col.find({"likes":{$lt:50}}).pretty()

where likes < 50

小於或等於

{<key>:{$lte:<value>}}

db.col.find({"likes":{$lte:50}}).pretty()

where likes <= 50

大於

{<key>:{$gt:<value>}}

db.col.find({"likes":{$gt:50}}).pretty()

where likes > 50

大於或等於

{<key>:{$gte:<value>}}

db.col.find({"likes":{$gte:50}}).pretty()

where likes >= 50

不等於

{<key>:{$ne:<value>}}

db.col.find({"likes":{$ne:50}}).pretty()

where likes != 50

db.集合.find({key:values,key:values}).pretty()//相當於sql中where 條件一 and 條件二

類型	數字	備注
Double	1
String	2
Object	3
Array	4
Binary data	5
Undefined	6	已廢棄。
Object id	7
Boolean	8
Date	9
Null	10
Regular Expression	11
JavaScript	13
Symbol	14
JavaScript (with scope)	15
32-bit integer	16
Timestamp	17
64-bit integer	18
Min key	255	Query with `-1`.
Max key	127

類型

數字

備注

Double

String

Object

Array

Binary data

Undefined

已廢棄。

Object id

Boolean

Date

Null

Regular Expression

JavaScript

Symbol

JavaScript (with scope)

32-bit integer

Timestamp

64-bit integer

Min key

255

Query with -1.

Max key

127

MongoDB Limit() 方法

如果你需要在MongoDB中讀取指定數量的數據記錄，可以使用MongoDB的Limit方法，limit()方法接受一個數字參數，該參數指定從MongoDB中讀取的記錄條數。

MongoDB 數據類型

數據類型	描述
String	字符串。存儲數據常用的數據類型。在 MongoDB 中，UTF-8 編碼的字符串才是合法的。
Integer	整型數值。用於存儲數值。根據你所采用的服務器，可分為 32 位或 64 位。
Boolean	布爾值。用於存儲布爾值（真/假）。
Double	雙精度浮點值。用於存儲浮點值。
Min/Max keys	將一個值與 BSON（二進制的 JSON）元素的最低值和最高值相對比。
Arrays	用於將數組或列表或多個值存儲為一個鍵。
Timestamp	時間戳。記錄文檔修改或添加的具體時間。
Object	用於內嵌文檔。
Null	用於創建空值。
Symbol	符號。該數據類型基本上等同於字符串類型，但不同的是，它一般用於采用特殊符號類型的語言。
Date	日期時間。用 UNIX 時間格式來存儲當前日期或時間。你可以指定自己的日期時間：創建 Date 對象，傳入年月日信息。
Object ID	對象 ID。用於創建文檔的 ID。
Binary Data	二進制數據。用於存儲二進制數據。
Code	代碼類型。用於在文檔中存儲 JavaScript 代碼。
Regular expression	正則表達式類型。用於存儲正則表達式。

數據類型

描述

String

字符串。存儲數據常用的數據類型。在 MongoDB 中，UTF-8 編碼的字符串才是合法的。

Integer

整型數值。用於存儲數值。根據你所采用的服務器，可分為 32 位或 64 位。

Boolean

布爾值。用於存儲布爾值（真/假）。

Double

雙精度浮點值。用於存儲浮點值。

Min/Max keys

將一個值與 BSON（二進制的 JSON）元素的最低值和最高值相對比。

Arrays

用於將數組或列表或多個值存儲為一個鍵。

Timestamp

時間戳。記錄文檔修改或添加的具體時間。

Object

用於內嵌文檔。

Null

用於創建空值。

Symbol

符號。該數據類型基本上等同於字符串類型，但不同的是，它一般用於采用特殊符號類型的語言。

Date

日期時間。用 UNIX 時間格式來存儲當前日期或時間。你可以指定自己的日期時間：創建 Date 對象，傳入年月日信息。

Object ID

對象 ID。用於創建文檔的 ID。

Binary Data

二進制數據。用於存儲二進制數據。

Code

代碼類型。用於在文檔中存儲 JavaScript 代碼。

Regular expression

正則表達式類型。用於存儲正則表達式。

數據庫也通過名字來標識。數據庫名可以是滿足以下條件的任意UTF-8字符串。

MongoDB 索引

索引通常能夠極大的提高查詢的效率，如果沒有索引，MongoDB在讀取數據時必須掃描集合中的每個文件並選取那些符合查詢條件的記錄。

這種掃描全集合的查詢效率是非常低的，特別在處理大量的數據時，查詢可以要花費幾十秒甚至幾分鍾，這對網站的性能是非常致命的。

索引是特殊的數據結構，索引存儲在一個易於遍歷讀取的數據集合中，索引是對數據庫表中一列或多列的值進行排序的一種結構
方法
ensureIndex()

Parameter	Type	Description
background	Boolean	建索引過程會阻塞其它數據庫操作，background可指定以后台方式創建索引，即增加 "background" 可選參數。 "background" 默認值為false。
unique	Boolean	建立的索引是否唯一。指定為true創建唯一索引。默認值為false.
name	string	索引的名稱。如果未指定，MongoDB的通過連接索引的字段名和排序順序生成一個索引名稱。
dropDups	Boolean	在建立唯一索引時是否刪除重復記錄,指定 true 創建唯一索引。默認值為 false.
sparse	Boolean	對文檔中不存在的字段數據不啟用索引；這個參數需要特別注意，如果設置為true的話，在索引字段中不會查詢出不包含對應字段的文檔.。默認值為 false.
expireAfterSeconds	integer	指定一個以秒為單位的數值，完成 TTL設定，設定集合的生存時間。
v	index version	索引的版本號。默認的索引版本取決於mongod創建索引時運行的版本。
weights	document	索引權重值，數值在 1 到 99,999 之間，表示該索引相對於其他索引字段的得分權重。
default_language	string	對於文本索引，該參數決定了停用詞及詞干和詞器的規則的列表。默認為英語
language_override	string	對於文本索引，該參數指定了包含在文檔中的字段名，語言覆蓋默認的language，默認值為 language.

Parameter

Type

Description

background

Boolean

建索引過程會阻塞其它數據庫操作，background可指定以后台方式創建索引，即增加 "background" 可選參數。 "background" 默認值為false。

unique

Boolean

建立的索引是否唯一。指定為true創建唯一索引。默認值為false.

name

string

索引的名稱。如果未指定，MongoDB的通過連接索引的字段名和排序順序生成一個索引名稱。

dropDups

Boolean

在建立唯一索引時是否刪除重復記錄,指定 true 創建唯一索引。默認值為 false.

sparse

Boolean

對文檔中不存在的字段數據不啟用索引；這個參數需要特別注意，如果設置為true的話，在索引字段中不會查詢出不包含對應字段的文檔.。默認值為 false.

expireAfterSeconds

integer

指定一個以秒為單位的數值，完成 TTL設定，設定集合的生存時間。

index version

索引的版本號。默認的索引版本取決於mongod創建索引時運行的版本。

weights

document

索引權重值，數值在 1 到 99,999 之間，表示該索引相對於其他索引字段的得分權重。

default_language

string

對於文本索引，該參數決定了停用詞及詞干和詞器的規則的列表。默認為英語

language_override

string

對於文本索引，該參數指定了包含在文檔中的字段名，語言覆蓋默認的language，默認值為 language.

實例

MongoDB 聚合

MongoDB中聚合(aggregate)主要用於處理數據(諸如統計平均值,求和等)，並返回計算后的數據結果。有點類似sql語句中的 count(*)。

aggregate() 方法

MongoDB中聚合的方法使用aggregate()。

語法

aggregate() 方法的基本語法格式如下所示：

>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

實例

集合中的數據如下：

{ _id: ObjectId(7df78ad8902c) title: 'MongoDB Overview', description: 'MongoDB is no sql database', by_user: 'w3cschool.cc', url: 'http://www.w3cschool.cc', tags: ['mongodb', 'database', 'NoSQL'], likes: 100 }, { _id: ObjectId(7df78ad8902d) title: 'NoSQL Overview', description: 'No sql database is very fast', by_user: 'w3cschool.cc', url: 'http://www.w3cschool.cc', tags: ['mongodb', 'database', 'NoSQL'], likes: 10 }, { _id: ObjectId(7df78ad8902e) title: 'Neo4j Overview', description: 'Neo4j is no sql database', by_user: 'Neo4j', url: 'http://www.neo4j.com', tags: ['neo4j', 'database', 'NoSQL'], likes: 750 },

現在我們通過以上集合計算每個作者所寫的文章數，使用aggregate()計算結果如下：

> db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}]) { "result" : [ { "_id" : "w3cschool.cc", "num_tutorial" : 2 }, { "_id" : "Neo4j", "num_tutorial" : 1 } ], "ok" : 1 } >

以上實例類似sql語句： select by_user, count(*) from mycol group by by_user

在上面的例子中，我們通過字段by_user字段對數據進行分組，並計算by_user字段相同值的總和。

下表展示了一些聚合的表達式:

表達式	描述	實例
$sum	計算總和。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg	計算平均值	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min	獲取集合中所有文檔對應值得最小值。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max	獲取集合中所有文檔對應值得最大值。	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push	在結果文檔中插入值到一個數組中。	db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet	在結果文檔中插入值到一個數組中，但不創建副本。	db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first	根據資源文檔的排序獲取第一個文檔數據。	db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last	根據資源文檔的排序獲取最后一個文檔數據	db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

管道的概念

管道在Unix和Linux中一般用於將當前命令的輸出結果作為下一個命令的參數。

MongoDB的聚合管道將MongoDB文檔在一個管道處理完畢后將結果傳遞給下一個管道處理。管道操作是可以重復的。

表達式：處理輸入文檔並輸出。表達式是無狀態的，只能用於計算當前聚合管道的文檔，不能處理其它的文檔。

這里我們介紹一下聚合框架中常用的幾個操作：

$project：修改輸入文檔的結構。可以用來重命名、增加或刪除域，也可以用於創建計算結果以及嵌套文檔。
$match：用於過濾數據，只輸出符合條件的文檔。$match使用MongoDB的標准查詢操作。
$limit：用來限制MongoDB聚合管道返回的文檔數。
$skip：在聚合管道中跳過指定數量的文檔，並返回余下的文檔。
$unwind：將文檔中的某一個數組類型字段拆分成多條，每條包含數組中的一個值。
$group：將集合中的文檔分組，可用於統計結果。
$sort：將輸入文檔排序后輸出。
$geoNear：輸出接近某一地理位置的有序文檔。

管道操作符實例

1、$project實例

db.article.aggregate( { $project : { title : 1 , author : 1 , }} );

這樣的話結果中就只還有_id,tilte和author三個字段了，默認情況下_id字段是被包含的，如果要想不包含_id話可以這樣:

db.article.aggregate( { $project : { _id : 0 , title : 1 , author : 1 }});

2.$match實例

db.articles.aggregate( [ { $match : { score : { $gt : 70, $lte : 90 } } }, { $group: { _id: null, count: { $sum: 1 } } } ] );

$match用於獲取分數大於70小於或等於90記錄，然后將符合條件的記錄送到下一階段$group管道操作符進行處理。

3.$skip實例

db.article.aggregate( { $skip : 5 });

經過$skip管道操作符處理后，前五個文檔被"過濾"掉。

MongoDB 關系

MongoDB 的關系表示多個文檔之間在邏輯上的相互聯系。

文檔間可以通過嵌入和引用來建立聯系。

MongoDB 中的關系可以是：

1:1 (1對1)
1: N (1對多)
N: 1 (多對1)
N: N (多對多)

接下來我們來考慮下用戶與用戶地址的關系。

一個用戶可以有多個地址，所以是一對多的關系。

以下是 user 文檔的簡單結構：

{ "_id":ObjectId("52ffc33cd85242f436000001"), "name": "Tom Hanks", "contact": "987654321", "dob": "01-01-1991" }

以下是 address 文檔的簡單結構：

{ "_id":ObjectId("52ffc4a5d85242602e000000"), "building": "22 A, Indiana Apt", "pincode": 123456, "city": "Los Angeles", "state": "California" }

嵌入式關系

使用嵌入式方法，我們可以把用戶地址嵌入到用戶的文檔中：

   "_id":ObjectId("52ffc33cd85242f436000001"), "contact": "987654321", "dob": "01-01-1991", "name": "Tom Benzamin", "address": [ { "building": "22 A, Indiana Apt", "pincode": 123456, "city": "Los Angeles", "state": "California" }, { "building": "170 A, Acropolis Apt", "pincode": 456789, "city": "Chicago", "state": "Illinois" }] }

以上數據保存在單一的文檔中，可以比較容易的獲取和維護數據。你可以這樣查詢用戶的地址：

>db.users.findOne({"name":"Tom Benzamin"},{"address":1})

注意：以上查詢中 db 和 users 表示數據庫和集合。

這種數據結構的缺點是，如果用戶和用戶地址在不斷增加，數據量不斷變大，會影響讀寫性能。

引用式關系

引用式關系是設計數據庫時經常用到的方法，這種方法把用戶數據文檔和用戶地址數據文檔分開，通過引用文檔的 id 字段來建立關系。

{ "_id":ObjectId("52ffc33cd85242f436000001"), "contact": "987654321", "dob": "01-01-1991", "name": "Tom Benzamin", "address_ids": [ ObjectId("52ffc4a5d85242602e000000"), ObjectId("52ffc4a5d85242602e000001") ] }

以上實例中，用戶文檔的 address_ids 字段包含用戶地址的對象id（ObjectId）數組。

我們可以讀取這些用戶地址的對象id（ObjectId）來獲取用戶的詳細地址信息。

這種方法需要兩次查詢，第一次查詢用戶地址的對象id（ObjectId），第二次通過查詢的id獲取用戶的詳細地址信息。

>var result = db.users.findOne({"name":"Tom Benzamin"},{"address_ids":1}) >var addresses = db.address.find({"_id":{"$in":result["address_ids"]}})

mongodb的基本操作

MongoDB 與 RDBMS Where 語句比較

MongoDB Limit() 方法

MongoDB 數據類型

MongoDB 索引

實例

MongoDB 聚合

aggregate() 方法

語法

實例

管道的概念

管道操作符實例

MongoDB 關系

嵌入式關系

引用式關系

免責聲明！