轉自:https://blog.csdn.net/zengxiaosen/article/details/54908248
MongoDB之bson的介紹
1. 什么是bson
BSON是一種類json的一種二進制形式的存儲格式,簡稱Binary JSON,它和JSON一樣,支持內嵌的文檔對象和數組對象,但是BSON有JSON沒有的一些數據類型,如Date和BinData類型。
BSON可以做為網絡數據交換的一種存儲形式,這個有點類似於Google的Protocol Buffer,但是BSON是一種schema-less的存儲形式,它的優點是靈活性高,但它的缺點是空間利用率不是很理想,
BSON有三個特點:輕量性、可遍歷性、高效性
{“hello":"world"} 這是一個BSON的例子,其中"hello"是key name,它一般是cstring類型,字節表示是cstring::= (byte*) "/x00" ,其中*表示零個或多個byte字節,/x00表示結束符;后面的"world"是value值,它的類型一般是string,double,array,binarydata等類型。
2. bson在MongoDB中的使用
MongoDB使用了BSON這種結構來存儲數據和網絡數據交換。把這種格式轉化成一文檔這個概念(Document),因為BSON是schema-free的,所以在MongoDB中所對應的文檔也有這個特征,這里的一個Document也可以理解成關系數據庫中的一條記錄(Record),只是這里的Document的變化更豐富一些,如Document可以嵌套。
MongoDB以BSON做為其存儲結構的一種重要原因是其可遍歷性。
3. 幾個BSON的例子
3.1 一個Document的BSON表示:
- {
- title:"MongoDB",
- last_editor:"192.168.1.122",
- last_modified:new Data("27/06/2011"),
- body:"MongoDB introduction",
- categories:["Database","NoSQL","BSON"],
- revieved:false
- }
這是一個簡單的BSON結構體,其中每一個element都是由key/value對組成的
3.2 一個嵌套的例子
- {
- name:"lemo",
- age:"12",
- address:{
- city:"suzhou",
- country:"china",
- code:215000
- }
- scores:[
- {"name":"english","grade:3.0},
- {"name":"chinese","grade:2.0}
- ]
- }
這是一種相對復雜點的例子,其中包括了地址對象和分數對象數組,這里使用了嵌套文檔對象與文檔對象數據來表示單個學生的信息,這種嵌套的文檔結構要使用關系數據庫來做是比較復雜的。
4. BSON c++ 代碼分析
MongoDB源代碼樹中包括了BSON的代碼庫,你只要包含bson.h這個頭文件就行了,其中有四個類是比較重要的:
- * mongo::BSONObj,這個是BSON對象的表示
- * mongo::BSONElement,這個是BSON對象中元素的表示方法
- * mongo::BSONObjBuilder,這是構建BSON對象的類
- * mongo::BSONObjIterator,這是用來遍歷BSON對象中每一個元素的一個迭代器
下面是創建一個BSON對象
- BSONObjBuilder b;
- b.append("name","lemo"),
- b.append("age",23);
- BSONObj p = b.obj();
或者
- BSONObj p = BSONObjBuilder().append("name","lemo").append("age",23).obj();
或者用流的方法來
- BSONObjBuilder b;
- b << "name" << "lemo" << "age" << 23;
- BSONObj p = b.obj();
或者用宏來創建一個對象
- BSONObj p = BSON( "name" << "Joe" << "age" << 33 );
這里分析一下這四個類的一些代碼:
mongo::BSONObj主要是用於存儲BSON對象的,具體的存儲格式如下
- <unsigned totalSize> {<byte BSONType><cstring FieldName><Data>}* EOO
- -------------------- ------------- ----------------- ---- ---
- totalSize: 一個總的字節長度,包含自身
- BSONType: 對象類型,這里有Boolean,String,Date等類型,具體可以參考bsontypes.h這個文件
- FieldName: 這里表示字段名
- Data: 這里是放具體的數據,數據的存儲方式根據不同的BSONType來
- * : 表示可以有多個元素組成
- EOO: 這是一個結束符,一般是/x00來表示
一般來說,BSONObj的創建都是通過BSONObjBuilder來做的,除非你已經得到了其字節流,那可以直接生成BSONObj
mongo::BSONElement 它主要是用於存儲對象中的單個元素,存儲格式如下
- <type><fieldName><value>
這個對象主要是指向BSONObj對象中具體元素的地址,它不實際存儲元素的值。
mongo::BSONObjBuilder 它主要是用於生成BSONObj,這個對象集成了StringBuilder,它主要用於存儲實際的字節點,用於替換std::stringstream,而這個StringBuilder集成了BufBuilder,這是一個可以動態增長內存緩沖區,但最大容量不能超過64MB的大小,也就是說一個BSONObj最大不能超過64MB。
mongo::BSONOBjIterator 它主要是用來遍歷BSONObj對象中的每一個元素,提供了類似於stl iterator的一些接口,它還提供了一個ForEach宏來提供更方便的操作,如
- if (foo) {
- BSONForEach(e, obj)
- doSomething(e);
- }
