1. 什么是bson BSON是一種類json的一種二進制形式的存儲格式,簡稱Binary JSON,它和JSON一樣,支持內嵌的文檔對象和數組對象,但是BSON有JSON沒有的一些數據類型,如Date和BinData類型。 BSON可以做為網絡數據交換的一種存儲形式,這個有點類似於Google的Protocol Buffer,但是BSON是一種schema-less的存儲形式,它的優點是靈活性高,但它的缺點是空間利用率不是很理想, BSON有三個特點:輕量性、可遍歷性、高效性 {“hello":"world"} 這是一個BSON的例子,其中"hello"是key name,它一般是cstring類型,字節表示是cstring::= (byte*) "/x00" ,其中*表示零個或多個byte字節,/x00表示結束符;后面的"world"是value值,它的類型一般是string,double,array,binarydata等類型。 2. bson在MongoDB中的使用 MongoDB使用了BSON這種結構來存儲數據和網絡數據交換。把這種格式轉化成一文檔這個概念(Document),因為BSON是schema-free的,所以在MongoDB中所對應的文檔也有這個特征,這里的一個Document也可以理解成關系數據庫中的一條記錄(Record),只是這里的Document的變化更豐富一些,如Document可以嵌套。 MongoDB以BSON做為其存儲結構的一種重要原因是其可遍歷性。 3. 幾個BSON的例子 3.1 一個Document的BSON表示: [c-sharp] view plaincopy { title:"MongoDB", last_editor:"192.168.1.122", last_modified:new Data("27/06/2011"), body:"MongoDB introduction", categories:["Database","NoSQL","BSON"], revieved:false } 這是一個簡單的BSON結構體,其中每一個element都是由key/value對組成的 3.2 一個嵌套的例子 [c-sharp] view plaincopy { name:"lemo", age:"12", address:{ city:"suzhou", country:"china", code:215000 } scores:[ {"name":"english","grade:3.0}, {"name":"chinese","grade:2.0} ] } 這是一種相對復雜點的例子,其中包括了地址對象和分數對象數組,這里使用了嵌套文檔對象與文檔對象數據來表示單個學生的信息,這種嵌套的文檔結構要使用關系數據庫來做是比較復雜的。 4. BSON c++ 代碼分析 MongoDB源代碼樹中包括了BSON的代碼庫,你只要包含bson.h這個頭文件就行了,其中有四個類是比較重要的: [c-sharp] view plaincopy * mongo::BSONObj,這個是BSON對象的表示 * mongo::BSONElement,這個是BSON對象中元素的表示方法 * mongo::BSONObjBuilder,這是構建BSON對象的類 * mongo::BSONObjIterator,這是用來遍歷BSON對象中每一個元素的一個迭代器 下面是創建一個BSON對象 [c-sharp] view plaincopy BSONObjBuilder b; b.append("name","lemo"), b.append("age",23); BSONObj p = b.obj(); 或者 [c-sharp] view plaincopy BSONObj p = BSONObjBuilder().append("name","lemo").append("age",23).obj(); 或者用流的方法來 [c-sharp] view plaincopy BSONObjBuilder b; b << "name" << "lemo" << "age" << 23; BSONObj p = b.obj(); 或者用宏來創建一個對象 [c-sharp] view plaincopy BSONObj p = BSON( "name" << "Joe" << "age" << 33 ); 這里分析一下這四個類的一些代碼: mongo::BSONObj主要是用於存儲BSON對象的,具體的存儲格式如下 [c-sharp] view plaincopy <unsigned totalSize> {<byte BSONType><cstring FieldName><Data>}* EOO -------------------- ------------- ----------------- ---- --- totalSize: 一個總的字節長度,包含自身 BSONType: 對象類型,這里有Boolean,String,Date等類型,具體可以參考bsontypes.h這個文件 FieldName: 這里表示字段名 Data: 這里是放具體的數據,數據的存儲方式根據不同的BSONType來 * : 表示可以有多個元素組成 EOO: 這是一個結束符,一般是/x00來表示 一般來說,BSONObj的創建都是通過BSONObjBuilder來做的,除非你已經得到了其字節流,那可以直接生成BSONObj mongo::BSONElement 它主要是用於存儲對象中的單個元素,存儲格式如下 [c-sharp] view plaincopy <type><fieldName><value> 這個對象主要是指向BSONObj對象中具體元素的地址,它不實際存儲元素的值。 mongo::BSONObjBuilder 它主要是用於生成BSONObj,這個對象集成了StringBuilder,它主要用於存儲實際的字節點,用於替換std::stringstream,而這個StringBuilder集成了BufBuilder,這是一個可以動態增長內存緩沖區,但最大容量不能超過64MB的大小,也就是說一個BSONObj最大不能超過64MB。 mongo::BSONOBjIterator 它主要是用來遍歷BSONObj對象中的每一個元素,提供了類似於stl iterator的一些接口,它還提供了一個ForEach宏來提供更方便的操作,如 [c-sharp] view plaincopy if (foo) { BSONForEach(e, obj) doSomething(e); }