bson


1. 什么是bson
BSON是一種類json的一種二進制形式的存儲格式,簡稱Binary JSON,它和JSON一樣,支持內嵌的文檔對象和數組對象,但是BSON有JSON沒有的一些數據類型,如Date和BinData類型。

BSON可以做為網絡數據交換的一種存儲形式,這個有點類似於Google的Protocol Buffer,但是BSON是一種schema-less的存儲形式,它的優點是靈活性高,但它的缺點是空間利用率不是很理想,

BSON有三個特點:輕量性、可遍歷性、高效性

{“hello":"world"} 這是一個BSON的例子,其中"hello"是key name,它一般是cstring類型,字節表示是cstring::= (byte*) "/x00" ,其中*表示零個或多個byte字節,/x00表示結束符;后面的"world"是value值,它的類型一般是string,double,array,binarydata等類型。

 

2. bson在MongoDB中的使用
MongoDB使用了BSON這種結構來存儲數據和網絡數據交換。把這種格式轉化成一文檔這個概念(Document),因為BSON是schema-free的,所以在MongoDB中所對應的文檔也有這個特征,這里的一個Document也可以理解成關系數據庫中的一條記錄(Record),只是這里的Document的變化更豐富一些,如Document可以嵌套。

MongoDB以BSON做為其存儲結構的一種重要原因是其可遍歷性。

 

3. 幾個BSON的例子
3.1 一個Document的BSON表示:
[c-sharp] view plaincopy
{  
title:"MongoDB",  
last_editor:"192.168.1.122",  
last_modified:new Data("27/06/2011"),  
body:"MongoDB introduction",  
categories:["Database","NoSQL","BSON"],  
revieved:false  
}  
 

這是一個簡單的BSON結構體,其中每一個element都是由key/value對組成的

3.2 一個嵌套的例子
[c-sharp] view plaincopy
{  
name:"lemo",  
age:"12",  
address:{  
city:"suzhou",  
country:"china",  
code:215000  
}  
scores:[  
{"name":"english","grade:3.0},  
{"name":"chinese","grade:2.0}  
]  
}  
 

這是一種相對復雜點的例子,其中包括了地址對象和分數對象數組,這里使用了嵌套文檔對象與文檔對象數據來表示單個學生的信息,這種嵌套的文檔結構要使用關系數據庫來做是比較復雜的。

 

4. BSON c++ 代碼分析
MongoDB源代碼樹中包括了BSON的代碼庫,你只要包含bson.h這個頭文件就行了,其中有四個類是比較重要的:

[c-sharp] view plaincopy
* mongo::BSONObj,這個是BSON對象的表示  
* mongo::BSONElement,這個是BSON對象中元素的表示方法   
* mongo::BSONObjBuilder,這是構建BSON對象的類  
* mongo::BSONObjIterator,這是用來遍歷BSON對象中每一個元素的一個迭代器  
 

 

下面是創建一個BSON對象

[c-sharp] view plaincopy
BSONObjBuilder b;  
b.append("name","lemo"),  
b.append("age",23);  
BSONObj p = b.obj();  
 

 

或者

[c-sharp] view plaincopy
BSONObj p = BSONObjBuilder().append("name","lemo").append("age",23).obj();  
 

或者用流的方法來

[c-sharp] view plaincopy
BSONObjBuilder b;  
b << "name" << "lemo" << "age" << 23;  
BSONObj p = b.obj();  
 

 

或者用宏來創建一個對象

[c-sharp] view plaincopy
BSONObj p = BSON( "name" << "Joe" << "age" << 33 );  
 

這里分析一下這四個類的一些代碼:

mongo::BSONObj主要是用於存儲BSON對象的,具體的存儲格式如下

[c-sharp] view plaincopy
     <unsigned totalSize> {<byte BSONType><cstring FieldName><Data>}* EOO  
        --------------------              -------------                -----------------               ----           ---  
totalSize: 一個總的字節長度,包含自身  
BSONType: 對象類型,這里有Boolean,String,Date等類型,具體可以參考bsontypes.h這個文件  
FieldName: 這里表示字段名  
Data: 這里是放具體的數據,數據的存儲方式根據不同的BSONType來  
* : 表示可以有多個元素組成  
EOO: 這是一個結束符,一般是/x00來表示  
 

一般來說,BSONObj的創建都是通過BSONObjBuilder來做的,除非你已經得到了其字節流,那可以直接生成BSONObj

 

mongo::BSONElement 它主要是用於存儲對象中的單個元素,存儲格式如下

[c-sharp] view plaincopy
<type><fieldName><value>  
 

這個對象主要是指向BSONObj對象中具體元素的地址,它不實際存儲元素的值。


mongo::BSONObjBuilder 它主要是用於生成BSONObj,這個對象集成了StringBuilder,它主要用於存儲實際的字節點,用於替換std::stringstream,而這個StringBuilder集成了BufBuilder,這是一個可以動態增長內存緩沖區,但最大容量不能超過64MB的大小,也就是說一個BSONObj最大不能超過64MB。

 

mongo::BSONOBjIterator 它主要是用來遍歷BSONObj對象中的每一個元素,提供了類似於stl iterator的一些接口,它還提供了一個ForEach宏來提供更方便的操作,如

[c-sharp] view plaincopy
if (foo) {  
           BSONForEach(e, obj)  
               doSomething(e);  
       }  
 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM