bson是由10gen開發的一個數據格式,目前主要用於mongoDB中,是mongoDB的數據存儲格式。bson基於json格式,選擇json進行改造的原因主要是json的通用性及json的schemaless的特性。
bson主要會實現以下三點目標:
1.更快的遍歷速度
對json格式來說,太大的json結構會導致數據遍歷非常慢。在json中,要跳過一個文檔進行數據讀取,需要對此文檔進行掃描才行,需要進行麻煩的數據結構匹配,比如括號的匹配。
而bson對json的一大改進就是,它會將json的每一個元素的長度存在元素的頭部,這樣你只需要讀取到元素長度就能直接seek到指定的點上進行讀取了。
2.操作更簡易
對json來說,數據存儲是無類型的,比如你要修改基本一個值,從9到10,由於從一個字符變成了兩個,所以可能其后面的所有內容都需要往后移一位才可以。
而使用bson,你可以指定這個列為數字列,那么無論數字從9長到10還是100,我們都只是在存儲數字的那一位上進行修改,不會導致數據總長變大。
當然,在mongoDB中,如果數字從整形增大到長整型,還是會導致數據總長變大的。
3.增加了額外的數據類型
json是一個很方便的數據交換格式,但是其類型比較有限。
bson在其基礎上增加了“byte array”數據類型。這使得二進制的存儲不再需要先base64轉換后再存成json,大大減少了計算開銷和數據大小。
當然,在有的時候,bson相對json來說也並沒有空間上的優勢,比如對{“field”:7},在json的存儲上7只使用了一個字節,而如果用bson,那就是至少4個字節(32位)
目前在10gen的努力下,bson已經有了針對多種語言的編碼解碼包。並且都是Apache 2 license下開源的。並且還在隨着mongoDB進一步地發展。
總上所述:
數據結構:
json是像字符串一樣存儲的,bson是按結構存儲的(像數組 或者說struct)
存儲空間
bson>json
操作速度
bson>json。比如,遍歷查找:json需要掃字符串,而bson可以直接定位
修改:
json也要大動大移,bson就不需要。
參考:https://blog.csdn.net/amuseme_lu/article/details/6573912
