近期考慮把訂單歷史數據從Oracle數據庫遷移到Nosql數據庫做歷史數據查詢和分析,一天千萬級數據。打算使用mongodb數據庫。使用nodejs做查詢和統計API,對並發請求量要求低,不知道有沒有前輩這樣玩過。我們如今僅僅用mongodo存儲日志數據,做應用故障分析用。
假設有前輩做個類似的歷史庫查詢和數據分析,能夠交流下。你們選擇的Nosql庫和上層開發語言。
1.mongodb介紹
MongoDB (名稱來自"humongous") 是一個可擴展的高性能。開源,模式自由,面向文檔的數據庫。
它使用C++編寫。MongoDB特點:
a.面向集合的存儲:適合存儲對象及JSON形式的數據。
b.動態查詢:mongo支持豐富的查詢表達方式。查詢指令使用JSON形式的標記,可輕易查詢文檔中的內嵌的對象及數組。
c.完整的索引支持:包含文檔內嵌對象及數組。mongo的查詢優化器會分析查詢表達式,並生成一個高效的查詢計划。
d.查詢監視:mongo包括一個監視工具用於分析數據庫操作性能。
e.復制及自己主動故障轉移:mongo數據庫支持server之間的數據復制,支持主-從模式及server之間的相互復制。
復制的主要目的是提供冗余及自己主動故障轉移。
f.高效的傳統存儲方式:支持二進制數據及大型對象(如照片或圖片)。
g.自己主動分片以支持雲級別的伸縮性:自己主動分片功能支持水平的數據庫集群,可動態加入額外的機器。
2.mongo使用場合
mongodb的主要目標是在鍵/值存儲方式(提供了高性能和高度伸縮性)以及傳統的RDBMS系統(豐富的功能)架起一座橋梁,集兩者的優勢於一身。mongo適用於下面場景:
a.站點數據:mongo很適合實時的插入,更新與查詢,並具備站點實時數據存儲所需的復制及高度伸縮性。
b.緩存:因為性能非常高,mongo也適合作為信息基礎設施的緩存層。在系統重新啟動之后。由mongo搭建的持久化緩存能夠避免下層的數據源過載。
c.大尺寸、低價值的數據:使用傳統的關系數據庫存儲一些數據時可能會比較貴,在此之前。非常多程序猿往往會選擇傳統的文件進行存儲。
d.高伸縮性的場景:mongo很適合由數十或者數百台server組成的數據庫。
e.用於對象及JSON數據的存儲:mongo的BSON數據格式很適合文檔格式化的存儲及查詢。
不適合的場景:
a.高度事物性的系統:比如銀行或會計系統。傳統的關系型數據庫眼下還是更適用於須要大量原子性復雜事務的應用程序。
b.傳統的商業智能應用:針對特定問題的BI數據庫會對產生高度優化的查詢方式。
對於此類應用,數據倉庫可能是更合適的選擇。
c.須要SQL的問題。