一、什么是 NOSQL
NoSQL(NoSQL = Not Only SQL),意即“不僅僅是SQL”,是一項全新的數據庫理念,泛指非關系型的數據庫。
隨着互聯網web2.0網站的興起,傳統的關系數據庫在應付web2.0網站,特別是超大規模和高並發的SNS類型的web2.0純動態網站已經顯得力不從心,暴露了很多難以克服的問題,而非關系型的數據庫則由於其本身的特點得到了非常迅速的發展。
NoSQL數據庫的產生就是為了解決大規模數據集合多重數據種類帶來的挑戰,尤其是大數據應用難題。
二、NOSQL 和關系型數據庫關系與比較
優點:
(1)成本:nosql數據庫簡單易部署,基本都是開源軟件,不需要像使用oracle那樣花費大量成本購買使用,相比關系型數據庫價格便宜。
(2)查詢速度:nosql數據庫將數據存儲於緩存之中,關系型數據庫將數據存儲在硬盤中,自然查詢速度遠不及nosql數據庫。
(3)存儲數據的格式:nosql的存儲格式是key,value形式、文檔形式、圖片形式等等,所以可以存儲基礎類型以及對象或者是集合等各種格式,而數據庫則只支持基礎類型。
(4)擴展性:關系型數據庫有類似join這樣的多表查詢機制的限制導致擴展很艱難。
缺點:
(1)維護的工具和資料有限,因為nosql是屬於新的技術,不能和關系型數據庫10幾年的技術同日而語。
(2)不提供對sql的支持,如果不支持sql這樣的工業標准,將產生一定用戶的學習和使用成本。
(3)不提供對sql的支持,如果不支持sql這樣的工業標准,將產生一定用戶的學習和使用成本。
三、非關系型數據庫的優勢
(1)性能NOSQL是基於鍵值對的,可以想象成表中的主鍵和值的對應關系,而且不需要經過SQL層的解析,所以性能非常高。
(2)可擴展性同樣也是因為基於鍵值對,數據之間沒有耦合性,所以非常容易水平擴展。
四、關系型數據庫的優勢
(1)復雜查詢可以用SQL語句方便的在一個表以及多個表之間做非常復雜的數據查詢。
(2)事務支持使得對於安全性能很高的數據訪問要求得以實現。對於這兩類數據庫,對方的優勢就是自己的弱勢,反之亦然。
五、總結
(1)關系型數據庫與NoSQL數據庫並非對立而是互補的關系,即通常情況下使用關系型數據庫,在適合使用NoSQL的時候使用NoSQL數據庫。
(2)讓NoSQL數據庫對關系型數據庫的不足進行彌補。
(3)一般會將數據存儲在關系型數據庫中,在nosql數據庫中備份存儲關系型數據庫的數據。
六、主流的NOSQL產品
1、鍵值(Key-Value)存儲數據庫
相關產品: Tokyo Cabinet/Tyrant、Redis、Voldemort、Berkeley DB
典型應用: 內容緩存,主要用於處理大量數據的高訪問負載。
數據模型: 一系列鍵值對
優勢: 快速查詢
劣勢:存儲的數據缺少結構化
2、列存儲數據庫
相關產品:Cassandra, HBase, Riak
典型應用:分布式的文件系統
數據模型:以列簇式存儲,將同一列數據存在一起
優勢:查找速度快,可擴展性強,更容易進行分布式擴展
劣勢:功能相對局限
3、文檔型數據庫
相關產品:CouchDB、MongoDB
典型應用:Web應用(與Key-Value類似,Value是結構化的)
數據模型: 一系列鍵值對
優勢:數據結構要求不嚴格
劣勢: 查詢性能不高,而且缺乏統一的查詢語法
4、圖形(Graph)數據庫
相關數據庫:Neo4J、InfoGrid、Infinite Graph
典型應用:社交網絡
數據模型:圖結構
優勢:利用圖結構相關算法。
劣勢:需要對整個圖做計算才能得出結果,不容易做分布式的集群方案。