一、概念
SQL (Structured Query Language) 數據庫,指關系型數據庫。主要代表:SQL Server,Oracle,MySQL(開源),PostgreSQL(開源)。
NoSQL(Not Only SQL)泛指非關系型數據庫。主要代表:MongoDB,Redis,CouchDB。
二、區別
1、存儲方式
SQL數據存在特定結構的表中;而NoSQL則更加靈活和可擴展,存儲方式可以省是JSON文檔、哈希表或者其他方式。SQL通常以數據庫表形式存儲數據。舉個栗子,存個學生借書數據:
而NoSQL存儲方式比較靈活,比如使用類JSON文件存儲上表中熊大的借閱數據:
2、表/數據集合的數據的關系
在SQL中,必須定義好表和字段結構后才能添加數據,例如定義表的主鍵(primary key),索引(index),觸發器(trigger),存儲過程(stored procedure)等。表結構可以在被定義之后更新,但是如果有比較大的結構變更的話就會變得比較復雜。在NoSQL中,數據可以在任何時候任何地方添加,不需要先定義表。例如下面這段代碼會自動創建一個新的"借閱表"數據集合:
NoSQL也可以在數據集中建立索引。以MongoDB為例,會自動在數據集合創建后創建唯一值_id字段,這樣的話就可以在數據集創建后增加索引。
從這點來看,NoSQL可能更加適合初始化數據還不明確或者未定的項目中。
3、外部數據存儲
SQL中如何需要增加外部關聯數據的話,規范化做法是在原表中增加一個外鍵,關聯外部數據表。例如需要在借閱表中增加審核人信息,先建立一個審核人表:
再在原來的借閱人表中增加審核人外鍵:
這樣如果我們需要更新審核人個人信息的時候只需要更新審核人表而不需要對借閱人表做更新。而在NoSQL中除了這種規范化的外部數據表做法以外,我們還能用如下的非規范化方式把外部數據直接放到原數據集中,以提高查詢效率。缺點也比較明顯,更新審核人數據的時候將會比較麻煩。
4、SQL中的JOIN查詢
SQL中可以使用JOIN表鏈接方式將多個關系數據表中的數據用一條簡單的查詢語句查詢出來。NoSQL暫未提供類似JOIN的查詢方式對多個數據集中的數據做查詢。所以大部分NoSQL使用非規范化的數據存儲方式存儲數據。
5、數據耦合性
SQL中不允許刪除已經被使用的外部數據,例如審核人表中的"熊三"已經被分配給了借閱人熊大,那么在審核人表中將不允許刪除熊三這條數據,以保證數據完整性。而NoSQL中則沒有這種強耦合的概念,可以隨時刪除任何數據。
6、事務
SQL中如果多張表數據需要同批次被更新,即如果其中一張表更新失敗的話其他表也不能更新成功。這種場景可以通過事務來控制,可以在所有命令完成后再統一提交事務。而NoSQL中沒有事務這個概念,每一個數據集的操作都是原子級的。
7、增刪改查語法
8、查詢性能
在相同水平的系統設計的前提下,因為NoSQL中省略了JOIN查詢的消耗,故理論上性能上是優於SQL的。
三、補充
目前許多大型互聯網項目都會選用MySQL(或任何關系型數據庫) + NoSQL的組合方案。
關系型數據庫適合存儲結構化數據,如用戶的帳號、地址:
1)這些數據通常需要做結構化查詢(嗯,好像是廢話),比如join,這時候,關系型數據庫就要勝出一籌
2)這些數據的規模、增長的速度通常是可以預期的
3)事務性、一致性
NoSQL適合存儲非結構化數據,如文章、評論:
1)這些數據通常用於模糊處理,如全文搜索、機器學習
2)這些數據是海量的,而且增長的速度是難以預期的,
3)根據數據的特點,NoSQL數據庫通常具有無限(至少接近)伸縮性
4)按key獲取數據效率很高,但是對join或其他結構化查詢的支持就比較差
基於它們的適用范圍不同,目前主流架構才會采用組合方案,一個也不能少。目前為止,還沒有出現一個能夠通吃各種場景的數據庫,而且根據CAP理論,這樣的數據庫是不存在的。