nosql的介紹以及和關系型數據庫的區別


一直對非關系型數據庫和關系型數據庫的了解感覺不太深入,在網上收集了一些關於sql和nosql的區別和優缺點分享給大家。

Nosql介紹

Nosql的全稱是Not Only Sql,這個概念早起就有人提出,在09年的時候比較火。Nosql指的是非關系型數據庫,而我們常用的都是關系型數據庫。就像我們常用的mysqlsqlserver一樣,這些數據庫一般用來存儲重要信息,應對普通的業務是沒有問題的。但是,隨着互聯網的高速發展,傳統的關系型數據庫在應付超大規模,超大流量以及高並發的時候力不從心。而就在這個時候,Nosql得到的告訴的發展。

 

Nosql和關系型數據庫的區別

1.存儲方式

  關系型數據庫是表格式的,因此存儲在表的行和列中。他們之間很容易關聯協作存儲,提取數據很方便。而Nosql數據庫則與其相反,他是大塊的組合在一起。通常存儲在數據集中,就像文檔、鍵值對或者圖結構。

 

2.存儲結構

  關系型數據庫對應的是結構化數據,數據表都預先定義了結構(列的定義),結構描述了數據的形式和內容。這一點對數據建模至關重要,雖然預定義結構帶來了可靠性和穩定性,但是修改這些數據比較困難。而Nosql數據庫基於動態結構,使用與非結構化數據。因為Nosql數據庫是動態結構,可以很容易適應數據類型和結構的變化。

 

3.存儲規范

  關系型數據庫的數據存儲為了更高的規范性,把數據分割為最小的關系表以避免重復,獲得精簡的空間利用。雖然管理起來很清晰,但是單個操作設計到多張表的時候,數據管理就顯得有點麻煩。而Nosql數據存儲在平面數據集中,數據經常可能會重復。單個數據庫很少被分隔開,而是存儲成了一個整體,這樣整塊數據更加便於讀寫

 

4.存儲擴展

  這可能是兩者之間最大的區別,關系型數據庫是縱向擴展,也就是說想要提高處理能力,要使用速度更快的計算機。因為數據存儲在關系表中,操作的性能瓶頸可能涉及到多個表,需要通過提升計算機性能來克服。雖然有很大的擴展空間,但是最終會達到縱向擴展的上限。而Nosql數據庫是橫向擴展的,它的存儲天然就是分布式的,可以通過給資源池添加更多的普通數據庫服務器來分擔負載。

橫向擴展是已擴展服務器的數量進行高並發的處理(增強處理業務的能力)

 

根據配置nginx的反向代理,轉發服務器(配置的ip)進行輪換處理業務(可加入負載均衡器進行分發請求)

 

縱向擴展,是增加單機的處理能力,一般增加cpu的處理能力

 

 

5.查詢方式

  關系型數據庫通過結構化查詢語言來操作數據庫(就是我們通常說的SQL)。SQL支持數據庫CURD操作的功能非常強大,是業界的標准用法。而Nosql查詢以塊為單元操作數據,使用的是非結構化查詢語言(UnQl),它是沒有標准的。關系型數據庫表中主鍵的概念對應Nosql中存儲文檔的ID。關系型數據庫使用預定義優化方式(比如索引)來加快查詢操作,而Nosql更簡單更精確的數據訪問模式。

 

6.事務

  關系型數據庫遵循ACID規則(原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)),而Nosql數據庫遵循BASE原則(基本可用(Basically Availble)、軟/柔性事務(Soft-state )、最終一致性(Eventual Consistency))。由於關系型數據庫的數據強一致性,所以對事務的支持很好。關系型數據庫支持對事務原子性細粒度控制,並且易於回滾事務。而Nosql數據庫是在CAP(一致性、可用性、分區容忍度)中任選兩項,因為基於節點的分布式系統中,很難全部滿足,所以對事務的支持不是很好,雖然也可以使用事務,但是並不是Nosql的閃光點。

 

柔性事務滿足Base理論(基本可用、最終一致性)CAP理論。

剛性事務滿足ACID理論。

 

 

1. 原子性

原子性是指事務是一個不可再分割的工作單元,事務中的操作要么都發生,要么都不發生。

可采用A向B轉賬”這個例子來說明解釋

DBMS中,默認情況下一條SQL就是一個單獨事務,事務是自動提交的。只有顯式的使用start transaction開啟一個事務,才能將一個代碼塊放在事務中執行。

2. 一致性

一致性是指在事務開始之前和事務結束以后數據庫的完整性約束沒有被破壞。這是說數據庫事務不能破壞關系數據的完整性以及業務邏輯上的一致性

A給B轉賬,不論轉賬的事務操作是否成功,其兩者的存款總額不變(這是業務邏輯的一致性,至於數據庫關系約束的完整性就更好理解了)。

保障機制(也從兩方面着手):數據庫層面會在一個事務執行之前和之后,數據會符合你設置的約束唯一約束,外鍵約束,check約束)和觸發器設置;此外,數據庫的內部數據結構(如 B 樹索引或雙向鏈表)都必須是正確的。業務的一致性一般由開發人員進行保證,亦可轉移至數據庫層面。

3. 隔離性

多個事務並發訪問時,事務之間是隔離的,一個事務不應該影響其它事務運行效果。

在並發環境中,當不同的事務同時操縱相同的數據時,每個事務都有各自的完整數據空間。由並發事務所做的修改必須與任何其他並發事務所做的修改隔離。事務查看數據更新時,數據所處的狀態要么是另一事務修改它之前的狀態,要么是另一事務修改它之后的狀態,事務不會查看到中間狀態的數據

事務最復雜問題都是由事務隔離性引起的。完全的隔離性是不現實的,完全的隔離性要求數據庫同一時間只執行一條事務,這樣會嚴重影響性能。

關於隔離性中的事務隔離等級(事務之間影響),參見相應博文

4. 持久性

這是最好理解的一個特性:持久性,意味着在事務完成以后,該事務所對數據庫所作的更改便持久的保存在數據庫之中,並不會被回滾。(完成的事務是系統永久的部分,對系統的影響是永久性的,該修改即使出現致命的系統故障也將一直保持)

write ahead loggingSQL Server中使用了WAL(Write-Ahead Logging)技術來保證事務日志的ACID特性,在數據寫入到數據庫之前,先寫入到日志,再將日志記錄變更到存儲器中。

 

 

7.性能

  關系型數據庫為了維護數據的一致性付出了巨大的代價,讀寫性能比較差。在面對高並發讀寫性能非常差,面對海量數據的時候效率非常低。而Nosql存儲的格式都是key-value類型的,並且存儲在內存中,非常容易存儲,而且對於數據的 一致性是 弱要求。Nosql無需sql的解析,提高了讀寫性能。

 

8.授權方式

  關系型數據庫通常有SQL ServerMysqlOracle。主流的Nosql數據庫有redismemcacheMongoDb。大多數的關系型數據庫都是付費的並且價格昂貴,成本較大,而Nosql數據庫通常都是開源的。

 

RedisMemcacheMongoDb的特點與區別

 

Redis

優點

1.支持多種數據結構,如 string(字符串)、 list(雙向鏈表)dict(hash)set(集合)、zset(排序set)

2.支持持久化操作,可以進行aofrdb數據持久化到磁盤,從而進行數據備份或數據恢復等操作,較好的防止數據丟失  的手段。
3.支持通過Replication進行數據復制,通過master-slave機制,可以實時進行數據的同步復制,支持多級復制和增量復制,master-slave機制是Redis進行HA的重要手段。
4.單線程請求,所有命令串行執行,並發情況下不需要考慮數據一致性問題。
5.支持pub/sub消息訂閱機制,可以用來進行消息訂閱與通知。
6.支持簡單的事務需求,但業界使用場景很少,並不成熟。

缺點

1.Redis只能使用單線程,性能受限於CPU性能,故單實例CPU最高才可能達到5-6wQPS每秒(取決於數據結構,數據大小以及服務器硬件性能,日常環境中QPS高峰大約在1-2w左右)。
2.支持簡單的事務需求,但業界使用場景很少,並不成熟,既是優點也是缺點。
3.Redisstring類型上會消耗較多內存,可以使用dicthash表)壓縮存儲以降低內存耗用。

 

Memcache

優點

1.Memcached可以利用多核優勢,單實例吞吐量極高,可以達到幾十萬QPS(取決於keyvalue的字節大小以及服務器硬件性能,日常環境中QPS高峰大約在4-6w左右)。適用於最大程度扛量。
2.支持直接配置為session handle

缺點

1只支持簡單的key/value數據結構,不像Redis可以支持豐富的數據類型。
2.無法進行持久化,數據不能備份,只能用於緩存使用,且重啟后數據全部丟失。
3.無法進行數據同步,不能將MC中的數據遷移到其他MC實例中。
4.Memcached內存分配采用Slab Allocation機制管理內存,value大小分布差異較大時會造成內存利用率降低,並引發低利用率時依然出現踢出等問題。需要用戶注重value設計。

 

MongoDB

優點

1.更高的寫負載,MongoDB擁有更高的插入速度。
2.處理很大的規模的單表,當數據表太大的時候可以很容易的分割表。
3.高可用性,設置M-S不僅方便而且很快,MongoDB還可以快速、安全及自動化的實現節點(數據中心)故障轉移。
4.快速的查詢,MongoDB支持二維空間索引,比如管道,因此可以快速及精確的從指定位置獲取數據。MongoDB在啟動后會將數據庫中的數據以文件映射的方式加載到內存中。如果內存資源相當豐富的話,這將極大地提高數據庫的查詢速度。
5.非結構化數據的爆發增長,增加列在有些情況下可能鎖定整個數據庫,或者增加負載從而導致性能下降,由於MongoDB的弱數據結構模式,添加1個新字段不會對舊表格有任何影響,整個過程會非常快速。

缺點

1.不支持事務。
2.MongoDB占用空間過大 。
3.MongoDB沒有成熟的維護工具。

 

RedisMemcacheMongoDB的區別

1.性能

三者的性能都比較高,總的來講:MemcacheRedis差不多,要高於MongoDB

2.便利性

memcache數據結構單一。
redis豐富一些,數據操作方面,redis更好一些,較少的網絡IO次數。
mongodb支持豐富的數據表達,索引,最類似關系型數據庫,支持的查詢語言非常豐富。

3,存儲空間

redis2.0版本后增加了自己的VM特性,突破物理內存的限制;可以對key value設置過期時間(類似memcache)。
memcache可以修改最大可用內存,采用LRU算法。
mongoDB適合大數據量的存儲,依賴操作系統VM做內存管理,吃內存也比較厲害,服務不要和別的服務在一起。

4.可用性

redis,依賴客戶端來實現分布式讀寫;主從復制時,每次從節點重新連接主節點都要依賴整個快照,無增量復制,因性能和效率問題,所以單點問題比較復雜;不支持自動sharding,需要依賴程序設定一致hash 機制。一種替代方案是,不用redis本身的復制機制,采用自己做主動復制(多份存儲),或者改成增量復制的方式(需要自己實現),一致性問題和性能的權衡。
Memcache本身沒有數據冗余機制,也沒必要;對於故障預防,采用依賴成熟的hash或者環狀的算法,解決單點故障引起的抖動問題。
mongoDB支持master-slave,replicaset(內部采用paxos選舉算法,自動故障恢復),auto sharding機制,對客戶端屏蔽了故障轉移和切分機制。

5.可靠性

redis支持(快照、AOF):依賴快照進行持久化,aof增強了可靠性的同時,對性能有所影響。
memcache不支持,通常用在做緩存,提升性能。
MongoDB1.8版本開始采用binlog方式支持持久化的可靠性。

6.一致性

Memcache 在並發場景下,用cas保證一致性。
redis事務支持比較弱,只能保證事務中的每個操作連續執行。
mongoDB不支持事務。

7.數據分析

mongoDB內置了數據分析的功能(mapreduce),其他兩者不支持。

8.應用場景

redis:數據量較小的更性能操作和運算上。
memcache:用於在動態系統中減少數據庫負載,提升性能;做緩存,提高性能(適合讀多寫少,對於數據量比較大,可以采用sharding)。

Mongodb:主要解決海量數據的訪問效率問題

 

Redis 簡介

 

Redis 是完全開源免費的,遵守BSD協議,是一個高性能的key-value數據庫。

 

Redis 與其他 key - value 緩存產品有以下三個特點:

 

  • Redis支持數據的持久化,可以將內存中的數據保存在磁盤中,重啟的時候可以再次加載進行使用。
  • Redis不僅僅支持簡單的key-value類型的數據,同時還提供listsetzsethash等數據結構的存儲。
  • Redis支持數據的備份,即master-slave模式的數據備份。

 

 

 

Redis 優勢

 

  • 性能極高 – Redis能讀的速度是110000/s,寫的速度是81000/s
  • 豐富的數據類型 – Redis支持二進制案例的 Strings, Lists, Hashes, Sets Ordered Sets 數據類型操作。
  • 原子 – Redis的所有操作都是原子性的,意思就是要么成功執行要么失敗完全不執行。單個操作是原子性的。多個操作也支持事務,即原子性,通過MULTIEXEC指令包起來。
  • 豐富的特性 – Redis還支持 publish/subscribe, 通知, key 過期等等特性。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM