RAID在企業服務器中的應用(RAID幾種級別)


企業級的數據庫應用大多部署在RAID磁盤陣列的服務器上,這樣能提高磁盤的訪問性能,並能夠實現容錯/容災。
RAID(冗余磁盤陣列),簡單理解,就是拿一些廉價的硬盤來做成陣列。其目的無非是為了擴展存儲容量,提升讀寫性能,實現數據冗余(備份容災)。就像很早就有老外拿N台舊PC,做成一個強大的“服務器集群”。RAID技術誕生於1987年,由美國加州大學伯克利分校提出。
主流的大概可以分為幾個級別:RAID 0,RAID 1,RAID 5,RAID 10 。配置起來也不是很復雜,有興趣和條件的朋友可以找相關的資料,自己動手實踐。


SQL Server 2005常用的有幾個級別0,1,5,10 下面我來簡單說說這個幾個級別的區別及其應用。


RAID 0 簡稱磁盤條帶化,它可以提供最好的讀寫性能,如果你把兩塊磁盤做成了RAID0,那么在寫入數據的時候,就可以同時對A磁盤和B磁盤執行寫入操作。這里我必須說明的是:“可以同時...寫入操作”,並不是意味着將文件的相同內容“在同一時間內完全寫入”A磁盤和B磁盤中打 個比方:有一個100M的文件需要寫入磁盤中,假設單個磁盤的寫入速度是10M/S,那么需要10秒鍾才能完成寫入工作。但如果在具有A、B兩塊磁盤的 RAID 0陣列環境中,(以秒/S為最小單位的)單時間內,可以將10M內容寫入A磁盤中,並同時將緊隨的10M內容寫入B磁盤中,這樣算起來,寫入速度變成了 20M/S,只需要5秒鍾就能搞定了,而且每塊磁盤中只需存儲50M的文件內容,不會造成硬盤存儲壓力。當然,上訴例子也許不恰當,也只是指的理論環境 下,實際環境中會有很多其他因素,效率肯定不能達到。
毋庸置疑的是,這樣肯定是能提高讀寫性能的,但是這樣也帶來了一個問題就是,如果其中的一部 分數據丟失了,你的全部數據都不會找回來的,因為RAID0沒有提供冗余恢復數據的策略。所以RAID0可以用在只讀的數據庫數據表,或者是經過復制過來 的數據庫上,如果你對數據丟失不敏感的話,也可以使用RAID 0,總之這個level下是高性能、無冗余

RAID 1 磁盤鏡像 它對讀沒有什么影響,如果有兩塊磁盤它只對寫有影響,因為它采用了一塊磁盤做冗余備份的方法,這樣如果你有兩塊50G的磁盤,那么加起來就是100G,但是在RAID 1下,那么你只能使用50G ,這種方法會影響磁盤的空間使用,降低了I/O 寫的性能。通俗點來講:你將一個100M的文件寫入RAID 1時,講內容寫入A磁盤的同時,也會將相同的內容寫入B磁盤中。 這樣一來,兩塊磁盤的內容是完全一致的(這就傳說中的”冗余“,並不是什么高深的東西)。本來只需要寫入1塊硬盤的,可是現在要寫入到兩塊硬盤去,效率肯 定會變低。至於“讀”操作,RAID 1環境下,讀取時候只使用到了一塊硬盤,所以和普通的環境下沒啥區別(如果兩塊硬盤都能夠同時工作,那么還可以分攤壓力的)。只是當第一個硬盤數據損壞或 者掛掉了,就啟動第二塊硬盤。當然,兩塊硬盤都掛了,那就真的崩潰了。哈哈。值得一提的是,有些書或者文章上講,RAID 1是在將第一塊硬盤寫入完成后,才將數據完整復制到第二塊磁盤中做為鏡像備份的這種說法有待考證,按我的理解,是同時復制寫入的。

RAID 5 與RAID1 不同之處就是多了奇偶校驗,所有的奇偶校驗的信息會遍布各個磁盤,性能上要比RAID1高些,但是一旦發生磁盤I/O失敗,就會造成性能急劇下降,同時這 種方法也在RAID0 與RAID1間折了中,是比較通用的做法。 用簡單的語言來表示,至少使用3塊硬盤(也可以更多)組建RAID5陣列,當有數據寫入硬盤的時候,按照1塊硬盤的方式就是直接寫入這塊硬盤的,如果是 RAID5的話這次數據寫入會分根據算法分成3部分,然后寫入這3塊硬盤,寫入的同時還會在這3塊硬盤上寫入校驗信息,當讀取寫入的數據的時候會分別從3 塊硬盤上讀取數據內容,再通過檢驗信息進行校驗。當其中有1塊硬盤出現損壞的時候,就從另外2塊硬盤上存儲的數據可以計算出第3塊硬盤的數據內容。也就是說RAID5這種存儲方式只允許有一塊硬盤出現故障,出現故障時需要盡快更換。當更換故障硬盤后,在故障期間寫入的數據會進行重新校驗。 如果在未解決故障又壞1塊,那就是災難性的了。

RAID 10  (也叫RAID 0+1 )就是RAID0 與 RAID1的組合,它提供了高性能,高可用, 性能上要比RAID5好,特別適合大量寫入的應用程序,但是就是成本比較高無論是多少塊磁盤你都是將損失一半的磁盤存儲。按照我的理解,至少需要4塊硬盤 才能完成,A和B做數據分割,分別存儲一半的數據,C和D分別對應做A和B的鏡像備份。這樣一來,可真是完美了,也是我理想中的最佳狀態。也不需要 RAID 5的奇偶校驗。很顯然,這樣子成本也會高一些。還有一點很遺憾的就是性能的”短板效應“,這個似乎不那么容易改善,除非有類似於”負載均衡”設備的控制器和合理的控制算法。

當然,這就和我們講架構時候經常說的“負載均衡、高可用集群,橫向擴展,縱向擴展”的目的其實很類似。通俗點來講,都是為了實現不間斷的工作,保證數據完整性和高可用性,而且最重要的,還要能分攤壓力。突然讓我想起了上初中物理時候學的“串聯和並聯”,有點像哦。順便講個丟人的笑話,也是我的真實經歷,N年前,某日和某大師在一起抽煙、吹牛、瞎侃,大師瞎侃說”google光是在中國目前有XX台服務器集群......“,當時我並不理解什么叫“集群”,第一反應就是這么多台服務器之間到底是“串聯“的還是”並聯”的關系呢?

 

說到最后,可能某些朋友已經不耐煩了。好像本文只是在不停的解釋常見RAID的和其好處,而並沒提及到sqlserver或者windows存儲相關的內容。大家都知道,I/O往往是數據庫性能最大的瓶頸, 有時候其實很簡單,只需要將sqlserver所在的db server上部署合適的RAID,並將數據庫文件分布到不同的磁盤上,就能很大程度的提升數據庫的性能,真可謂是立竿見影。有興趣的朋友,不妨自己實際動手實踐一下,網上這方面的資料也很多。其實RAID成本並不高(和DELL、EMC等等那些高端的存儲比起來真是“廉價”)。

甚至自己在家里PC機上,也可以通過陣列卡的方式來實現(效果可能不太好)。目前一般的PC服務器,內置都會有RAID支持,在PC服務器領域使用非常廣泛。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM