前兩天發現服務器掛了,到機房重啟時發現硬盤掛載不上,雖然是開發,但是在交接工作的時候被告知了一點硬件的知識,判斷出是硬盤故障。這個呵呵了,修不來只能找服務器售后來換硬盤或是維修了。
關於怎么診斷出硬盤故障的呢。首先,我已知道服務器的磁盤陣列是Raid5的,而且第二塊硬盤單獨閃黃燈(Raid5如果硬盤存儲時,所有的硬盤同頻閃燈,應該是綠色,備份的時候也是),這就是故障的位置。而且還有個地方是服務器電源按鈕位置有個紫色的按鈕,按下后彈出的東東(原諒我不懂硬件)上hdd亮着黃燈。hdd是什么就不用在解釋了,這就很輕易的診斷了故障的大概位置。
事后也想了解各種磁盤陣列的區別,就簡單總結了一下。
Raid0 :最少需要兩塊盤, 沒用冗余數據,不做備份,任何一塊磁盤損壞都無法運行。n塊磁盤(同類型)的陣列理論上讀寫速度是單塊磁盤的n倍(實際達不到),風險性也是單一n倍(實際更高),是磁盤陣列中存儲性能最好的。適用於安全性不高,要求比較高性能的圖形工作站或者個人站。
Raid1:至少需要兩塊盤,磁盤數量是2的n倍,每一塊磁盤要有對應的備份盤,利用率是50%,只要有一對磁盤沒有損壞就可以正常使用。n組磁盤(2n塊同類型磁盤)的陣列理論上讀取速度是單塊磁盤的n倍(實際達不到),風險性是單一磁盤的n分之一(實際更低)。換盤后需要長時間的鏡像同步,不影響外界訪問,但整個系統性能下降。磁盤控制器負載比較大。適用於安全性較高,且能較快恢復數據的場合。
Raid0+1: 至少需要四塊盤,磁盤數量也是2的n倍。既有數據鏡像備份,也能保證較高的讀寫速度。成本比較大。
Raid3:至少需要3塊盤(2塊盤沒有校驗的意義)。將數據存放在n+1塊盤上,有效空間是n塊盤的總和,最后一塊存儲校驗信息。數據被分割存儲在n塊盤上,任一數據盤出現問題,可由其他數據盤通過校正監測恢復數據(可以帶傷工作),換數據盤需要重新恢復完整的校驗容錯信息。對陣列寫入時會重寫校驗盤的內容,對校驗盤的負載較大,讀寫速度相較於Raid0較慢,適用於讀取多而寫入少的應用環境,比如數據庫和web服務器。使用容錯算法和分塊的大小決定了Raid3在通常情況下用於大文件且安全性要求較高的應用,比如視頻編輯、硬盤播出機、大型數據庫等。
Raid5:至少需要3塊盤,讀取速度接近Raid0,但是安全性更高。安全性上接近Raid1,但是磁盤的利用率更高。可以認為是Raid0和Raid1的一個折中方案。只允許有一塊盤出錯,可以通過另外多塊盤來計算出故障盤的數據,故障之后必須盡快更換。比Raid0+1的磁盤利用率高,是目前比較常用的一種方案。