最近一段時間Dell PowerVault TL4000 磁帶機故障頻繁,昨天我在管理系統里面看到Library Status告警:HE: sled blocked, error during sled movement to rotation position Code: 8D 07 ,Dell工程師根據Code: 8D 07判斷是磁帶卡帶了,於是有幸和Dell的工程師對這台機器”開膛破肚“,一窺其內部構造。遺憾的是忘了拍照了。
原因分析
出現這個錯誤編碼是磁帶卡住了,卡帶大體分兩種 : 磁帶自動加載機的卡帶 & 磁帶庫卡帶
下面介紹摘自博客:http://shehui.hc360.com/space.php?uid=7417480&do=blog&id=1119767
二、 磁帶自動加載機的卡帶常見故障:
1. 磁帶自動加載機的卡帶故障可以分為兩部分,分別為驅動器和加載器及傳動機構,驅動器的情況同上我們
就不在講了,主要講一下加載器和傳動機構卡帶的情況,這類機器的代表型有HP 1/8系列及IBM 3581系列,這兩個
系列的機器結構是基本一樣的,要把磁帶正確的加載到磁帶驅動器里,要通過加載器和傳動機構,卡帶的故障主要
在這兩個環節中發生,加載器損壞及傳動機構定位不准是卡帶的主要原因,這種故障主要是由於皮帶老化,相關傳
感器失靈,機械磨損過大,伺服電路損壞等原因造成的,這兩類型的機器手冊上都有相應的故障碼可查,對於用戶
來說指導意義都不是很大,因為用戶沒有經驗和相應的配件可換,我建議請專業人員進行處理。
2. 對於HP G2這類的加載機或SUN SL24(SUN公司稱這個檔次機器也叫加載機),這類加載機卡帶主要是機械手
與庫體之間的問題,這類加載機的機械手的故障比較多,由於是塑料齒輪,實踐中發現,打壞齒輪的現象時有發生
,光電傳感器老化、控制電路故障都可能造成卡帶,表現形式多數是定位不准卡在庫體內,槽位損壞也可造成卡帶。
三、 磁帶庫卡帶的常見故障;
磁帶庫總類繁多,卡帶故障多種多樣,對於工作不穩定,不定期的造成此類的故障非常不好排除,機械手是磁帶庫
核心部件,它由機械的、電子的、光學的等相關部件組成,任何一部分的老化及傳感器失靈都可能造成卡帶。
1. 對於IBM 3582 /3583/3584這種類型的磁帶庫,就這三種磁帶庫而言,機械手的故障率是不同的,IBM
3582機械手比較簡單,故障率比較低,IBM 3583/3584較為復雜,尤其是IBM 3583拆裝比較困難,機械手上帶光柵
傳感器的電機用久了會失靈的,光電傳感器穩定性也會變差。
2. 對於IBM TS3100/3200、HP MSL2024/4048是一個類型的磁帶庫,機械手卡帶的故障主要是機械手的機械故
障和相應傳感器失靈造成的。
3. 對於IBM TS3310、Quantum scalar i500、DELL ML6000系列的磁帶庫,這類磁帶庫機械手和機械臂是在一
起的,卡帶原因比較復雜,這屬於中型磁帶庫,一般都應用在比較重要的場合,目前應用比較廣泛,這種帶庫機械
手故障率較高,它由機械臂、機械手及掃描槍組成,任何一個環節的失靈都可能造成卡帶。
4. 對於Quantum PX502/510、SUN C4這種類型的磁帶庫卡帶故障現象區別於以上情況,這類磁帶庫機械手Z軸
是靠皮帶帶動的,實踐中發現,經常有不歸位的現象發生,X,Y軸也有不到位的現象,磁帶經常卡在機械手與槽位
之間,這種機器裝機量不是很大,Z軸拆裝起來很困難,這類磁帶庫卡帶故障比較復雜,需要有經驗的工程師處理
。
5. 對於STK大型磁帶庫,如STK L180/L700的卡帶故障,我們的處理的指導意見是機械手的工作是有壽命的,
要按工作的時間進行更換,保證重要場合的備份可靠性,實踐中我們發現,這類磁帶庫最大的問題是機械手工作不
穩定,有時磁帶卡在機械手里不動或加載不可靠,有時一兩個星期發生一次,查不出具體原因,我們經過替換法檢
測多數是機械手老化造成的,由於機械手上有很多光學的照相機和光學的傳感器,這類東西是有壽命和逐漸的老化
的,建議不要等到徹底損壞的時候在更換。
問題解決
Dell 的工程師也無法根據錯誤代碼判斷是那種情況。最后將機器拆開檢查時,發現是一盒磁帶突出了部分,導致機械臂被卡住,機械臂無法移動。
參考資料:http://shehui.hc360.com/space.php?uid=7417480&do=blog&id=1119767