IEEE 2012 PHM數據挑戰賽


Sutrisno E, Oh H, Vasan A S S, et al. Estimation of remaining useful life of ball bearings using data driven methodologies[C]// Prognostics and Health Management. IEEE, 2012:1-7.

IEEE 2012 PHM數據挑戰賽比賽的目標是在實驗負荷條件下提供滾珠軸承剩余使用壽命的最佳估計。實驗數據集由FEMTO-ST研究所提供。數據集涉及三種不同的負載條件。 條件1有七個滾珠軸承轉速為1800轉/分鍾,徑向負荷為4000N。 七個軸承中有兩個軸承提供了用於算法訓練的從開始運行至故障的完整數據,並為其他五個軸承提供了用於算法測試的截斷數據。 條件2的特點是七個滾珠軸承以1650轉/分鍾的轉速運行,徑向載荷為4200N。 在7個軸承中,提供了兩個用於訓練的從開始運行至故障的完整數據,並為五個軸承提供了測試數據。 條件3的特點是三個軸承以1500轉/分鍾,徑向載荷5000N運行。提供了兩個軸承的數據用於訓練,另有一個軸承的數據用於測試。

在軸承箱上安裝兩個加速度計,用於測量垂直和水平方向的振動。數據采樣間隔為10秒,采樣率為25.6 kHz,持續時間為0.1 s; 因此,每個觀察值包含2560點。

1.1 軸承的剩余使用壽命估計方法

1.1.1 方法1:譜峰度和馬爾可夫蒙特卡羅法

圖1:六個軸承訓練數據的平均移動峰度譜:通過頻率范圍為5.5至6.0 kHz的帶通濾波

 

利用spearman相關系數評估峰度和實驗持續時間之間的相關性,當兩個變量完全單調遞增時,斯皮爾曼相關系數為+1;兩個變量完全單調遞減時,斯皮爾曼相關系數則為−1。

 

通過spearman相關系數評估認為振動信號的譜峰度被認為是最具有隨時間增加而單調遞增特性的特征,在比較了三種類型的退化信號模型與軸承的MAS峰度的擬合結果后,選擇指數模型

對軸承譜峰度的退化數據進行擬合,其中a和b是模型常數,y是退化信號的大小,t是時間。表I顯示了指數模型的擬合程度

 

指數模型a和b的常數使用馬爾可夫蒙特卡羅方法(MCMC)進行更新,馬爾可夫蒙特卡羅是一種通過在概率空間中隨機采樣來接近感興趣參數的后驗分布的方法。每個測試軸承的剩余使用壽命通過指數模型預測MAS峰度的幅度超過預定義閾值的時刻來估計。 在實驗中,基於對圖1所示的六個訓練軸承的峰度的觀察,將故障閾值設定為4。

 

圖2:利用MAS峰度和貝葉斯蒙特卡羅方法估計剩余使用壽命:軸承2_5

 

圖2顯示了測試軸承2_5的故障時間預測直方圖。 估計在20,000秒的方位2_5的剩余使用壽命(RUL)為3,580秒。 軸承2_5的實際剩余壽命為3090秒。 測試軸承2_5的估算剩余壽命和真正剩余壽命之間的誤差為-15.9%。 錯誤中的負值意味着軸承的剩余使用壽命被高估了。誤差計算公式:

 

 

1.1.2 方法2:支持向量回歸機模型

本方法使用最小二乘支持向量回歸機的方法估計軸承的剩余使用壽命(RUL)。其具體步驟如下圖所示

圖3:支持向量回歸機模型預測過程

 

從軸承中測量得到的垂直和水平方向的振動數據中提取特征,每個垂直或水平信號提取十七個特征,共三十四個特征,使用移動平均濾波器對其進行平滑以抑制測量中的噪聲。 在平滑之后對數據進行規范化處理,由此減小大動態范圍的特征而導致的偏差。利用主成分分析法對數據進行降維處理,在減少需要分析的指標同時,盡量減少原指標包含信息的損失,將PCA應用於從訓練軸承提取的特征集,前三個主成分占數據可變性的99.5%以上。 因此,我們將特征集從34個特征減少到3個主要分量。 圖4示出了軸承2_2的前三個主要分量的時間序列圖。

 

圖4:平滑和歸一化后軸承2_2的前3個主要成分時間序列圖

將訓練集的三個主要成分作為最小二乘支持向量機的輸入,軸承的剩余使用壽命作為目標

圖5:LS-SVR進行剩余使用壽命估計說明

 

在預測模式下,從振動信號中提取測試軸承特征,並且利用在訓練模式期間獲得的變換矩陣計算相應的三個主要分量。將得到的三個主要成分作為輸入給訓練的LS-SVR,以產生剩余使用壽命的估計值。

 

 

1.1.3 方法3:振動頻率特征異常檢測和存活時間比

本方法利用異常檢測,退化特征推斷和生存時間比估計測試軸承剩余使用壽命(RUL)。

利用快速傅里葉變換生成對應頻譜,當頻譜中的峰值振動的頻率發生變化時,認為檢測到異常,軸承頻率特征變化的物理解釋是軸承內裂紋,剝落或其他表面缺陷的發生,導致軸承結構以新的頻率和模式進行振動。

 

左上方圖為軸承1_1的水平特征圖。在#1218處觀察到水平特征逐漸增加,檢測為異常,此時軸承進入第一個異常區域。在#2747處軸承進入第二個異常區域。測試軸承1_3與軸承1_1的退化趨勢相似,利用指數曲線對軸承1_1的第一次異常數據進行擬合,第一次異常結束時的擬合值除以異常開始檢測值得到5.47。通過軸承1_3的頻譜數據可知(左下角圖),在#822處水平方向最初存在於2500Hz附近的頻率消失,#822處的異常檢測被認為是第一個異常區域的開始,通過#822處的水平特征值乘以先前獲得的5.47因子得到閾值5.99,通過曲線擬合預測水平特征在#2115處達到此閾值。

對軸承1_1來說,第一次異常區域是從#1218到#2747。通過2747減去1218,我們獲得了異常1的持續時間為1529個觀測值,圖上的每個觀察值之間的間隔為10秒,即15,290秒。軸承1_1進入第二個異常區域560秒后失效。 第二次異常持續時間除以第一次異常持續時間比率:

 

對於軸承1_3來說,#822處被認為是第一次異常區域的開始。 通過曲線擬合預測在#2115處為第一次異常區域的結束,則第一次異常的持續時間為1293個觀測值,即12,930秒。通過將異常1的持續時間乘以從方位1_1獲得的異常比來估計異常2的持續時間

 

通過將兩個異常持續時間加在一起來計算從第一次異常檢測開始到失效的時間:

 

由於軸承1_3在實驗中存活了9800秒,因此軸承1_3的RUL估計為:

 

根據比賽組織者提供的實際RUL數據,方法3估計軸承的剩余使用壽命實際誤差如下圖所示

 

 

 

 

1.2 RUL估計方法的比較

上述三種方法使用了軸承退化的不同特征來估計其剩余使用壽命。

在方法1中,振動信號的譜峰度被認為是具有隨時間增加而單調遞增的特征。利用貝葉斯蒙特卡洛方法對指數模型的系數進行更新,但在軸承臨近失效時間點,其特征會發生劇烈的改變。利用貝葉斯蒙特卡洛方法進行模型系數的更新未考慮這種情況,有高估RUL的趨勢。

方法2,引入了支持向量回歸機模型,對輸入特征沒有單調趨勢的要求。 但由於六個訓練軸承在失效時間前特征變化劇烈,且訓練樣本有限,LSSVR高估了部分測試軸承的RUL。如果在每種條件下提供更多的訓練軸承,則算法精度能以更高的精度執行。

方法3,將軸承的退化分為了多個階段,RUL的估算是基於對軸承退化階段之間的持續時間比值而進行預測,本方法其優點在於RUL估計過程簡單,計算復雜度小。但其缺點是通過分析頻率特征的變化來檢測異常,但在某些軸承中,頻率可能不發生變化或頻率中有噪聲,異常不能清楚地被識別。

以上提出了三種估算軸承剩余使用壽命的方法。有限的訓練數據使得三種方法都具有高度的不確定性,比賽根據評分函數計算每個軸承的剩余壽命估計得分,取所有軸承得分的平均值為最終結果,最終第三種方法獲得了2012年PHM數據挑戰賽優勝。

 

圖7:根據預測值與實際值的百分比誤差估算RUL的評分函數


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM