基於SCADA數據驅動的風電機組部件故障預警


吳亞聯 1 , 梁坤鑫 1 , 蘇永新 1* , 詹 俊 2
(1.湘潭大學 信息工程學院, 湖南 湘潭 411105; 2.湖南優利泰克自動化系統有限公司, 湖南 長沙 410205)

摘 要: 為提高風電機組部件故障預警的精度和速度, 文章提出了一種基於SCADA數據的風電機組部件故障預警方法, 用於解決現存的風電機組部件故障預警時間與故障預警精度的矛盾。 首先SCADA歷史數據通過數據預處理與BP神經網絡建立機組部件正常狀態模型, 隨后以該模型為基礎結合基於馬氏距離的數據統計方法形成故障預警判據, 並將結果反饋給SCADA系統達到風電機組部件故障預警目的。 仿真結果表明, 使用該方法能夠提前2個月識別主軸承故障信號, 同時該方法能發現SCADA系統誤報故障。
關鍵詞: 神經網絡; 故障診斷系統; 馬氏距離; 風電場; SCADA系統

作為一種綠色無污染的新能源, 風能越來越受到重視,它將成為人類未來主要的能源資源 [1] 。 受復雜多變的環境因素影響, 風電機組各部件性能會在運行中逐漸下降, 最終導致部件發生故障。 而對風電機組部件進行故障預警則可提前發現隱患, 有利於優化維護計划, 避免因部件故障延誤而導致更加嚴重的整機故障。
傳統風電機組故障預警方法有振動分析、 聲學分析、 潤滑分析等, 這些方法需要采集高頻率的振動數據或額外安裝高成本附加設備或者傳感器, 導致難以廣泛應用於風場中。 風機數據采集與監控(Supervisory Control And Data Acquisition, SCADA) 系統作為風機狀態監測的重要組成部分, 能夠提供監測風機狀態與風機部件運行狀態的數據, 基於SCADA數據驅動的風機部件故障預警方法已經被廣泛應用於風場中。 通過SCADA數據建立神經網絡模型對風機部件進行故障預警不需要對風機組件的機械結構有深入了解。
當SCADA數據充足的情況下, 能夠實現對風機多部件的故障預警。 神經網絡對風機組件故障預警的這些優點, 使其成為風機關鍵部件故障預警的重要方法之一 [2-4] 。
Garcia等 [5] 在2006年提出通過利用神經網絡建立風機組件正常模型對風機齒輪箱進行故障預警, 該方法通過神經網絡正常模型的預測值與實際值進行比較得到誤差, 將在正常行為模型定義的置信區間之外的誤差判斷為異常。 研究結果表明, 使用Garcia提出的方法只能提前26小時監測到風機齒輪箱發生故障, 預警時間過短導致無法針對即將發生的故障制定相應的維護計划。 Zaher等 [6] 在2009年提出類似的方法, 即通過觀察神經網絡的預測值與實時數據之間的誤差和誤差頻率的增加來實現故障預警。 該方法能夠提前6個月對齒輪箱軸承故障進行識別, 但是因為缺乏定量的判據來判斷風機組件是否發生異常, 未曾大量運用於風場。 Kusiak等 [7] 在2012年通過改進神經網絡模型, 選取最優性能模型對風機發電機軸承進行故障預測。 實驗結果表明, 該方法能夠提高神經網絡精度, 但只能實現提前1.5小時對風機發電機軸承進行故障預測。 由於預警時間過短, 風場業主短時間內無法制定有效的維護計划。針對以上問題, 本文着力解決故障預警時間和預警精度的矛盾。 在結合逐步回歸算法和遺傳算法優化神經網絡預測模型的基礎上, 根據神經網絡預測模型與馬氏距離原理, 提出基於SCADA數據的風機部件故障預警方法。 通過某風場2 MW直驅式的風機進行試驗、 分析, 驗證所給出的方法在預警時間、 精度方面的有效性。
1 風機故障預警框架
如引言所述, 本文提出一種基於遺傳算法的優化BP神經網絡(Genetic Algorithm-Back Propagation, GA-BP) 和風機部件參數概率分布的風電機組部件故障預警方法, 其原理如圖1所示, 方法分為風電機組部件正常行為建模、 故障預警兩個部分。

 

 

 圖1 基於SCADA數據驅動的風電機組部件故障預警

1.1 風電機組部件正常行為建模
實際觀測中發現SCADA數據中存在異常數據, 為保證訓練數據的一致性與連續性, 對訓練數據進行異常數據濾除。 同時為了避免輸入參數重復使用與數據冗余, 采用逐步回歸算法獲取神經網絡輸入參數, 獲取風機部件參數相關性較大的輸入參數。SCADA系統由於結構復雜狀態參數眾多, 故障特征與故障之間存在極為復雜的非線性關系。 GA-BP神經網絡具有強大的非線性映射功能, 無需單獨建模, 能有效運用於風電場故障診斷中。 基於GA-BP神經網絡, 選取相關參數, 建立風電機組部件正常行為模型, 正常行為模型結合基於馬氏距離的數據統計方法, 形成故障預警判據, 計算了故障分布概率, 能適應多重工況。
1.2 故障預警
通過SCADA系統將風電機組部件實時監控數據輸入模型, 得到其輸出, 並計算其與正常值的馬氏距離, 如果馬氏距離越限, 則判定機組故障, 從而實現故障預警。如圖1所示, 基於SCADA數據對風電機組部件進行故障預警主要分為以下3個步驟: 神經網絡選擇; 數據預處理; 風機部件故障判據確定。
1.3 神經網絡選擇
風機部件故障診斷問題本質上是非線性的, 選擇的神經網絡應具有並行處理學習記憶和非線性等特點。 針對以上特點, 選取BP神經網絡建立正常模型對風機部件進行故障診斷, 結果表明BP神經網絡在風機故障預警中的適用性 [7-8] 。結合具有全局尋優能力的遺傳算法, 優化BP神經網絡的權重和閾值, 設計基於GA-BP神經網絡, 構建風電機組部件預警方案, 有效改善了BP神經網絡速度和收斂速度, 也可提高故障預警的成功率 [8-9] 。 本文采用遺傳算法優化后的BP神經網絡。
2 數據預處理
2.1 異常數據濾除
神經網絡預測模型通過訓練階段的數據來確定輸入輸出之間的映射, 然而SCADA數據在正常情況下很難找到一個完整的、 正常的訓練數據集。 通常情況下通過SCADA系統獲取的數據是不連續、 不一致的, 為了提高神經網絡預測模型的准確性, 需要對數據進行預處理。選取風機功率數據進行數據預處理, 圖2為某風機功率數據圖, 通過數據的平均值 x 和偏差δ, 對數據進行異常濾除, 受到其他外部因素的影響導致數據具有波動性, 對其進行指數滑差處理:

 

 

 式中: k通過統計小概率事件確定, 通過設置k和α對數據進行異常判斷, 當x t 滿足公式(2) 時, 可以判斷當前數據為正常值, 否則為異常進行濾除。 選取k=3和α=0.3對功率數據進行處理, 濾除結果如圖2所示。

 

 

 圖2 風電機組功率數據預處理

2.2 神經網絡輸入參數選擇
對於風電場的SCADA數據, 神經網絡選取輸入參數, 大多通過主觀經驗判斷或者參數之間的相關性來決定。 由於風電場SCADA參數之間存在相關性, 使用參數相關性選取神經網絡輸入參數的方法, 當選擇輸入參數存在高度相關時, 會造成參數的重復使用和數據冗余的問題。 而通過主觀經驗法選擇神經網絡輸入參數, 由於影響風機部件的參數比較多, 存在選擇參數不准確, 導致神經網絡效率低, 選擇參數過少, 精度不夠等問題。我們采取逐步回歸 [10-11] 解決這一問題, 逐步回歸分析具體步驟如下所示:
第一步: 輸入SCADA參數樣本X(m,n), 有n個參數x 1 ,x 2 ,x 3 ,…,x n , 所有參數的維度為m。
第二步: 故障預警部件參數設為x n 計算所有參數的平均值ix 、 離均差平方和s ii 、 協方差矩陣S=(s ij ) n×n' 和相關系數矩陣R=(r ij ) n×n' 。

 

 

 其中i,j=1,2,3,…,n-1,n。
第三步: 判斷可選入參數個數是否大於2, 選入參數數量當大於2繼續下一步, 否則結束。
第四步: 計算各參數的方差貢獻, 以l(l≥1) 步為例, 計算偏回歸平方和V l p 。

 

 

 第五步: 選入參數的顯著性檢驗。 檢驗時, 先選定信度a, 查表得到F a , 挑選未入選的模型中方差貢獻最大的參數,計算:

 

 

 若F 1 >F a , 說明該參數對y作用顯著, 應該選入參數, 同時對相關系數矩陣R做變換, 否則結束。
第六步: 判斷選入參數的數量是否大於2, 當數量大於2則繼續下一步, 否則執行第四步。
第七步: 做剔除參數的顯著性檢驗。 挑選入選模型中方差貢獻最小的變量, 計算:

 

 

 若F 2 <F a , 說明該變量對y作用不顯著, 應該剔除掉, 對相關系數矩陣R做變換。 否則將參數保留。 並執行下一步
第八步: 判斷為剩余可選入參數數量是否大於2個, 當滿足大於2時, 執行第四步, 否則獲得最優參數子集。
3 風機部件故障判據
針對上文中提出的傳統風機部件故障預警方法的局限性, 本文通過馬氏距離設計風電機組部件故障判據, 馬氏距離方本質上是一種統計學方法, 避免了傳統上單次幅度閾值判斷方法受偶然因素影響劇烈的缺點。馬氏距離是一種距離測量單位, 表示數據協方差距離大小。 馬氏距離能夠排除相關變量之間相關性的干擾, 給出多元變量中單變量的距離, 常用來識別數據集中的異常值。 由此本文使用該方法以獲取SCADA數據集中的異常值, 馬氏距離獲取數據異常值計算如式(10) 所示:

 

 

 第i個向量X i =[Xi1, Xi2, Xi3,…, X im ], m是向量總數。u=[u 1 ,u 2 ,u 3 ,…,u m ]是均值向量。馬氏距離對於訓練數據集的計算如下:

 

 

 式中: X ref =[訓練數據, 訓練誤差], 用於訓練神經網絡的歷史數據, 訓練數據所產生的誤差。通過獲取到的馬氏距離值利用最小二乘法確定威布爾分布函數:

 

 

 在訓練階段獲取到的馬氏距離值符合雙函數威布爾分布, 如圖3所示。 通過獲取到的馬氏距離值利用最小二乘法確定威布爾分布函數:

 

 

 其中: X newi =[預測誤差, 測量數據], 其中測量數據指的是預測時SCADA監控到的組件的實時數據, 預測誤差指的是神經網絡的預測值與實時數據的誤差。

通過獲取到實時的預測誤差與檢測數據, 計算得到馬氏距離值MD newi , 通過獲取到的馬氏距離值MD newi 計算f(MD newi ) 。 當滿足f(MD newi ) <0.01時, 則可以判斷當前數據為異常 [12] 。 實現風機部件故障診斷。

 

 

 圖3 人工神經網絡訓練過程MD值的
直方圖和韋布爾概率密度函數

4 仿真及結果分析
相比於傳統的風電機組需要齒輪箱的多級增速, 直驅式風電機組忽略了增益齒輪箱, 結構較為簡單。 但是由於風輪和發電機的整個重量作用在主軸承上, 一旦主軸承發生故障, 若不能及時處理, 將導致更為嚴重的風電機組整機故障。 本文基於Matlab 2016a平台對直驅式風電機組關鍵部件主軸承的故障預警進行上述方法試驗分析。
4.1 神經網絡型輸入參數選擇
SCADA系統主要監測主軸承運行時的溫度, 選取SCADA系統參數主軸承溫度2(前端) 作為因變量, 其他參數為自變量, 如圖4所示, 使用SPSS軟件進行逐步回歸分析,獲得主軸承溫度2正常模型輸入參數。

 

 

 圖4 模型輸入輸出參數

4.2 異常數據濾除
根據第2節所提到的方法對主軸承溫度2數據進行預處理。 如圖4所示選取輸入參數為自變量對主軸承溫度2分別進行異常數據濾除, 同時當主軸承溫度2處於異常時, 濾除對應所有輸入參數數據。 如圖5所示, 當主軸承溫度2處於異常狀態時, 濾除對應的輸入參數如風速、 輪廓轉速、 機艙溫度等數據。 將濾除后的數據用於神經網絡訓練和測試。
4.3 主軸承故障診斷
本文通過兩台直驅式風機主軸承故障診斷仿真試驗, 驗證上述故障預警方法的有效性, 並與其他傳統風機部件故障預警方法進行比較。神經網絡訓練階段原始SCADA數據具有較大的波動性, 為了降低波動性, 對數據進行10 min平均標准化處理。在24 h內可獲取144個測量值, 進行故障診斷的馬氏距離值根據經驗法應當選取12 h平均, 每24 h生成2個馬氏距離值。

 

 

 圖5 風電機組主軸承溫度2異常數據濾除

4.3.1 風機P01主軸承發生故障
風電場SCADA系統通過簡單設置主軸承溫度閾值的方法來對主軸承溫度進行狀態監測, 當主軸承溫度高於設定的閾值時SCADA就會向風場業主發出報警。使用本文方法結合SCADA數據對風機P01在2016年1月到2017年1月進行主軸承故障診斷, 結果如圖6所示。 由圖可得SCADA系統第一次發出警報的時間在5月份, 隨着時間的推移, SCADA系統報警的次數隨之增加, 最終業主進行維護, 主軸承故障消失, SCADA系統報警停止。

 

 

 圖6 P01主軸承故障監測結果

相比於SCADA報警方法, 使用本文方法在3月份時馬氏距離值已經超出了故障閾值從而得到第一次報警。 隨着時間的增加, SCADA系統在5月份開始報警, 相比於SCADA系統狀態監測的方法, 使用本文方法能夠提前2個月對風機主軸承進行故障報警。為了避免本文方法由於神經網絡輸入參數值異常, 導致馬氏距離值超出閾值產生故障報警。 如圖7所示, 對神經網絡輸入參數進行分析, 圖7中的最大值和最小值分別對應的是訓練數據中的最大值和最小值, 可以觀察到在圖7中, 輸入正常模型的參數在訓練神經網絡數據的范圍內, 輸入參數值並未產生異常。 因此可以判斷使用本文方法檢測到的異常為組件狀態異常。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 圖7 P01主軸承故障監測輸入數據

在同一時間內獲取風機P01神經網絡預測誤差值如圖8所示。 由圖7、 圖9可得當誤差閾值絕對值設定在1.5時,預測誤差並沒有超過該閾值, 並未能產生報警。 驗證了本文方法優於傳統利用預測誤差進行風機部件進行故障預警的方法。

 

 

 圖8 P01主軸承預測誤差

 

 

 圖9 P07主軸承故障監測結果

4.3.2 風機P07SCADA系統誤報警
使用本文方法對相同型號風機P07在2016年1月到2017年1月進行主軸承故障診斷, 結果如圖9所示。由圖9可知, 該風機SCADA系統在1月出現第一次報警,隨着時間的增加SCADA系統報警數量增加。 而根據本文方法, 馬氏距離的值全程均未曾超過閾值, 可以得到主軸承沒有發生故障的結論, 與事實相符。 可見我們提出的方法, 還能輔助風場業主分辨現有SCADA系統報警是否有效, 有利於風場業主制定有效的維護計划。
5 結語
對風電機組關鍵部件進行故障預警的關鍵是預警准確、 及時。 本文以神經網絡在風電機組部件故障預警的應用為背景, 着力解決故障預警時間和預警精度的矛盾, 提出了一種SCADA數據驅動的風電機組部件故障預警方法。
(1) 方法結合逐步回歸算法與指數滑差算法, 給出SCADA數據預處理方法, 准確找出對風電機組影響較大參數, 並濾除這些參數的噪聲。
(2) 方法通過神經網絡預測模型與馬氏距離算法, 將傳統故障預警方法改為統計方法, 並且這種統計方法計算了故障分布概率, 能夠適應運行工況復雜多變情況。
(3) 以兩台2 MW直驅式風機為對象, 對本文方法進行實例驗證。 試驗結果表明: 使用該方法能夠提前2個月識別主軸承故障信號, 同時該方法能發現SCADA系統誤報故障。 本方案能有效贏得備件和維護計划優化時間, 也能剔除SCADA系統誤報降低維護量, 有效降低風電場維護成本。下一步將根據風機內部零部件之間的相關性, 針對風機整機研究風電機組整機故障預警方法。

[參考文獻]
[1]GWEC.Global wind energy outlook 2016 available online[EB/OL].(2016-04-04) [2018-05-08].http://www.gwec.net.
[2]郭清, 夏虹, 韓文偉.基於小波熵與BP神經網絡的電機故障信號研究[J].儀表技術與傳感器, 2014(1): 96-99.
[3]范文, 孫冬梅, 熊鑫, 等.基於信息融合技術的磁軸承轉子故障診斷[J].儀表技術與傳感器, 2015(12): 136-140.
[4]張偉, 鄭恩讓.基於多層前向神經網絡的應力傳感器故障診斷[J].儀表技術與傳感器, 2001(4): 1-2.
[5]GARCIA M C, SANZ-BOBI M A, DEL PICO J.SIMAP: intelligent system for predictive maintenance: application to the health condition monitoring of a windturbine gearbox[J].Computers in Industry, 2006(6): 552-568.
[6]ZAHER A, MCARTHUR S D J, INFIELD D G, et al.Online wind turbine fault detection through automated SCADA data analysis[J]. Wind Energy, 2009(6): 574-593.
[7]KUSIAK A, VERMA A.Analyzing bearing faults in wind turbines: a data-mining approach[J].Renewable Energy, 2012(48): 110-116.
[8]SUN P, LI J, WANG C, et al.A generalized model for wind turbine anomaly identifcation based on SCADA data[J].Applied Energy,2016(168): 550-567.
[9]郭東傑, 王靈梅, 郭紅龍, 等.改進小波結合BP網絡的風力發電機故障診斷[J].電力系統及其自動化學報, 2012(2): 53-58.
[10]ZHANG Z Y, WANG K S.Wind turbine fault detection based on SCADA data analysis using ANN[J].Advances in Manu Facturing,2014(1): 70-78.
[11]高興良.基於逐步回歸分析的組合神經網絡股指預測研究[D].哈爾濱: 哈爾濱工業大學, 2015.
[12]BANGALORE P, LETZGUS S, KARLSSON D, et al.An artificial neural network‐ based condition monitoring method for wind turbines, with application to the monitoring of the gearbox[J].Wind Energy, 2017(8): 1421-1438.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM