目標:分析實際生產中的網絡拓撲及告警數據,設計並實現一種故障根因定位算法,准確的定位出故障根因節點。
產品功能:
1.分析全部告警,過濾重復、無效告警。
2.定位疑似根因節點,縮短定位時間。
3.可視化展現根因信息及根因關聯的局部拓撲圖。
對於賽題的分析,要確定真正的需求——快速的找到根因節點。從而提升網絡運維的效率,降低損失。
快速尋找的方法就是——告警分析預處理:形成錯誤類型體系,對錯誤信息預處理,屏蔽無用信息,聚類生成錯誤種類。
每一個告警都攜帶有一個時間戳,這是一個十分關鍵的信息。
時間關聯就是從時間序列的角度來聯系告警序列,以便進行故障定位。
空間信息主要指的是網絡的拓撲結構信息,空間關聯過程就是從網絡拓撲結構的角度來聯系告警序列,以便進行故障定位。
模塊:
一:拓撲發現模塊
拓撲發現本不屬於網絡故障管理功能,它是配置管理功能之一。
由於本系統的故障定位算法主要基於對網絡拓撲結構的分析來對告警進行關聯處理,因此該模塊是必須具備的。
拓撲發現模塊主要完成對網元及其連接關系的發現,並將這些信息存入數據庫的設備表devicetable和連接表linktable兩張表中。
二:智能故障定位模塊
1)Trap收集子模塊:
2)Trap 解析入庫及過濾子模塊:
3)Trap瀏覽子模塊:
4)創建關聯關系子模塊:
5)case信息子模塊:
6)故障定位核心算法子模塊:
原理圖:
在實際網絡運維中,根據故障特征自動匹配診斷規則,並進行診斷分析,自動得出故障點及相關處理建議。