原文:巧用機器學習定位雲服務器故障

歡迎大家前往騰訊雲 社區,獲取更多騰訊海量技術實踐干貨哦 本文由roganhuang 發表於雲 社區專欄 導語 隨着騰訊雲業務的擴大,母機數量越來越多。為減少人力並實現母機故障的自動化定位,本文嘗試利用機器學習算法,通過對歷史故障母機的日志數據學習,訓練模型實現自動化分析定位母機故障原因。 背景 對於每一單母機故障我們都需要定位出背后真實的故障原因,以便對相應的部件進行更換以及統計各種部件故障率的 ...

2018-09-13 11:40 0 998 推薦指數:

查看詳情

參數服務器——分布式機器學習的新殺

在大規模數據上跑機器學習任務是過去十多年內系統架構師面臨的主要挑戰之一,許多模型和抽象先后用於這一任務。從早期的MPI,到后來的Hadoop,乃至於目前使用較多的Spark,都曾被廣泛應用於大規模機器學習處理任務。John Langford曾經在他的博客(機器學習領域最好的博客 ...

Thu Nov 22 18:13:00 CST 2018 0 1320
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM