原文:巧用机器学习定位云服务器故障

欢迎大家前往腾讯云 社区,获取更多腾讯海量技术实践干货哦 本文由roganhuang 发表于云 社区专栏 导语 随着腾讯云业务的扩大,母机数量越来越多。为减少人力并实现母机故障的自动化定位,本文尝试利用机器学习算法,通过对历史故障母机的日志数据学习,训练模型实现自动化分析定位母机故障原因。 背景 对于每一单母机故障我们都需要定位出背后真实的故障原因,以便对相应的部件进行更换以及统计各种部件故障率的 ...

2018-09-13 11:40 0 998 推荐指数:

查看详情

参数服务器——分布式机器学习的新杀

在大规模数据上跑机器学习任务是过去十多年内系统架构师面临的主要挑战之一,许多模型和抽象先后用于这一任务。从早期的MPI,到后来的Hadoop,乃至于目前使用较多的Spark,都曾被广泛应用于大规模机器学习处理任务。John Langford曾经在他的博客(机器学习领域最好的博客 ...

Thu Nov 22 18:13:00 CST 2018 0 1320
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM