原文:故障自愈:解决运维的主要矛盾才能AIOps

https: www.jianshu.com p a e f 蓝鲸作者故障自愈产品经理 以产品设计理念剖析企业建设故障自动化处理方案的思路 人工处理告警,一直是运维心中的痛。大年初一拜年 结婚 和老婆孩子外出过周末等美好时光,作为运维的你,好像一直心系IT系统,保持与笔记本的安全距离。 为什么这么多年过去了,还是这么苦逼,不是说运维行业转 AIOps了,我竟然还在手工处理告警,我该怎么办 今天就和 ...

2020-07-15 14:50 0 848 推荐指数:

查看详情

游戏行业如何实现自动化与故障自愈(转)

注:本文主要讲解游戏行业体系构建的几点设想 游戏体系 公司创业到后期的上市经历的四个阶段 标准化-->自动化-->平台化-->服务化 第一阶段:标准化   标准化的意思是把主机名、内网以及配置文件统一起来,如果不统一,后面的东西就无法继续。没有一个标准化的环境 ...

Thu Jul 28 03:44:00 CST 2016 0 2332
[业界方案] 智能AIOps-学习笔记

[业界方案] 智能-学习笔记 目录 [业界方案] 智能-学习笔记 0x00 摘要 0x01 AIOps 背景 1.1 AIOps概述 1.2 AIOps场景 1.3 AIOps能力 ...

Tue Aug 25 04:18:00 CST 2020 1 1926
服务器常见的故障及其解决办法

进入信息时代,各种行业对数据的安全和技术要求也越来越高,,同时也遇到了各种各样的服务器故障问题,虽然能够接到服务器厂商的支持,但是往往耗时耗工,特别是有些不能够立即判断和解决的问题,造成了企业不必要的损失,下面是针对一些常见的服务器故障现象和解决方法,以便更好的更快的进行故障处理和排查。 01 ...

Wed Nov 28 01:54:00 CST 2018 0 985
ceph集群故障--持续更新

一.PG处于异常状态active+undersized+degraded 部署环境: 自己搭建的3节点集群,集群共5个OSD,部署Ceph的RadosGW的服务时,副本默认设置为3,集群存放数据量少 ...

Fri Jun 12 23:05:00 CST 2020 0 835
Linux故障排查思路

linux系统故障 网络问题 linux系统无响应 linux系统无法启动 linux系统故障处理思路 1.重视报错信息,一般情况下此提示基本定位了问题的所在 2.查阅日志文件,系统日志和应用日志 3.分析、定位问题 4.动手解决 网络问题处理思路 1.网络硬件问题 ...

Sun Jul 15 21:59:00 CST 2018 0 1572
云智慧正式开源管理平台(OMP),加速AIOps社区生态建设

近日,在云智慧推出数据可视化编排平台FlyFish后,又重磅推出开源管理平台OMP(Operation Management Platform)。这款由云智慧自主设计与研发,集轻量级、聚合型、智能为一体的综合管理平台,具备 纳管、部署、监控、巡检、自愈、备份、恢复等功能 ...

Thu Dec 02 23:30:00 CST 2021 0 826
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM