原文:故障自愈:解決運維的主要矛盾才能AIOps

https: www.jianshu.com p a e f 藍鯨作者故障自愈產品經理 以產品設計理念剖析企業建設故障自動化處理方案的思路 人工處理告警,一直是運維心中的痛。大年初一拜年 結婚 和老婆孩子外出過周末等美好時光,作為運維的你,好像一直心系IT系統,保持與筆記本的安全距離。 為什么這么多年過去了,還是這么苦逼,不是說運維行業轉 AIOps了,我竟然還在手工處理告警,我該怎么辦 今天就和 ...

2020-07-15 14:50 0 848 推薦指數:

查看詳情

游戲行業如何實現自動化與故障自愈(轉)

注:本文主要講解游戲行業體系構建的幾點設想 游戲體系 公司創業到后期的上市經歷的四個階段 標准化-->自動化-->平台化-->服務化 第一階段:標准化   標准化的意思是把主機名、內網以及配置文件統一起來,如果不統一,后面的東西就無法繼續。沒有一個標准化的環境 ...

Thu Jul 28 03:44:00 CST 2016 0 2332
[業界方案] 智能AIOps-學習筆記

[業界方案] 智能-學習筆記 目錄 [業界方案] 智能-學習筆記 0x00 摘要 0x01 AIOps 背景 1.1 AIOps概述 1.2 AIOps場景 1.3 AIOps能力 ...

Tue Aug 25 04:18:00 CST 2020 1 1926
服務器常見的故障及其解決辦法

進入信息時代,各種行業對數據的安全和技術要求也越來越高,,同時也遇到了各種各樣的服務器故障問題,雖然能夠接到服務器廠商的支持,但是往往耗時耗工,特別是有些不能夠立即判斷和解決的問題,造成了企業不必要的損失,下面是針對一些常見的服務器故障現象和解決方法,以便更好的更快的進行故障處理和排查。 01 ...

Wed Nov 28 01:54:00 CST 2018 0 985
ceph集群故障--持續更新

一.PG處於異常狀態active+undersized+degraded 部署環境: 自己搭建的3節點集群,集群共5個OSD,部署Ceph的RadosGW的服務時,副本默認設置為3,集群存放數據量少 ...

Fri Jun 12 23:05:00 CST 2020 0 835
Linux故障排查思路

linux系統故障 網絡問題 linux系統無響應 linux系統無法啟動 linux系統故障處理思路 1.重視報錯信息,一般情況下此提示基本定位了問題的所在 2.查閱日志文件,系統日志和應用日志 3.分析、定位問題 4.動手解決 網絡問題處理思路 1.網絡硬件問題 ...

Sun Jul 15 21:59:00 CST 2018 0 1572
雲智慧正式開源管理平台(OMP),加速AIOps社區生態建設

近日,在雲智慧推出數據可視化編排平台FlyFish后,又重磅推出開源管理平台OMP(Operation Management Platform)。這款由雲智慧自主設計與研發,集輕量級、聚合型、智能為一體的綜合管理平台,具備 納管、部署、監控、巡檢、自愈、備份、恢復等功能 ...

Thu Dec 02 23:30:00 CST 2021 0 826
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM