織雲 Metis:看騰訊怎么做智能運維


歡迎大家前往騰訊雲+社區,獲取更多騰訊海量技術實踐干貨哦~

作為企業智能運維門戶,業界早已關注織雲的智能運維體系。我們很榮幸地宣布織雲 Metis 智能運維體系正式發布。自此,織雲家族已發布:織雲企業版,織雲社區版(Lite),織雲 Metis 智能運維。企業版和社區版區別請戳

Metis 是騰訊內部落地實踐的智能運維場景的集合,具備多種核心能力,如智能監控、智能分析、智能決策等。這些核心能力已在多元化、多樣化的運維場景中得到落地實踐。Metis 是從騰訊QQ、Qzone 等海量業務的一體化運維體系中孵化產生的,是織雲 AIOps 的最佳實踐。

織雲 Metis 應用場景

業務高質量保障

利用機器學習技術,進行異常檢測、故障定位、瓶頸分析等,可在無人工干預下,智能地保障業務高質量運行。例如時間序列異常檢測、DLP 生死指標監控、多維下鑽、關聯分析、ROOT 根源分析等場景都是Metis在質量保障方面的典型應用。

運維效率提升

利用自然語言處理、機器學習技術,深挖智能問答、智能變更、智能決策,顯著地提升運維人員的效率。例如智能客服機器人、輿情監控、智能負載均衡、數據庫調參、極限調度等場景都是 Metis 在提升運維效率上的典型應用。

成本優化管理

利用大數據智能分析技術,進行資源(設備、帶寬、存儲)管理,可迅速分析資源使用的明細,並通過橫向大數據對比挖掘可優化點。織雲團隊在 GOPS2018 全球運維大會--騰訊運維體系專場分享的《十億元背后的價值》中概括了Metis成本管理挖掘的眾多優化項。

織雲 Metis 智能化優勢

智能分析決策, 取代繁瑣重復的人工診斷

在日常運維過程中,運維人員積累了大量的人工經驗,同時大部分故障都是重復的、需人工定位的。重復性的分析會損耗人力,而且人工確認存在滯后性。織雲Metis可以把豐富的運維經驗固化下來,對常見問題實現分鍾級內自動診斷,可直接給出故障定位的結果信息。

  • 對於已知的故障:織雲 Metis 能夠綜合故障數據和人工經驗自動提取故障特征,以故障特征庫的形式,自動匹配定位故障;
  • 對於未知場景:織雲 Metis 可根據故障特征推算出可能的原因,並在人工確認后加入故障特征庫。

智能精准預測,取代人工粗略預估

為了保障產品的正常運營,容量預留過多或過少都會存在一些問題。而傳統的基於運維經驗容量預測手段不是十分有效,織雲 Metis 根據業務目標的需求,結合服務數據,整合業務運維人員的業務經驗,建立精准容量規划模型,從而精確預測各個業務的容量,讓資源使用率達到最優。

開放預約體驗--時間序列異常檢測

時間序列異常檢測是 Metis 組成部分之一,承載了海量業務的監控告警功能。其優越性體現在三點:

無閾值智能判決

運維人員無需設置告警閾值,檢測模型可對數據異常智能判決,直觀告訴大家檢測結果是正常還是異常;

通用檢測模型

智能檢測的模型由海量的業務樣本數據訓練而成,適合復用在時間序列類數據的檢測中;

可成長業務反饋

實踐過程中也會遇到較個性的業務場景,這里支持用戶標注反饋檢測結果,異常檢測系統可以自動化地根據用戶反饋信息進行進階學習、優化模型,加強對業務的理解,變得越來越懂業務。

 

立即預約

織雲 Metis--時間序列異常檢測誠邀您體驗智能運維場景。

猛戳此鏈接預約 https://wj.qq.com/s/2024612/b6d1
 

 

此文已由作者授權騰訊雲+社區發布,原文鏈接:https://cloud.tencent.com/developer/article/1114222?fromSource=waitui


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM