
作為企業智能運維門戶,業界早已關注織雲的智能運維體系。我們很榮幸地宣布織雲 Metis 智能運維體系正式發布。自此,織雲家族已發布:織雲企業版,織雲社區版(Lite),織雲 Metis 智能運維。企業版和社區版區別請戳。
Metis 是騰訊內部落地實踐的智能運維場景的集合,具備多種核心能力,如智能監控、智能分析、智能決策等。這些核心能力已在多元化、多樣化的運維場景中得到落地實踐。Metis 是從騰訊QQ、Qzone 等海量業務的一體化運維體系中孵化產生的,是織雲 AIOps 的最佳實踐。
織雲 Metis 應用場景
業務高質量保障
利用機器學習技術,進行異常檢測、故障定位、瓶頸分析等,可在無人工干預下,智能地保障業務高質量運行。例如時間序列異常檢測、DLP 生死指標監控、多維下鑽、關聯分析、ROOT 根源分析等場景都是Metis在質量保障方面的典型應用。
運維效率提升
利用自然語言處理、機器學習技術,深挖智能問答、智能變更、智能決策,顯著地提升運維人員的效率。例如智能客服機器人、輿情監控、智能負載均衡、數據庫調參、極限調度等場景都是 Metis 在提升運維效率上的典型應用。
成本優化管理
利用大數據智能分析技術,進行資源(設備、帶寬、存儲)管理,可迅速分析資源使用的明細,並通過橫向大數據對比挖掘可優化點。織雲團隊在 GOPS2018 全球運維大會--騰訊運維體系專場分享的《十億元背后的價值》中概括了Metis成本管理挖掘的眾多優化項。
織雲 Metis 智能化優勢
智能分析決策, 取代繁瑣重復的人工診斷
在日常運維過程中,運維人員積累了大量的人工經驗,同時大部分故障都是重復的、需人工定位的。重復性的分析會損耗人力,而且人工確認存在滯后性。織雲Metis可以把豐富的運維經驗固化下來,對常見問題實現分鍾級內自動診斷,可直接給出故障定位的結果信息。
- 對於已知的故障:織雲 Metis 能夠綜合故障數據和人工經驗自動提取故障特征,以故障特征庫的形式,自動匹配定位故障;
- 對於未知場景:織雲 Metis 可根據故障特征推算出可能的原因,並在人工確認后加入故障特征庫。
智能精准預測,取代人工粗略預估
為了保障產品的正常運營,容量預留過多或過少都會存在一些問題。而傳統的基於運維經驗容量預測手段不是十分有效,織雲 Metis 根據業務目標的需求,結合服務數據,整合業務運維人員的業務經驗,建立精准容量規划模型,從而精確預測各個業務的容量,讓資源使用率達到最優。
開放預約體驗--時間序列異常檢測
時間序列異常檢測是 Metis 組成部分之一,承載了海量業務的監控告警功能。其優越性體現在三點:
無閾值智能判決
運維人員無需設置告警閾值,檢測模型可對數據異常智能判決,直觀告訴大家檢測結果是正常還是異常;
通用檢測模型
智能檢測的模型由海量的業務樣本數據訓練而成,適合復用在時間序列類數據的檢測中;
可成長業務反饋
實踐過程中也會遇到較個性的業務場景,這里支持用戶標注反饋檢測結果,異常檢測系統可以自動化地根據用戶反饋信息進行進階學習、優化模型,加強對業務的理解,變得越來越懂業務。

立即預約
織雲 Metis--時間序列異常檢測誠邀您體驗智能運維場景。
問答相關閱讀
此文已由作者授權騰訊雲+社區發布,原文鏈接:https://cloud.tencent.com/developer/article/1114222?fromSource=waitui