IT 運維是目前企業IT 運營最關注的重點,也是IT 部門最難把握的管理方式。雖然市場上的各種IT 運維系統紅火紛呈,可對企業來說仍然是無所適從,他們迫切需要找到一個可以提升IT 部門的整體管理效率,改善服務品質,並且可靈活定制、滿足長期需求的運維管理系統。北京游龍科技,由資深留美學者張澤軍創辦於2003 年,是國內最早並且始終專注於IT 運維領域相關軟件研發和市場營銷的專業公司之一。對於IT 運維,他們有自己獨特的解決方案和很多成功案例。在采訪中,張總談到了IT 運維體系的最核心要素:統一的數據模型、非常強大的可定制性、開放和集成性,也表示了看好IT 運維市場——未來客戶需求會很大,整個市場也會非常穩健的成長。
IT 運維管理的要素
IT 運維管理目前是支撐企業IT 部門提供服務的最有效管理體系,一套好的運維系統必須具備以下幾個要素。
首先,運維體系要統一IT 運維管理應該是一個一體化的系統,而不應該是一個分散的系統。做為一名IT 運維管理人員,在每天上班的工作時間內,如果他面對的是幾套完全不同的系統,而不是一套相對統一的管理體系,那他就會在有限的時間內,不僅要處理各種各樣的問題,還要去熟悉掌握這些不同的系統,工作效率可想而知。所謂統一的管理體系,就是共用同一個數據庫如CMDB這樣一個模式。IT 部門建好這樣一個體系,其他系統也都基於CMDB 之上來提供各種各樣的功能,不管是對服務器管理和網絡設備管理,還是對桌面管理,以及對IT 服務管理、人員管理等等,這些都是基於統一的數據庫CMDB 的,能做到這一點對IT 運維管理是非常關鍵、非常重要的。如果要讓IT運維很高效,並且能夠長期為企業帶來價值,就要努力實現運維的統一和穩定,不能經常更換不同的系統, 所以能夠建立一個扎實的CMDB 體系非常關鍵的。當然這是企業IT 運維到達一定的規模以后才可能建立一套完整的CMDB,是一個很有價值的投資。
其次,要靈活、可定制化隨着企業信息化程度的提高,IT 運維體系越來越多地牽涉到人的因素,而不僅僅只是面向被管理的對象,不是只面對服務器、網絡設備、終端設備以及被管理的各種應用。IT運維不僅僅只牽涉到被管理的這些IT 基礎架構,更多的是把人與人的協同、合作以及人與人之間的諸多流程之間要整合起來。這是更為復雜的運維模式,對技術架構和IT 運維管理要求更高,也讓IT 運維走上了一個新高度。所以IT 運維、IT服務管理以及ITIL,他們最核心的部分應該是能夠把人與人之間的合作、協同這種流程做得更全面、更完善、更加透明化。IT 運維管理系統一定要特別靈活,它不僅僅在建設初期可以滿足需求,還能夠隨着組織結構和人員的變化以及公司內部運維規章、規則的變化,系統也能夠做出及時適應和調整。在以前傳統的運維方式中,管理一台服務器或一台網絡設備是相對固定的,所以建設初期及以后維護階段就可以長期使用,在相當長的時間內不會發生變化。而現在加入了流程,這就意味着被管理的對象是一個非常動態、變化性非常強的目標,所以對IT 運維系統的架構和技術結構體系上提出了一個非常大的挑戰,要求它們能夠應對和滿足不斷變化的環境。例如人事制度,可能會經常變化,人員會經常增加或減少,同時流程也會經常變化,隨着人以及組織體系的變化,IT 運維的體系也要能夠滿足這種變化和其他復雜的情況。所以IT 運維系統對技術架構提出了非常高的要求,這就是靈活性和定制化,也就是不需要通過開發編程,通過自由配置就能夠定制出各種各樣的流程和CMDB 這樣的業務之間的對應關系,能夠滿足不斷快速變化的環境要求。特別要強調的是,不是通過開發人員去修改程序源代碼,而是通過用戶自由
配置和簡單操作就可實現這種靈活的定制。
能夠為用戶提供一種非常方便、非常完善、非常靈活、可配置、可定制化,可以滿足用戶各個發展時期的需求,能做到這些的IT 運維系統才是未來最有生命力的。對於這樣一套系統,它如果能夠滿足各種行業的需求,則需要實現非常強的可定制性; 同時,對於同一個客戶,要滿足其日益變化的需求,也需要具備很強的可定制性。所以只需通過簡單、靈活的配置,就能夠實現非常強大的可定制化,這樣的IT 運維系統才是用戶真正需要的,才真正具備市場競爭力。
第三,具備可集成性好的運維體系一定要有很好的可集成性,可以把各種各樣的系統能夠集成到一起來,可以通過CMDB 的形式、面向服務的架構把各種各樣的服務集成起來。它能夠把服務器管理、網絡設備管理、桌面管理等管理體系都能夠納入到其中,讓它們之間的信息無縫交換。開放性和可集成性也應該做得非常好,不然就會給用戶的使用帶來很大障礙,推廣方面也會有很大的限制。
IT 運營管理
這里所說的IT 運營管理,包括監測、IT 運維管理、IT 服務管理,可以套用一個名詞——ITOSS,IT 部門越來越需要一套這樣的IT 運營支撐系統。
新需求
IT 服務管理只是IT 運營支撐系統之中的一部分,事實上有相當一部分IT 部門的日常管理內容沒有包括在ITIL 定義的流程里面。ITIL 定義的主要流程包括變更管理、配置管理,規范管理,庫存管理,資產管理等很標准的流程, 而IT 部門還有很多管理流程都沒有包括在ITIL 或IT 服務管理所定義的流程里面。比如說面向用戶管理方面的,運維要做值班管理,這是非常有中國特色的,但在ITIL 的標准流程里面是沒有定義的。還有其他如出入機房管理等, 這都是IT 部門每天所必須要走的流程,這些流程如果不納入到管理平台里面,就會出現管理上的缺失。
如果把這些流程全部整合在統一的管理平台下,就不僅僅是IT 服務管理這個范疇了。有一些如人事流程,如果也同樣整合在這個系統平台里面,則對人員資源的利用也會更有成效。同樣,IT 運維管理也需要覆蓋這層面。所以說IT 運營支撐系統,應該是對IT 部門的所有人員、所有流程、所有被管理對象的一個集成化的整合。這不僅是IT 管理系統平台的研發目標,也是用戶給IT 運維廠商提出的一個新需求。
新挑戰
這樣一套完整的運營支撐系統對用戶來說是很有價值的,它會成為IT 部門真正依賴的系統,也很容易實施和推廣。從管理角度看,就象用好ERP 能夠提升企業運營效率一樣,這套系統也能夠極大地提升整個IT 部門的運營效率。所以很多用戶並非是不想實施IT 運維,而是很難找到一個合適的廠商能夠提供這樣一個完整的平台。雖然國外的一些知名管理系統也很完善,但對國內用戶都不太適用:一方面,通常這種大型的系統都是英文化,難以使用; 另一方面,這些系統所定義的流程並不完全適合國內的流程,一旦缺少幾個關鍵的流程,這個系統就無法運轉。
新模式
IT 運營支撐系統與傳統的IT 運維系統相比,它涵蓋了IT部門的所有人員、所有流程,所有被管理的對象,而傳統的IT 服務管理系統則做不到。因此,它管理更全面,對IT 部門的支撐更好,更有利於實施並提供優質服務。
IT 運營支撐系統在實施過程中,都會與用戶有更加深入的溝通,最終目標是要讓用戶經過培訓后能夠自行使用系統中的工具來進行靈活配置。因為用戶對自己的業務是最清晰的,對自己的需求也最清楚,所以在他們學會使用系統之后,就能很方便地通過簡單操作來滿足自己的需求。不再像以往一樣先把需求提交給開發人員,開發人員再把編程結果反饋給用戶,這個過程耗費的成本很高而效率卻很低,並且當中的很多需求容易缺失。而現在的系統對用戶而言
就是一個所見即所得的環境,他們自己就能輕松配置出自己想要的環境。這相當於把中間這個需求的溝通過程簡化,讓用戶自己直接滿足他的需求,因此這是一個完全基於可定制化的體系。
BSM的產生不是偶然,是企業業務需求與IT支持需求發展到一定階段的必然結果。
什么是BSM?
BSM(Business Service Management),即業務服務管理,是IT與業務管理手段的一種整合與互補。它以ITIL為理論基礎,實現IT管理與業務服務的融合。
BSM能夠從不同監控系統(包括第三方)整合出需要的IT營運信息,給企業帶來IT服務方面的優勢,從而體現在企業競爭優勢上:
從業務的視角來重新定位企業的IT系統,確保IT服務可管理、可測量。把IT管理與業務管理的表現相關聯,使雙方利益一致,提高客戶滿意度;
以ITIL的流程框架為中心,通過與Business Process Management(BPM)整合,實現ITIL服務提交和服務支持的流程,以可視化方式為管理者提供一覽式的IT服務狀況,簡化對IT系統的理解。讓企業管理者花更多的時間在決策上,而不是用在了解復雜、繁瑣的IT細節上;
以儀表盤展現的方式,從服務定義、服務水平管理、服務監控、服務診斷的角度,讓管理者一目了然;
端到端的BSM,既滿足客戶要求的服務水平,確保最佳的業務系統表現,又輔助整個企業的業務運營與IT決策。
BSM的三大核心要素
人員
企業需要清晰定義IT支持人員的角色職責,明確人員的技能等級,進行IT部門內部的梯隊建設。IT支持人員的素質與質量最終決定了整個IT服務管理實施的質量。
流程
業務流程是一個邏輯群組的活動,有規律地為用戶提供可重復性的業務功能;
·有明確的流程目標;
·能達到預期的效果;
·流轉結果可度量;
ITIL是成熟的流程模型,企業能通過流程來實踐這些最佳實現方式。
技術
有效的技術手段,可以保證企業做到:
· 監控IT系統的可用性、性能;
· 監控IT部門實現SLA要求的質量;
· 配置管理,並跟蹤IT系統配置的變化;
· 診斷,快速定位問題原因並對症下葯;
· 預測與預防,預測資源的使用情況,並能采取相關的預防措施;
· 提供儀表盤,以可視化的方式展現企業IT服務模型、IT服務報表與指標、網絡拓撲等,讓領導更方便地了解IT系統現狀,並做出決策;
要這三方的元素緊密配合,並不容易,只有實施端到端的BSM,才能從總體上提高IT服務管理的質量並達到最佳實踐效果。
企業面臨的挑戰
1、IT 部門如果缺乏快速有效的協調機制和必要的輔助管理工具,避免“救火隊式”的混亂局面;
2、應用系統的管理需要專業技術人員管理,對專業技術人員的能力要求不斷提高,所以IT部門需要專業的應用監控軟件,並且可視化監控所有主流應用,在第一時間發現應用系統的問題並解決;
3、互聯網公司十分重視終端用戶體驗,但是苦於缺少合適的監控機制,實時動態了解終端用戶體驗;
4、IT部門只重視技術,與業務部門之間不能形成良好的互動與溝通;
5、IT部門解決問題的經驗不能積累到企業的知識庫,並且會隨着人員的流失而散落。
什么是Mocha BSM 4+1
Mocha BSM 4+1是由以下組成:
1 – 基礎架構管理
企業的IT基礎架構系統包括了網絡設備,網絡拓撲,主機,主機可視化以及IT資產,Mocha BSM的基礎架構管理對這些不同IT系統的關鍵成分提供了監控與管理。
2 – 應用管理
應用管理對以下幾個重要的應用分類進行了監控與管理:
·J2EE應用服務器
·Lotus Domino
·Portal
·數據庫與LDAP
·Web Server
·URL & Ports
3 – 響應時間管理
通過Mocha BSM對以下進行監控與管理:
錄制與模擬用戶使用網站的關鍵操作與步驟,並且可以定時回放,並且監控用戶在這些頁面的響應時間與HTTP狀態。
對一個復雜的業務系統,比如網站包括了Web Server,應用服務器和數據庫,能夠監控各個子系統的響應時間,如果網站出現慢的現象,就能定位是那一個子系統出現問題。
4 – 業務服務管理
以服務的視角來管理企業的IT系統,提供了以下功能:
可視化服務定義 - 服務是由網絡,主機與應用組成的,能夠通過可視化方式把這些不同的系統組成一個服務。
服務儀表盤 - 讓業務部門和IT部門領導了解提供給他們的服務狀況而不是技術細節,通過儀表盤展現服務狀況以及KPI。
+1 – IT流程管理
通過IT流程管理,以ITIL的流程框架,締造一個自動化和規范化的IT運維系統
Mocha BSM4+1為客戶帶來了什么?
基礎架構管理,提高高可用性,讓業務系統可持續運行
企業的各種IT設備,種類繁多,包括主機、路由器、交換機以及成百上千的員工終端,共同構成了企業的神經網絡,為企業的正常運營,提供強大的基礎設施支撐。
Mocha BSM 4+1的基礎架構管理包括:
網絡設備和網絡拓撲管理
通過SNMP的主動查詢方式,全面監控網絡設備運行狀況,自動發現企業的網絡拓撲。
主機監控,包括對Unix,Linux,Windows主機
以Agent和Agentless兩種監控方式,對不同操作系統下面的主機進行監控。
主機可視化管理
以實時動態的展現界面,達到直觀的監控主機系統,並可以直接對關鍵進程進行操控,降低技術門檻。
IT資產管理
通過自動發現IT資產,實現了企業IT資產的全生命周期的管理。
第三方監控軟件的數據和事件整合
可以無縫整合IBM,HP,BMC等第三方監控軟件。
應用管理,為企業核心應用提供保障
我們支持對所有主流應用監控,並提供可視化地展現企業應用系統的部署架構,幫助IT管理者能夠從復雜的應用系統管理中釋放出來,一目了然地了解應用的狀態。一旦應用組件出現問題,Mocha BSM能夠幫助管理者快速定位出應用系統的根本原因,並快速予以恢復,盡最大可能的幫助企業挽回損失。
Mocha BSM支持的應用監控包括:
對各種不同的應用服務提供監控與管理,主要包括:
·J2EE應用服務器
·Lotus Domino, WebSphere, Weblogic, SunOne等
·對Web服務的監控,主要包括:Apache,IIS
·對數據庫和LDAP服務的監控:主要包括:SQL Server, DB2,Oracle
·對郵件服務器,主要包括:Lotus Mail,MS Exchange等
響應時間管理,掌握用戶體驗,提高用戶滿意度
針對復雜和跨不同應用平台的業務系統(比如一個網站包括了Web Server,應用服務器,數據庫等系統),我們提供各應用環節或子系統的響應時間監控,幫助IT管理員獲取在各個應用階段的事務反應時間,從而找出整個應用服務的瓶頸;
現在企業擁有很多的Web應用,但是IT部門往往不知道用戶體驗,而只是通過監控軟件提供可用性和性能指標,但是最關鍵的用戶體驗被忽略。企業應用最重要的用戶-企業領導往往因為IT系統響應速度慢,浪費了寶貴時間。現在,通過Mocha RTM Studio,我們可以達到以下:
·錄制這些用戶的體驗
·定時模擬這些用戶體驗,確保響應時間實在可接受范圍內,如果不是,第一時間通知IT管理員
通過響應時間管理,IT部門不只是能找到業務系統的瓶頸,並且能通過掌握用戶體驗,大大提高了用戶(特別是領導)的滿意度,而網站企業能避免沒必要客戶的流失,因為競爭只是“一點擊”之遠。
業務服務管理,讓IT服務可視化和量化
Mocha BSM幫助IT管理員從服務的視角來管理IT系統,而不是底層的技術組件。這讓IT管理員從業務部門的視角出發,理解業務部門是以提供給他們的服務質量為至關重要,而不是具體的技術細節。當故障發生時,IT管理員也能快速定位受影響的用戶,並且第一時間通知他,並讓他理解故障對服務的影響。
現在,IT部門領導能通過業務服務的視角,建立全局意識,通過KPI報表和圖表,進行長期規划和決策,確保IT基礎架構即使經歷較大的風險,也能快速恢復,維持IT部門的可持續性管理。
SLM(服務水平管理)將IT服務進行量化,業務部門通過SLA規定的各項服務承諾進行對照,從而了解IT服務的質量以及SLA的滿足情況,IT部門的工作范疇也有了量化的目標,並向着SLA所制定的方向邁進。
IT流程管理,以ITIL為核心,邁向規范化,自動化和流程化的IT運維平台。
以ITIL推動規范化和流程化
Mocha BSM 4+1是以ITIL流程框架為核心,遵循並實現了服務支持(Service Support)與服務提供(Service Delivery)。流程是ITIL的核心,通過Mocha BSM 4+1,客戶可以通過靈活配置IT流程和表單,實現了IT運維所需要的流程管理。
自動化運維平台
Mocha BSM 把事件和IT流程關聯起來,形成了IT自動化必備的工單。一旦被監控系統發生性能超標或者宕機,Mocha BSM會觸發相關事件以及事先定義好的流程,可以自動恢復系統。
IT管理員也能用這個自動化運維平台達到:
·自動系統健康檢查
·自動配置變更提醒
·自動生成運維周報
......
等多種自動化功能,大大提高了IT管理員的工作效率。
Mocha BSM 4+1的功能亮點
全程可視化的IT服務管理
通過可視化的管理和監控,降低了復雜系統管理的技術門檻,讓系統管理員花更多時間在維護工作上,而不是花很多時間在學習怎么操作比較難的技術平台。
展現效果更加直觀,易於理解。枯燥乏味的數據信息,通過直觀的圖形化展示,使系統管理員對於IT資源的營運狀態一目了然。
可視化的展現平台,也給企業CIO和技術工程師之間搭建了溝通的平台,而不是再共同面對那些密密麻麻的數據信息。使技術執行與管理決策之間達成默契。
全程自動化的IT服務管理
自動化的資產發現,讓設備的管理更為清晰透明。讓遍布在企業各辦公區各個角落的所有設備都一目了然。
快速的發現企業的網絡設備,並根據發現設備之間的關系自動生成全局的網絡拓撲結構圖。當發生變化時,自動發現引擎能夠及時調整網絡的拓撲結構圖,保證了與實際網絡狀態的一致。
對各種指標超標和故障,自動觸發報警和故障處理流程。
統一的監控管理界面
上至龐大的電信運營商,下到中小企業都非常願意擁有操作界面統一,一個WEB站點完成所有管理操作的Portal。而Mocha BSM正給用戶提供了大量的“一覽式”界面,很方便讓用戶對企業 IT 服務的全局擁有更深層的認識。
為不同角色,提供所需的IT運維內容
Mocha BSM提供靈活的可定義策略,通過Portlet技術給用戶展現企業各資源狀態,按照管理所需,隨意定義監控視圖;
提供Top 10排名榜,讓用戶一目了然了解最耗CPU,內存資源的服務等信息;
采用B/S架構,從監控—管理—報表分析,全部在唯一的管理Portal完成,省卻了大量的系統切換工作,提高了管理人員的工作效率。
全生命周期的IT資產管理
Mocha ITAM可以給IT管理人員一個清楚的全局IT資產狀況,比如還有多少庫存,多少機器在維修等信息。這樣極大的減少了企業在IT資產投資的浪費,Mocha ITAM也是市場上少數提供追蹤IT資產生命周期功能的產品。
通過系統,客戶現在能通過業務流程來管理各個階段(采購、入庫、維修、借調、借用、折舊、報廢),確保給予IT資產提供全方位的管理以及優化。
最終,管理者更能在各個階段做出准確的采購決策以及確保IT資產的規范化管理。
端到端響應時間管理
端到端反應時間監控,能夠對企業越來越復雜的、跨應用平台的IT系統進行端到端監控,分段了解每一個相關系統的事務情況以及反應時間,一旦出現故障,系統管理員能夠快速而准確地判斷故障所在,定位服務故障的根本原因,並且快速排除問題。
企業的Portal門戶
Mocha RTM能夠提前錄入登錄動態web頁面的各種動作,定時自動執行URL頁面登錄操作,並分析關鍵值返回結果,驗證web的服務狀態。
分布式可擴展的技術架構
Mocha BSM采用CMS(Central Monitoring Server 中央監控服務器)、DCH(Data Collection Hub 數據采集集線器)、DMS(Distributed Monitoring Server 分布式監控服務器)三層分布式架構。
DCH支持縱向與橫向擴展,即可配置多個DCH在同一個CMS下(橫向擴展),每個DCH下還可再配置DCH(縱向擴展)。
DMS支持橫向擴展,可配置多個DMS在同一個DCH下。每個DMS下最多可監控1000個資源,消除了被監控資源的數量上的限制。
多種的預警與報警方式
提供了包括桌面預警小幫手(Mocha Alert)、郵件、短信、語音電話等多種報警與預警。
可追蹤、可監控、自定義的服務流程
通過拖拽式的可視化流程定義方式,用戶可以自定義觸發不同的服務流程;
處理過程從觸發到最終辦理完成,得到了完整的記錄;這些記錄,可以作為企業的寶貴知識資產,供IT維護人員查詢、借鑒。
自定義符合要求的報表與報告
上級領導的定期檢查與IT服務成果的階段性匯報,都需要完整多樣的報告與報表的支持;
以拖拽的所見即所得方式,自定義符合需求的報告格式;iisreset /stop
可以按照,周報、月報、年報的形式導出,緊急情況下的各種及時報告,可以隨時定義,隨時導出。大大節約了時間。
與第三方監控系統的整合
支持與主流第三方監控軟件廠商的數據和事件整合,保護了企業現有投資,避免了Agent License的浪費。