【網絡——Linux】——IPMI詳細介紹【轉】


一、IPMI含義
  智能平台管理接口(IPMI:Intelligent Platform Management Interface)是一項應用於服務器管理系統設計的標准,由Intel、HP、Dell和NEC公司於1998年共同提出,當前最新版本為2.0。利用此接口標准設計有助於在不同類服務器系統硬件上實施系統管理,使不同平台的集中管理成為可能。

二、IPMI發展歷史
  IPMI 2.0是該系列技術規范的第三代產品。提供了一種標准化方式以便監控計算設備運行時各機械組件的狀況。除了風扇和電壓,IPMI還監視溫度和電源狀態,不僅如此,IPMI甚至能夠遠程重啟機器。
在IPMI推出之前,每個計算機廠商都自行開發了監控其平台中各組件性能的方案,這些方案傾向於將一個企業或電信公司與某一具體廠商緊密結合,通常管理效率低下。隨着數據中心計算設備和電信網絡的激增,這種長期形成的缺點已經變得日益嚴重。
  英特爾並不受硬件廠商的歡迎,所以如果能夠開發和推廣一種合理化方案,對英特爾來說是很有意義的。最初的支持者有惠普、戴爾和NEC。位於德州Sugar Land的服務器廠商Augmentix副總裁兼CTO戴夫·麥金利(Dave McKinley)說:"倡導者們計划開發出一種標准方式,可以通過不同的平台獲取信息。"
根據Aberdeen集團的一份報告,列出了這項基礎技術所帶來的諸多好處。其中一部分優點確實可以通過任一款功能強大的診斷程序包的測試,不過其它的好處就僅能通過多廠商標准得以實現,這其中包括通過合理化運行支持以及對數個硬軟件產品和平台進行標准化就可以降低擁有成本的功能。
這些都不錯,但是IPMI究竟是如何工作的?麥金利解釋說,主板上有一種被稱為基板管理控制器(BMC Baseboard Management Controller)的小型分離式處理器,BMC與主處理器和板上各元件相連接,監控並且在一定程度上管理各物理組件的狀態。因為是分離處理器,所以不論主處理器是否可用,系統都會運行。2001年發布的IPMI 1.0中,這種聯系是通過串口進行。后來相繼推出的兩個版本1.5和2.0,則加強其監控功能,實現了遠程控制。
  從很多方面來說IPMI的遠程監控功能都是關鍵。AVOCENT OSA部門銷售部經理史蒂夫·洛克夫(Steve Rokov)指出:"從IT前景來看主要的進步在於是否能夠通過LAN訪問服務器。"IPMI 1.5實現了這一點並提供重啟、復位和電源控制等遠程管理功能。
  顯然,安全問題是任何遠程控制網絡組件方案的重要因素。最新推出的IPMI 2.0關注的正是安全問題,它通過一種被稱為安全散列算法-1(SHA-1)的技術支持高級認證。高級編碼功能則由高級編碼標准(AES)提供。
  IPMI 2.0向下兼容IPMI 1.5,也支持虛擬LAN(VLAN)。VLAN通過給予管理員更多的控制權加強了安全性能。洛克夫表示:“現在你有了在物理LAN上構建一個管理LAN的概念,你就可以保護LAN上的數據不受其它通信的影響,VLAN會發出警告說只有某些控制台能夠看見和執行命令。”
  IPMI是一個規范系列,IT經理和員工應該熟悉IPMI。上升到高一些的角度來看,IPMI是管理現代數據中心和現場操作復雜性的又一種工具,並且能夠通過幾種方式實現:一是完備與之共享信息的運行支持系統;二是提供類似於鍵盤,鼠標和顯示器(KVM)技術所支持的一些遠程操作功能;三是IPMI可以有效幫助IT經理管理網格、群集、虛擬設備,以及其它新興的PC和服務器組合戰略。
三、設計實例凸顯IPMI優勢
  先讓我們來看一個IPMI設計的應用實例:一家公司購置了若干台服務器,計划安裝不同應用系統分別應用於數據庫、網絡、打印服務器等。傳統實現方式是分別由在某一應用系統有專長的不同系統管理員逐一完成安裝、配置及后期維護管理,但利用IPMI管理即可實現統一的管理。以下從安裝配置、監控管理、故障診斷三方面來領略一下IPMI帶來的優勢。
傳統的OS安裝首先要對服務器的新硬件做驅動,需要相應OS安裝手冊或專業系統管理員,管理員需要在服務器旁等待整個安裝過程完成;而利用IPMI,只需要插入OS自安裝光盤即可自動引導安裝,在3~4個關鍵時間點加載新硬件驅動,插入OS安裝盤,即可完成OS自動安裝,同時還可以利用系統備份工具對重要數據進行備份,方便了故障出現時的系統恢復,極大地節省了時間和人力。
  傳統的系統監控管理方法一般是系統管理員定期到機房巡視或者采用PCAnywhere類軟件監控,上述方法存在時效性差、服務器宕機后無法追查原因、占用系統資源較多的缺點;IPMI則可實現對服務器系統的實時監控,能夠監控網絡狀態(發現整個網絡節點、判斷網絡節點的在線狀態、判斷網絡的通斷、監測網絡結點的OS、IP、主機名、網絡流量大小等信息);監控服務器系統靜態信息(CPU、內存、硬盤、光驅、網卡、顯卡、操作系統、RAID卡、PCI附加卡等信息)和動態信息(主板、CPU、SCSI 模組、風扇板等設備的溫度、電壓、風扇轉速信息以及CPU利用率、內存利用率、硬盤I/O訪問流量等系統資源信息),還可以實現對RAID陣列的管理;當上述被監控量發生超越門限等異常事件時,監控軟件會通過多種形式(消息框、郵件、告警音、短信)告警,同時將告警事件記錄入日志,方便管理員根據告警日志分析診斷。對大量分散服務器集中管理的環境應用優勢尤為明顯。
  傳統的故障診斷一般是管理員到故障現場根據經驗診斷故障原因,而利用IPMI,管理員可以通過網絡或者串口訪問遠端服務器,通過獲取事件日志和傳感器數據記錄來分析、確認故障原因,並通過遠程操作來實現服務器恢復。
四、表象之下的技術
上面我們了解了IPMI帶來的優勢,那么它是通過何種方式實現這些功能的呢?我們來了解一下表象之下的內容:
  在IPMI管理平台中,BMC(Baseboard Management Controller,因為多集成於主板而得名)是核心控制器,系統管理軟件對各個被管理器件的管理,都是通過與BMC通信來實現的。
在IPMB(Intelligent Platform Management Bus)總線上連接着各個管理控制器,分別執行不同功能。IPMB總線上還連接着一些I2C器件,用來作為傳感器的接口,讓系統管理軟件能夠通過IPMB來讀取傳感器的數據。同時,這些傳感器的具體配置信息,如告警門限、事件觸發是否允許等配置都保存在一組名為SDR(Sensor Data Record)的數據里面。而傳感器產生的告警事件則保存在一組叫做SEL(Sensor Event Log)的數據里面。在IPMB總線上,連接着一個ICMB(Intelligent Chassis Management Bus)橋,通過ICMB可以和遠程的另一個管理平台通信。此外,在IPMB總線上,還可以外接其他的用戶板,用來擴展IPMI管理平台的功能。
  管理系統的核心——BMC芯片就相當於計算機中的中央處理器,通過BMC芯片上一對SMBus接口連接網絡,用戶可通過網絡訪問實現對遠程服務器接管的帶外管理(Out-of-band)功能,例如遠程接管服務器(Pre-OS),在客戶端實現對遠程服務器的完全接管;通過RS-232接口連接Modem,在遠程服務器宕機情況下,用戶可以通過撥號訪問獲取SDR、SEL數據,分析診斷故障原因;BMC通過IPMB接口訪問模組風扇背板、電源背板等上的SMC,實現對各種背板的溫度電壓風扇轉速等關鍵參數管理;BMC通過系統接口(多用SMIC:Server Management Interface Chip),實現IPMI消息傳輸機制,控制LCD顯示和實現上層軟件與底層F/W通信,實現告警、數據采集。SDR、SEL、FRU(Field Replacement Unit)物理實體可以是做在芯片內的存儲體,也可以是外掛的E2PROM。所有IPMI功能通過向BMC發送命令來完成,命令使用IPMI規范中規定的指令,BMC接收並在系統事件日志中記錄事件消息,維護描述系統中傳感器情況的傳感器數據記錄。
五、IPMI 2.0的新特點
IPMI 2.0是2006年2月最新通過的版本,與其前一版本1.5相比,做了多項增強。
SOL(Serial Over Lan)遠程管理
  IPMI 2.0中定義了SOL指令,利用它們可改變IPMI會話過程中本地串口傳送數據方向,從而實現對遠程服務器的Pre-os訪問,提供了通過LAN遠程查看、啟動、診斷和維修故障的標准方式。
  其實現原理為:用戶在控制端通過LAN連接遠端服務器(控制端需要根據SOL定義指令設計軟件來實現監控,遠端服務器上BMC硬件連線及底層代碼需要根據SOL定義連線、指令做相應設計),即可在控制端通過安裝的軟件監控到遠端服務器POST整個過程,並可以實現遠程接管,進入並修改BIOS設置。遠端服務器主板上必須有BMC芯片(或通過外插卡上BMC芯片),BMC芯片和網卡芯片間有SMBus連接,控制台通過網絡連接,從BMC獲取POST信息。
增強的安全特性
  安全問題是任何網絡解決方案遠程控制都需要考慮的重要因素。IPMI 2.0定義了安全哈希算法-1(SHA-1)和基於密鑰哈希消息認證以支持高級認證,給用戶安全提供了更高保障;定義了高級加密標准(AES),提供高級加密功能。
對VLAN的支持
  VLAN給了系統管理員更多的控制權,加強了系統的安全性。通過在物理LAN上構建一個管理LAN,用戶可以保護LAN上的數據不受其他通信的影響,因為在VLAN環境中,只有系統管理員設置的某些控制台可以看見和執行命令。
  IPMI 2.0對VLAN的支持為設置管理專用網絡提供了方便,並且可以根據管理范圍進行配置。這些LAN會話增強的功能加上新定義的有效負載能力(Payload),使多種類型的管理數據流可通過一個LAN會話傳送。
六、IPMI工作原理
  IPMI的核心是一個專用芯片/控制器(叫做服務器處理器或基板管理控制器(BMC)),其並不依賴於服務器的處理器、BIOS或操作系統來工作,可謂非常地獨立,是一個單獨在系統內運行的無代理管理子系統,只要有BMC與IPMI固件其便可開始工作,而BMC通常是一個安裝自愛服務器主板上的獨立的板卡,現在也有服務器主板提供對IPMI支持的。IPMI良好的自治特性便克服了以往基於操作系統的管理方式所受的限制,例如操作系統不響應或未加載的情況下其仍然可以進行開關機、信息提取等操作。
  在工作時,所有的IPMI功能都是向BMC發送命令來完成的,命令使用IPMI規范中規定的指令,BMC接收並在系統事件日志中記錄事件消息,維護描述系統中傳感器情況的傳感器數據記錄。在需要遠程訪問系統時,IPMI新的LAN上串行(SOL)特性很有用。SOL改變IPMI會話過程中本地串口傳送方向,從而提供對緊急管理服務、Windows專用管理控制台或Linux串行控制台的遠程訪問。BMC通過在LAN上改變傳送給串行端口的信息的方向來做到這點,提供了一種與廠商無關的遠程查看啟動、操作系統加載器或緊急管理控制台來診斷和維修故障的標准方式。     當需要對系統文本控制台進行遠程訪問時,Serial Over LAN (SOL) 功能將非常有用。SOL 通過 IPMI 會話重定向本地串行接口,允許遠程訪問 Windows 的緊急事件管理控制台 (EMS) 特殊管理控制台 (SAC),或訪問 LINUX 串行控制台。這個過程的步驟是 IPMI 固件截取數據,然后通過局域網重新發送定向到串行端口的信息。 這就提供了遠程查看 BOOT、OS 加載器或緊急事件管理控制台以診斷並修復服務器相關問題的標准方法,而無需考慮供應商。它允許在引導階段配置各種組件。 

  而在命令傳輸的安全性方面,用戶也無需擔心,IPMI增強的認證(基於安全哈希算法1和基於密鑰哈希消息認證)和加密(高級加密標准和Arcfour)功能有助於實現安全的遠程操作。對VLAN的支持更是為設置管理專用網絡提供了方便,並且可以以通道為基礎進行配置。
一般來說,BMC具有以下功能:
1.通過系統的串行端口進行訪問
2. 故障日志記錄和 SNMP 警報發送
3.訪問系統事件日志 (System Event Log ,SEL) 和傳感器狀況
4.控制包括開機和關機
5.獨立於系統電源或工作狀態的支持
6.用於系統設置、基於文本公用程序和操作系統控制台的文本控制台重定向
  而通過IPMI ,用戶可以主動監測組件的狀況,以確保不超出預置閾值,例如服務器溫度。這樣,通過避免不定期的斷電,協助維護了 IT 資源的運行時間。 IPMI的預告故障能力也有助於 IT 周期的管理。通過檢查系統事件日志 (SEL),可以更輕松的預先判定故障組件。
七、未來的技術趨勢
  國內外監控管理廠商的管理產品多種多樣,較為常見的有設備監控管理產品、網絡監控管理產品、應用監控管理產品等等,幾乎涉及IT 產業的各個領域。從對業界一些管理產品的分析來看,有以下一些發展趨勢:
全方位模塊化、實時化管理
管理系統模塊化趨勢明顯:設備管理、監控、應用管理與監控、安全風險管理、備份與恢復、快速部署及軟件分發、遠程控制(KVM)、資產管理、公共基礎服務等功能模塊跟整個管理系統形成了松耦合關系,用戶可以根據自己的實際需求定制適合自己的服務器管理產品。同時遠程控制發揮了越來越明顯的作用,借助相應的遠程控制工具,管理員在遠程控制端可以實現像在服務器現場一樣的管理,時效性大大增強。
管理技術標准化
優秀的管理產品一般都具有較強的平台無關性和通用性,大多都是按照標准協議進行開發,從底層的數據采集,到中間的通信協議,以及終端的管理應用,都由相關的管理標准所覆蓋。IPMI 2.0就是很好的一個管理技術標准。
對被管對象的描述標准化
SNMP管理協議,被管對象的描述是按照面向過程的方式對被管對象逐一列舉;DMI(Desktop Management Interface)對被管對象采用面向對象的描述方式,將被管信息統一組織,並提供一系列接口給管理程序應用;CIM(Common Information Model)使得管理對象、被管信息和訪問方式完全面向對象化。
CIM 是DMTF(Desktop Management Task Force)提出的通用信息管理模型。它以面向對象的方式對系統管理的不同問題域進行描述,使得不同管理系統和應用之間能夠共享和交換管理信息。它由兩部分構成: CIM 規范(CIM Specification)描述了建模語言、命名規則、元模式以及與其他管理信息模型(SNMP 的MIBs ,DMTF 的MIFs 等)之間的映射(Mapping);CIM 模式(CIM Schema)提供了實際的管理信息模型描述,同時還提供了一整套類(Class)用以組織計算環境中的各種管理信息。
目前,在對網絡設備的管理中,標准CIM 模型采用得越來越多,從設備監控、安全監控、存儲管理等各個方面都有產品應用。這也是下一代服務器管理產品的應用趨勢。
管理方式逐步向分布式發展
傳統的管理產品一般是M/A架構,一個管理中心和多個被管設備之間進行獨立點對點通信,被管設備之間沒有任何聯系,限制了網絡資源的共享和使用,而且對管理員的管理方式也有限定。隨着管理系統的發展,被管設備之間的聯系會逐步加強,不但管理中心可控制訪問被管設備資源,被管設備之間也可以實現資源共享。
八、IPMI技術功能總結

·遠程電源控制 (on / off / cycle / status)
·串口的IP映射 Serial over LAN (SoL)
·支持健康關機(Graceful shutdown support)
·機箱環境監控 (溫度, 風扇轉速, CPU電壓等)
·遠程設備身份LED控制(Remote ID LED control)
·系統事件日志(System event log)
·平台事件跟蹤(Platform Event Traps)
·數據記錄(Data logging)
·虛擬KVM會話(Virtual KVM) 目前不支持
·虛擬媒體(Virtual Media) 目前不支持

另:在IBM的在線社區找到一篇文章 

使用 ipmitool 實現 Linux 系統下對服務器的 ipmi 管理

鏈接如下:http://www.ibm.com/developerworks/cn/linux/l-ipmi/


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM