*快速定位故障點:(考到)
ARP:同一二層內可以通過ARP -a命令查詢到要訪問的主機IP(ARP表項中記錄了同一二層中的IP和MAC的對應關系),若查詢不到,說明二層出現問題(Vlan 間不通)或者硬件問題(交換機策略限制,交換機掛了,服務器掛了,線纜松動)。若查詢得到一般是虛擬機側的問題。
tracert/traceroute目的端:路由跟蹤。若失敗,三層出現問題。大可能是網關出現問題(網關在路由器上設置錯誤,加入了錯誤的路由條目,虛擬機側未設置正確網關,虛擬機網卡未設置正確網關)
同網段:
先互相ping對方 VM,如果能ping通,那么就是虛擬機側的問題。(防火牆沒關、獲得無效IP、網關信息配置錯誤、安全組限制、殺毒軟件。)
如果不能ping通,那就arp -a,
如果沒有目的MAC地址說明是物理問題(物理鏈路不通,交換機策略限制,交換機掛了,服務器掛了)或者 Vlan 間不通(VLAN隔離)。
不同網段:
如果在同一路由器下,可以在源目 VM 分別查看 arp 表是否存在對應的網關MAC地址,不存在,則是本端二層有問題(物理硬件或VLAN間不通);存在或者通,問題可能就出在虛擬機側。(防火牆沒關、獲得無效IP、網關信息配置錯誤、安全組限制、殺毒軟件。)
不同路由器,用traceroute命令檢查每一跳的情況,可能是鏈路上的路由出了問題,若失敗,三層出現問題。大可能是網關出現問題(網關在路由器上設置錯誤,加入了錯誤的路由條目,虛擬機側未設置正確網關,虛擬機網卡未設置正確網關)。
如果不是同一主機,條件允許的情況下,可以將虛擬機移至同一主機,如果通,則是物理網絡配置錯誤。
*DVS、OVS、EVS的區別:
DVS是FC中VRM上的一個用於管理和統一下發配置的虛擬分布式交換機,它是一個邏輯上的概念,不存在的,只在VRM上體現。
OVS是一款使用開源軟件實現的虛擬交換機,是DVS在底層的體現,真正負責主機內部流量轉發的組件,在底層是實際存在的,是內核態的。
EVS是OVS的升級版,是華為結合intel的DPDK技術去實現了用戶態(免內核)的虛擬交換機,可以直接通過用戶態去轉發,不需要再經過內核再去找它的原生驅動再找網卡再進行轉發了,路徑變短,性能提升。
A能ping通B,B ping不通A是什么原因?
A開啟了防火牆、A和B不在一個安全組。
開啟了防火牆流量可以出去,進來的流量會有限制,端口組會拒絕ping,保證安全性。
*在SC上創建的兩台虛擬機不通有哪些原因?
(四種網絡)路由,內部,外部,直連 (考試環境是 type 3,只有外部網絡和內部網絡) 1. 可能在不同的 VPC。
2. 同 vpc 可能在不同的網絡中,內部和路由不通,內部和外部也不通--是天然不通,配彈性 IP或者snat可以實現路由網絡和外部網絡的通信(彈性 ip 可以雙向,snat 只能單向內訪外)。
3. 位於不同的安全組中、安全組的隔離,(要安全組放行)。
*兩虛擬機昨天還通,今天就不通了,有什么原因導致?
1. 虛擬機側:虛擬機藍屏故障(pvdriver驅動監控);物理主機進入維護狀態或者物理機故障;端口組被人為誤改了,不在同一個端口組內。
2. DHCP模塊故障后,動態ip用不了。
3. CNA節點EVS進程故障。
4. 中間鏈路故障。
*如果是兩個部門之間不通,有什么原因導致?
兩個部門,通常情況下,處在不同的 vlan,也就是處於不同的端口組。
可能原因有:端口組 vlan 是否配置錯誤、上行鏈路是否處於不同的物理平面;TOR 交換機是否配置錯誤;網關設備是否配置錯誤;中間系統是否攔截流量;
*如果兩台虛機在兩個DVS上,怎么互通?
三層互通,使用路由器將兩個物理平面打通;
或者如果兩個交換機是三層交換機 直接鏈接然后放通相應VLAN就好
*安全組是怎么理解的?
安全組是具有同等安全要求的一組虛擬機,不同 VPC 下的安全組默認是不可以通的。
不同安全組之間的訪問控制由 IPtable 和 iNIC 來實現。
*兩個 VPC 里面的主機就一定不通嗎?
不一定,VM 的路由網絡,綁定彈性 IP 后可以通信。
或者配置安全組策略,使兩個 VPC 中的 VM 可以通信。
或把 VM 放入直連網絡
*一個物理網絡就對應一個 DVS 嗎?
一個 CNA 主機內一個 DVS 綁定一個 CNA 主機物理網口
*Fusionscompute的三個概念:存儲資源、存儲設備和數據存儲。
1. 存儲資源:告知數據在哪里,硬盤在哪里
2. 存儲設備:數據存放的空間
3. 數據存儲:FusionCompute維持出來的統一概念(使用存儲時,存儲資源告知位置,找到存儲設備)
虛擬化數據存儲:實現存儲虛擬化時,采用主機存儲虛擬化+文件系統實現。
非虛擬化數據存儲:存儲設備虛擬化
裸設備映射數據存儲:裸設備+邏輯卷
裸設備映射和非虛擬化存儲的區別就是。存儲本身是不是高級存儲
*虛擬磁盤類型以及差別
*主機和 VRM 心跳連接異常?怎么解決?
可能原因:
1. CNA 節點下電。
2. 網絡出現異常。
3. CNA 節點管理網口異常。
4. CNA 節點進程異常。
在告警信息中確認異常主機的 IP 和 BMC IP 登錄 BMC,檢查主機是否下電
如果是下電狀態,選擇上電,待主機上電成功后,查看告警是否清除
用 putty 登錄 VRM 后台,嘗試 ping 主機的 ip,如果不通,檢查網絡問題。
如果通的話,用 putty 登錄 CNA 節點,service vnad status 查看 vnad 服務是否啟動如果沒有啟動,service vnad restart。
PS:VRM 之所以能接管 CNA,因為 VRM 調用了 CNA 里的 vnad 進程
*虛擬磁盤的類型有哪些?配置模式有哪些?磁盤模式有哪些?
類型:
普通:只能給單個虛擬機使用
共享:可以綁定給多個虛擬機使用
配置模式:
普通:根據磁盤容量為磁盤分配空間,在創建過程中會將物理設備上保留的數據置零。這種格式的磁盤性能要優於其他兩種磁盤格式,但創建這種格式的磁盤所需的時間可能會比創建其他類型的磁盤長。 建議系統盤使用該模式。
精簡:該模式,系統首次僅分配磁盤容量配置值的部分容量,后續根據使用情況,逐步進行分配,直到分配總量達到磁盤容量配置值為止。
使用精簡模式可能導致數據存儲超分配,建議超分配比例不超過50%,超分配率可通過數據存儲的概要頁面“已分配容量”和“總容量”的比率關系來確定。數據存儲類型為“FusionStorage”或“本地內存盤”時,只支持該模式;數據存儲類型為“本地硬盤”或“SAN存儲”時,不支持該模式。
普通延遲置零:根據磁盤容量為磁盤分配空間,創建時不會擦除物理設備上保留的任何數據,但后續從虛擬機首次執行寫操作時會按需要將其全部置零。創建速度比“普通”模式快;IO性能介於“普通”和“精簡”兩種模式之間。
只有數據存儲類型為“虛擬化本地硬盤”、“虛擬化SAN存儲”或版本號為V3的“Advanced SAN存儲”時,支持該模式。
磁盤模式:
從屬:快照中包含該從屬磁盤。
獨立-持久:更改將立即並永久寫入磁盤,持久磁盤不受快照影響。
即對虛擬機創建快照時,不對該磁盤的數據進行快照。使用快照還原虛擬 機時,不對該磁盤的數據進行還原。
獨立-非持久:關閉電源或恢復快照后,丟棄對該磁盤的更改。
1. 當數據存儲類型為“SAN存儲”、“本地硬盤”或“本地內存盤”時,不支持創建快照,默認“獨立-持久”。
2. 當數據存儲類型為“虛擬化本地硬盤”、“虛擬化SAN存儲”、“NAS存儲”、“Advanced SAN存儲”或“FusionStorage”,且磁盤類型為“共享”時,該磁盤不支持創建快照,默認“獨立-持久”。
3. 當磁盤類型為“普通”且數據存儲類型為“虛擬化本地硬盤”、“虛擬化SAN存儲”、“FusionStorage”、“NAS存儲”、版本號為V3的“Advanced SAN存儲”或“本地內存盤”時,磁盤才可以創建為“獨立-非持久”模式。
*數據存儲是虛擬化或非虛擬化的本質差別:
當數據存儲的虛擬化特性是由主機側去實現時,其根本就是將存儲設備格式化為文件系統。本地存儲格式成ext4,共享存儲格式成vims。
非虛擬數據存儲就是一個塊設備。
*FusionStorage是不是虛擬化數據存儲?
不是,虛擬化數據存儲特指由CNA自身實現的虛擬化特性,例如快照、精簡磁盤等,即對應存儲虛擬化為主機存儲虛擬化+文件系統。FusionStorage支持虛擬化特性,是通過FusionStorage存儲系統自身機制實現的,CNA並未參與。
AdvancedSAN對於V3時,也是非虛擬化數據存儲,理由同上。
*FusionCompute 集群內無法執行調度策略的原因
1. 對於不滿足遷移要求的虛擬機,將不會進行自動遷移。例如下面的情況:
1) 聚集或互斥規則將阻止遷移虛擬機。
2) 已為虛擬機禁用了 DRS。
3) 某個設備掛載到了一個或多個虛擬機上,使 DRS 無法移動虛擬機,從而無法平衡負載。
4) 虛擬機與 DRS 的目的主機不兼容。
5) 虛擬機與所在主機進行了綁定。
2. 遷移后會產生新的不平衡狀態,這類情況將不會遷移虛擬機。例如:
1) 衡量因素選擇“CPU 和內存”時,部分主機 CPU 相對高,另外部分主機內存相對高。
2) 衡量因素選擇“CPU”或“內存”時,遷移任何一個虛擬機都無法達到平衡。
3. 動態資源調度=DRS模塊+策略+vMotion(自動),故無法執行調度策略的原因可以從以上三點去考慮。
4. DRS 需要共享的存儲
*虛擬機熱遷移、存儲熱遷移和完整遷移:
虛擬機熱遷移是虛擬機在服務器之間存儲不變。
存儲熱遷移是更換存儲主機不變。
完整熱遷移是主機和存儲一起變。
*虛擬機HA是什么?如何實現?
概念:物理服務器或虛擬機故障時,系統在資源池中自動啟動虛擬機到另一可用物理服務器上。
物理機故障類型:主機下電、重啟、宕機
虛擬機OS故障類型:Windows藍屏,Linux Panic等
特性實現:
1. VM故障或計算節點故障
2. 管理節點查詢VM狀態,發現VM故障
3. 管理節點判斷VM有HA屬性,則根據保存的VM信息(規格、卷),選擇可用的CNA啟動VM
4. CNA節點收到HA請求,根據VM規格、卷信息啟動新的VM
5. 啟動過程中,將VM之前的卷重新掛在,包括用戶卷
HA時,業務會中斷,准確的說,HA觸發時,業務已中斷。HA需要共享的存儲。
熱遷移是計划性遷移,HA是非計划性遷移。
*如何讓VM1與VM4通,那個路由器怎么配置?
TOR怎么配
端口配IP, 然后開啟路由功能,比如 OPSF 然后加入路由條目
*安全組
安全組是基於iptables實現的。
默認出流量全部放行 入流量全部禁止
可以限制哪些協議?CMP TCP UDP 等
存儲虛擬化實現方式?
裸設備+邏輯卷:通過給宿主機CNA掛載塊設備,宿主機采用DeviceMapper的內核模塊對塊設備空間進行邏輯划分成邏輯卷,此時邏輯卷即為虛擬磁盤。在FC的環境中,非虛擬化的本地數據存儲、非虛擬化的SAN數據存儲就是采用該方式實現。
存儲設備虛擬化:賦予虛擬化平台的管理節點VRM管理存儲設備的能力(添加存儲資源),在VRM界面上操作創建虛擬磁盤后,VRM會通過控制流在存儲設備上創建相應塊設備(AdvanceSAN為LUN,FusionStorage為卷)。在VRM界面上將該累虛擬磁盤掛在給某台虛擬機並點擊打開電源后,VRM會通過控制流在存儲設備上將LUN或卷映射給即將運行虛擬機的CNA主機,CNA主機再通過RDM的方式將映射上來的塊設備掛載給虛擬機。
主機存儲虛擬化+文件系統:
1. 通過給宿主機CNA掛載塊設備,CNA主機對其格式化成文件系統(本地硬盤:ext4、SAN:VIMS,添加數據存儲時選擇虛擬化的數據存儲),並通過文件的形式存放虛擬磁盤。
2. 通過給宿主機CNA掛載共享文件系統(NFS),並通過文件的形式存放虛擬磁盤。
特性對數據存儲要求的總結
在FusionCompute中,大LUN和小LUN是什么?有什么差別?
大 LUN 是將一個 LUN 添加為數據存儲后,在上面創建多個虛擬機;小 LUN 是一個 LUN 添加為數據存儲后只供一個虛擬機底層一個 LUN,被虛擬化平台接管,直接將該 LUN 作為虛擬機的磁盤使用大 LUN 方便幾種管理虛擬機,可以實現更多高級特性小 LUN 性能達到最優化,容災設計時可以針對具體虛擬機磁盤進行容災。
虛擬機大范圍無法訪問的原因?
可以從三層來考慮,一是存儲問題,二是網絡問題,三是底層系統的故障:
1. 登錄 portal 查看告警信息,以及用戶是否有誤操作。
2. 查看網絡、計算、存儲資源是否有問題。
3. 登錄 FusionCompute,查看虛擬機狀態是否正常。
4. 硬件排查。
如果部署 VRM 時出錯怎么解決?
1. 部署工具版本不一致。
2. VRM 與 CNA 網絡故障。
3. CNA 故障,硬件或軟件不兼容。
4. CNA 虛擬化指令集在 BIOS 中沒有開啟。
5. 安裝失敗后清理不徹底。
6. VRM 創建的 VM 下發配置失敗(配置錯誤)。
存儲資源使用對比
存儲資源類型 |
底層協議 |
存儲設備類型 |
是否支持虛擬化 |
是否支持存儲卸載 |
IP SAN |
TCP/IP |
LUN |
是 |
否 |
FC SAN |
光纖 |
LUN |
是 |
否 |
NAS |
TCP/IP |
共享目錄 |
是 |
否 |
本地磁盤 |
本地連接 |
本地磁盤 |
是 |
否 |
AdvancedSAN |
TCP/IP |
存儲池 |
否 |
是 |
FusionStorage |
TCP/IP |
存儲池 |
是 |
是 |
存儲卸載:指將部分存儲操作(模板部署、刪除清零等操作)下移到存儲側進行,這樣做可以不浪費主機側資源,同時也可以提升操作效率。
虛擬化:對於LUN或者本地磁盤,在不支持虛擬化的場景不能支持快照,鏈接克隆等高級功能,但是所創建的卷具有很好的性能。虛擬化后的數據存儲,支持各種高級功能,卷格式也支持多種,但是性能低於非虛擬化的存儲設備。
考官追問:
上行鏈路怎么配置?上行鏈路對應的交換機端口怎么配置?上行鏈路是主備?負載分擔?
上行鏈路 可以配鏈路聚合 端口可以負載 也可以主備
vlan是基於端口創建的?
不是
不同網段的虛擬機通訊一定要經過路由嗎?
要經過路由。vlan就是划分物理網絡的功能,可以把一個物理二層網絡划分成多個邏輯網絡
TOR1和TOR2連接后交換機要怎么配,把具體命令寫出來?
連接交換機 那你肯定要配網關 然后 打上路由 比如相連網段的OSPF路由
如何知道vm地址等配置錯誤
比如說你要分配給vm 192.168.1.0/24的網段 但你配置錯了 vm獲取到的地址是 192.168.100.0/24 你可以在 FC界面 直接看網卡IP 地址
假如vm1屬於vlan10網段為192.168.10.0,vm3屬於vlan30網段為193.168.30.0在tor交換機上應該如何配置?在物理主機上如何配置?端口組如何配置?基於以上條件vm2屬於vlan20,網段為20.0上述的東西應該如何配置?