1、虛擬交換系統VSS技術概述
VSS的特點:
VSS將兩台Catalyst 6500/4500系列交換機組合為單一虛擬交換機,對外來看,只有一台交換機,管理冗余鏈路如同管理自己的一個單一接口。
VSS通過MEC多機箱通道技術減少了3層路由鄰居和2層無環的拓撲,簡化了網絡的配置和操作。
MEC技術:
當互聯的交換機連接到這個VSS的時候,是通過EtherChannel分別連接到VSS系統兩台交換機上實現的。而VSS則利用MEC技術在這個捆綁的邏輯端口上實現冗余和負載均衡。
MEC技術——使互聯交換機好像與一台交換機進行互聯。使得VSS和下聯交換機之間形成了一個無環的二層網絡接口,不需要使用STP防止環路。
VSS的支持限制:
VSS最大支持512個EtherChannel。這個限制包括EtherChannel和MEC。
由於VSL需要兩個EtherChannel號,所以能使用的EtherChannel有510個。
VSS運行狀態:
當建立VSS的時候,兩台VSS成員設備通過相互協商,一個將變成Active狀態,另一個將變成Standby狀態。
Active狀態的設備將控制VSS,為兩台設備所有模塊運行2層和3層控制協議。換句話說,在控制平面,只由Active設備控制器的,在數據平面,兩台物理設備都起作用。
Standby設備將控制流量通過VSL(虛擬交換鏈路)交給Active設備統一處理。
VSL是一條特殊的鏈路,它的作用是在VSS系統中的兩台設備間傳輸控制信息和數據。VSL最多可以捆綁8條10GE鏈路。
在VSL中,控制信息比普通數據擁有更高的優先級,這樣保證了控制信息的優先傳輸和完整性。VSL中的數據通過EtherChannel技術進行負載均衡。
建議VSL鏈路使用引擎上的10GE端口進行捆綁。
兩個設備分別用各自的接口轉發進入的流量。並根據數據源和目的的實際情況盡量進行本地轉發,而不通過VSL進行轉發。
在VSS系統中,由於Standby設備使用VSL監視Active設備。一旦檢測到Active出現故障。Standby設備將把自己轉換成Active狀態。
2、VSS系統的硬件要求與限制
3、VSS系統引擎冗余模式
目前有SSO/NSF,RPR兩種冗余模式
運行在SSO模式下切換時間可以以毫秒(ms)計算
兩個引擎運行在SSO模式的條件如下:
- 兩者運行的IOS版本必須一致
- 兩者的配置文件要一致
- VSL相關配置要一致
- PFC運行模式要一致
- SSO和NSF必須要兩個引擎都要配置(如有動態路由協議),不配置NSF情況下也能運行在SSO模式,但故障時間較長。
4、VSS系統啟動序列
A-兩個VSS成員會將VSS相關配置復制在SP配置中。
B-在啟動時進入SP軟件啟動時,VSS初始化所有擁有VSL接口的模塊,然后初始化VSL接口,並通過LMP(鏈路管理協議)檢測VSL鏈路的存活與對等體的存在。
C-如果VSL斷開則表示對等體不存在,則系統會將自己的角色定義為Active並完成啟動。
D-如果對等體存活,則會與之通過RRP(角色決定協議)進行角色的協商,如果配置了VSS優先級,那么優先級高的將會成為Active。
E-如果沒有配置優先級,則VSS-SW-ID號小的成為Active,如SW1是主設備,SW2為備設備。
F-Standby狀態的設備發送Startup-config文件下的虛擬交換信息給Active設備,Active設備確定虛擬交換域,虛擬交換節點,交換機優先級,交換搶占參數,VSL標識,VSL數量,電源冗余模式以及VSL模塊電源參數的一致性。如果一致則進入SSO冗余模式,否則將進入RPR冗余模式。
G-Active設備同步配置和應用給Standby設備。
H-如優先級高且配置了搶占的設備啟動后,等搶占計時器(默認為15min)到期后自己會變成Active設備,而原來的主設備會自動重啟變成Standby設備。
I-在角色穩定時配置優先級與搶占不會立即生效,只有在重啟時才會生效。
5、VSS系統包處理方式
VSL鏈路支持流量
- VSL傳送數據流量和控制流量,所有經過VSL的流量都將封裝一個32Bytes的頭部,內部包括輸入輸出的交換機端口索引、VLAN號、COS值等其他信息。
- VSL上支持的L2協議有:STP、VTP、EtherChannel控制協議(LACP,PAGP)。
- VSL上支持所有L3路由協議和組播。
- VSL也能傳輸系統數據,比如Standby設備的Netflow輸出數據和SNMP數據。
- VSL支持所有的SPAN協議,支持所有非VSL接口的SPAN。
- VSL上流量的負載方式,是根據EtherChannel負載方式計算的,默認為源-目的-IP。
建議:
如果VSL配置為本地SPAN源,則SPAN目標端口必須與VSL接口位於同一機箱上。
VSL無法配置為SPAN目標。
VSL不能配置為RSPAN,ERSPAN或僅本地SPAN Tx的源。
在數據包傳輸出去之前,SPAN目標端口會刪除VSL標頭,因此無法在sniffer traces中捕獲。
當源和目標都在同一機箱(活動或備用)上時,SPAN流量不會流過VSL鏈路。
數據流走向
在VSS系統中,主設備在控制平面和數據平面都是可用的,而備設備中只有其數據平面是可用的,而控制平面是不可用的。
在VSS系統中,由主設備將其CEF轉發信息下發給備設備的引擎的PFC、主備設備上板卡的DFC子卡,這樣就可以盡可能少通過VSL鏈路轉發數據流量。
6、VSS系統冗余切換事件
VSL鏈路問題
如果VSL沒有全部斷開,就不會影響主備設備之間的信息交互和數據傳輸,也不會影響主備設備之間的角色穩定(由於VSS自動采用adptive方式的channel負載均衡算法,所有恢復更快)。
如果整個VSL鏈路都斷開,則會導致兩個VSS成員初夏你雙活的狀況,這時會出現通信中斷。
可以通過雙活檢測機制來避免雙活問題的出現,確保主備角色的穩定。
雙活檢測機制有如下3種:
增強PAGP雙活檢測
IP BFD雙活機制
快速Hello雙活機制
如果通過雙活檢測確定有雙活的情況存在,則原主設備會將自己置於recovery模式並且關閉所有非VSL端口(可以將某些特定接口排除在關閉之外),確保通信不受影響,待VSL鏈路恢復后,它將自動重啟並重新確定主備狀態。
三種檢測機制可以同時使用,CISCO推薦使用增強PAGP和快速HELLO模式。
在上面的情況中如果以前有配置未保存的情況,則系統不會自動重啟而需要人工干預進行重啟,重啟前會提示保存配置。
增強PAGP雙活檢測
PAGP是思科私有協議。如果VSS的MEC設備都是符合條件的Cisco-IOS(支持增強型PAGP),那么就可以使用PAGP協議。如果PAGP運行在VSS和下聯設備間的MEC中,那么VSS就能使用PAGP去檢測雙激活狀態。
在VSS中,PAGP信息包括了一個新的TLV字段,用來包含Active設備的ID。只有在VSS下的設備才會發送這種新的PAGP信息,如果主設備在該字段看到了備設備的ID則認為出現了雙活情況而將自己置於Recovery狀態並等待VSL鏈路的恢復。
支持增強PAGP的CISCO-IOS如下表:
IP BFD雙活機制
使用IP BFD檢測方式,必須在VSS系統中的兩台設備間准備一個直連的3層鏈路,不需要互連交換機的支持。
VSS系統使用雙向轉發檢測(BFD)協議進行雙活檢測,平時沒有BFD鄰居關系的建立。
如果VSL故障后,兩台設備將建立BFD鄰居,並且嘗試建立鄰接狀態。如果起初是Active狀態的設備檢測到這個鄰接信息,那么它就知道現在處於雙活狀態,那么,它將立刻進入recovery狀態並等待VSL鏈路的恢復。
所謂IP BFD指的是有執行這種方式時需要要互連的兩個接口上配置IP地址,進行三層通信。
快速Hello雙活機制
使用快速Hello檢測方式,必須在VSS系統中的兩台設備間准備一個直連的L2鏈路作為心跳線,不需要互連交換機的支持。
此種方式在IOS12.2(33)SXI及之后的版本被支持。
VSS系統中兩個成員使用專用Hello包周期性的進行交互,包中含有對方的設備信息與狀態,如果VSL鏈路全部斷開,則設備將停止發送Hello包,在一定時間內沒收到Hello包,則認為出現了雙活情況,這時原主設備將自己置於recovery模式並等待VSL鏈路恢復。
快速Hello只在物理接口上配置。
在配置了快速Hello檢測的接口將清除原來所有的配置,並自動禁用UDLD功能,只作快速Hello檢測只用。
主機箱引擎故障
備機箱引擎將通過VSLP建立到主引擎的故障而將自己使用SSO方式自動切換為主用狀態,切換時間在50ms-200ms之間。
通過MEC與VSS系統互聯的設備,其通信將依賴於與備機互連的另外一條Channel成員線路。
源和目的只在主機箱上的單線路與單設備,其通信將中斷。
原來通過備機箱的通信將不受影響。
主機箱引擎恢復后如果沒有配置搶占將變為備的狀態。
備機箱引擎故障
主機箱引擎將通過VSLP檢測到備引擎的故障而會出現類似於所有在備機箱上的所有模塊備拔出的事件。
通過MEC與VSS系統互聯的設備,其通信將依賴於與主機箱互連的一條Channel成員線路。
源和目的只在備機箱上的單線路與單設備,其通信將中斷。
原來通過主機箱的通信將不受影響。
備機箱引擎恢復后仍將變為備的狀態。
MEC中某條鏈路故障
當MEC中某條鏈路失敗后,VSS系統會自動重新分配決定channel負載均衡的hash值與channel物理接口間的對應關系。
與VSS系統互聯的設備同樣會自動重新分配決定channel負載均衡的hash值與channel物理接口間的對應關系。
通信會產生短時中斷,通常會丟一個包,這種情況與單台設備上channel接口中某一物理接口連接中斷的情況一致。
當MEC到Active設備的全部鏈路壞掉后,MEC將變成普通的EtherChannel和Standby互聯,而到Active設備的數據將通過VSL到達Active設備,控制信息還處於Active設備上。
當MEC到Standby設備的全部鏈路壞掉后,MEC將變成普通的EtherChannel和Active設備相連,而到Standby設備的數據將通過VSL到達Standby設備,控制信息還處於Active上。
Cisco文檔中說是采用adptive方式比fixed方式恢復的時間要快,但在實際實驗中都是丟一個包。
文檔原文:https://wenku.baidu.com/view/a0e27280d4d8d15abe234ee5.html