本文源自:http://blog.itpub.net/31015730/viewspace-2150185/
一、什么是bond?
網卡bond是通過多張網卡綁定為一個邏輯網卡,實現本地網卡冗余,帶寬擴容和負載均衡,在生產場景中是一種常用的技術。kernels 2.4.12及以后的版本均供bonding模塊,以前的版本可以通過patch實現。
二、bond的配置實例
1、測試環境
[root@wjq2 ~]# cat /etc/redhat-release
Red Hat Enterprise Linux Server release 6.4 (Santiago)
[root@wjq2 ~]# uname -r
2.6.32-358.el6.x86_64
2、查看linux是否支持bonding,大部分發行版都支持
[root@wjq2 ~]# cat /boot/config-2.6.32-358.el6.x86_64 | grep -i bonding
CONFIG_BONDING=m
或者
[root@wjq2 ~]# modinfo bonding | more
filename: /lib/modules/2.6.32-358.el6.x86_64/kernel/drivers/net/bonding/bonding.ko
author: Thomas Davis, tadavis@lbl.gov and many others
description: Ethernet Channel Bonding Driver, v3.6.0
version: 3.6.0
license: GPL
srcversion: 990DDFEBDBA03F305236885
depends: 8021q,ipv6
vermagic: 2.6.32-358.el6.x86_64 SMP mod_unload modversions
parm: max_bonds:Max number of bonded devices (int)
parm: tx_queues:Max number of transmit queues (default = 16) (int)
parm: num_grat_arp:Number of gratuitous ARP packets to send on failover event (int)
parm: num_unsol_na:Number of unsolicited IPv6 Neighbor Advertisements packets to send on failover event (int)
parm: miimon:Link check interval in milliseconds (int)
parm: updelay:Delay before considering link up, in milliseconds (int)
parm: downdelay:Delay before considering link down, in milliseconds (int)
parm: use_carrier:Use netif_carrier_ok (vs MII ioctls) in miimon; 0 for off, 1 for on (default) (int)
parm: mode:Mode of operation; 0 for balance-rr, 1 for active-backup, 2 for balance-xor, 3 for broadcast, 4 fo
r 802.3ad, 5 for balance-tlb, 6 for balance-alb (charp)
parm: primary:Primary network device to use (charp)
parm: primary_reselect:Reselect primary slave once it comes up; 0 for always (default), 1 for only if speed o
f primary is better, 2 for only on active slave failure (charp)
parm: lacp_rate:LACPDU tx rate to request from 802.3ad partner; 0 for slow, 1 for fast (charp)
parm: ad_select:803.ad aggregation selection logic; 0 for stable (default), 1 for bandwidth, 2 for count (cha
rp)
parm: xmit_hash_policy:balance-xor and 802.3ad hashing method; 0 for layer 2 (default), 1 for layer 3+4, 2 fo
r layer 2+3 (charp)
parm: arp_interval:arp interval in milliseconds (int)
parm: arp_ip_target:arp targets in n.n.n.n form (array of charp)
parm: arp_validate:validate src/dst of ARP probes; 0 for none (default), 1 for active, 2 for backup, 3 for al
l (charp)
如輸出以上信息,則說明支持bonding,如果沒有,說明內核不支持bonding,需要重新編譯內核
3、查看現有網卡的配置信息
[root@wjq2 ~]# ifconfig
eth0 Link encap:Ethernet HWaddr 00:50:56:B5:4F:F5
inet addr:10.1.1.58 Bcast:10.1.1.255 Mask:255.255.255.0
inet6 addr: fe80::250:56ff:feb5:4ff5/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:1302 errors:0 dropped:0 overruns:0 frame:0
TX packets:300 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:105872 (103.3 KiB) TX bytes:38427 (37.5 KiB)
eth1 Link encap:Ethernet HWaddr 00:50:56:B5:2D:0F
inet addr:10.1.1.59 Bcast:10.1.1.255 Mask:255.255.255.0
inet6 addr: fe80::250:56ff:feb5:2d0f/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:923 errors:0 dropped:0 overruns:0 frame:0
TX packets:18 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:69365 (67.7 KiB) TX bytes:1240 (1.2 KiB)
lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:8 errors:0 dropped:0 overruns:0 frame:0
TX packets:8 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:440 (440.0 b) TX bytes:440 (440.0 b)
4、修改物理網卡配置文件
兩個物理網口分別是:eth0,eth1 綁定后的虛擬口是:bond0
[root@wjq2 network-scripts]# vim ifcfg-eth0
DEVICE=eth0
TYPE=Ethernet
UUID=adc59d0e-8c6c-4d03-8f98-d77ef5131208
ONBOOT=yes
NM_CONTROLLED=no
BOOTPROTO=none
MASTER=bond0
SLAVE=yes #可以沒有此字段,就需要開機執行ifenslave bond0 eth0 eth1命令了
DEFROUTE=yes
IPV4_FAILURE_FATAL=yes
IPV6INIT=no
NAME="System eth0"
HWADDR=00:50:56:b5:4f:f5
[root@wjq2 network-scripts]# vim ifcfg-eth1
DEVICE=eth1
TYPE=Ethernet
UUID=3fca3e29-7fd1-4355-86c2-2f76e43f4d9c
ONBOOT=yes
NM_CONTROLLED=no
BOOTPROTO=none
HWADDR=00:50:56:b5:2d:0f
MASTER=bond0
SLAVE=yes #可以沒有此字段,就需要開機執行ifenslave bond0 eth0 eth1命令了
DEFROUTE=yes
IPV4_FAILURE_FATAL=yes
IPV6INIT=no
NAME="System eth1"
5、配置邏輯網卡bond0
ifcfg-bond0配置文件需要我們手工創建
[root@wjq2 network-scripts]# vim ifcfg-bond0
DEVICE=bond0
NAME='System bond0'
TYPE=Ethernet
NM_CONTROLLED=no
USERCTL=no
ONBOOT=yes
BOOTPROTO=none
IPADDR=10.1.1.100
NETMASK=255.255.255.0
GATEWAY=10.1.1.249
6、加載模塊,讓系統支持bonding
/etc/modprobe.d/modprobe.conf不存在的話,可以手動創建或者使用/etc/modprobe.d/dist.conf文件也可以
[root@wjq2 ~]# vim /etc/modprobe.d/modprobe.conf
alias bond0 bonding
options bond0 miimon=100 mode=0
說明:配置bond0的鏈路檢查時間為100ms,模式為0。(詳細的bond七種模式在最后面詳細講解)
7、加載bond module
[root@wjq2 ~]# modprobe bonding
8、查看綁定結果
[root@wjq2 ~]# cat /proc/net/bonding/bond0
Ethernet Channel Bonding Driver: v3.6.0 (September 26, 2009)
Bonding Mode: load balancing (round-robin)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0
Slave Interface: eth0
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 00:50:56:b5:4f:f5
Slave queue ID: 0
Slave Interface: eth1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 00:50:56:b5:2d:0f
Slave queue ID: 0
查看物理網卡和邏輯網卡的信息
[root@wjq2 ~]# ifconfig
bond0 Link encap:Ethernet HWaddr 00:50:56:B5:4F:F5
inet addr:10.1.1.100 Bcast:10.1.1.255 Mask:255.255.255.0
inet6 addr: fe80::250:56ff:feb5:4ff5/64 Scope:Link
UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1
RX packets:903 errors:0 dropped:0 overruns:0 frame:0
TX packets:158 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:68972 (67.3 KiB) TX bytes:17037 (16.6 KiB)
eth0 Link encap:Ethernet HWaddr 00:50:56:B5:4F:F5
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:452 errors:0 dropped:0 overruns:0 frame:0
TX packets:79 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:34507 (33.6 KiB) TX bytes:6935 (6.7 KiB)
eth1 Link encap:Ethernet HWaddr 00:50:56:B5:4F:F5
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:451 errors:0 dropped:0 overruns:0 frame:0
TX packets:79 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:34465 (33.6 KiB) TX bytes:10102 (9.8 KiB)
lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:16 errors:0 dropped:0 overruns:0 frame:0
TX packets:16 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:960 (960.0 b) TX bytes:960 (960.0 b)
9、測試bond
由於使用的是mode=0,負載均衡的方式,這時我們ping114.114.114.114,然后手動斷開一個網卡,此時ping不會中斷
[root@wjq2 ~]# ping 114.114.114.114
PING 114.114.114.114 (114.114.114.114) 56(84) bytes of data.
64 bytes from 114.114.114.114: icmp_seq=1 ttl=59 time=4.46 ms
64 bytes from 114.114.114.114: icmp_seq=1 ttl=59 time=4.56 ms (DUP!)
64 bytes from 114.114.114.114: icmp_seq=2 ttl=59 time=2.21 ms
64 bytes from 114.114.114.114: icmp_seq=2 ttl=59 time=2.28 ms (DUP!)
64 bytes from 114.114.114.114: icmp_seq=3 ttl=59 time=2.23 ms
64 bytes from 114.114.114.114: icmp_seq=3 ttl=59 time=2.24 ms (DUP!)
64 bytes from 114.114.114.114: icmp_seq=4 ttl=59 time=1.94 ms
64 bytes from 114.114.114.114: icmp_seq=4 ttl=59 time=1.94 ms (DUP!)
64 bytes from 114.114.114.114: icmp_seq=5 ttl=59 time=1.95 ms
64 bytes from 114.114.114.114: icmp_seq=5 ttl=59 time=1.95 ms (DUP!)
64 bytes from 114.114.114.114: icmp_seq=6 ttl=59 time=2.00 ms
64 bytes from 114.114.114.114: icmp_seq=6 ttl=59 time=2.01 ms (DUP!)
……
用另一個終端手動關閉eth0網卡,ping並沒有中斷
[root@wjq2 ~]# ifdown eth0
64 bytes from 114.114.114.114: icmp_seq=10 ttl=59 time=1.96 ms
64 bytes from 114.114.114.114: icmp_seq=11 ttl=59 time=2.12 ms
64 bytes from 114.114.114.114: icmp_seq=12 ttl=59 time=2.30 ms
64 bytes from 114.114.114.114: icmp_seq=13 ttl=59 time=2.23 ms
64 bytes from 114.114.114.114: icmp_seq=14 ttl=59 time=2.16 ms
64 bytes from 114.114.114.114: icmp_seq=15 ttl=59 time=2.04 ms
64 bytes from 114.114.114.114: icmp_seq=16 ttl=59 time=1.88 ms
查看bond0狀態,發現eth0沒有了,但是bond正常(只顯示處於UP狀態的網卡信息)
[root@wjq2 ~]# cat /proc/net/bonding/bond0
Ethernet Channel Bonding Driver: v3.6.0 (September 26, 2009)
Bonding Mode: load balancing (round-robin)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0
Slave Interface: eth1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 00:50:56:b5:2d:0f
Slave queue ID: 0
然后啟動eth0網卡,發現有恢復up狀態
[root@wjq2 ~]# ifup eth0
[root@wjq2 ~]#
[root@wjq2 ~]# cat /proc/net/bonding/bond0
Ethernet Channel Bonding Driver: v3.6.0 (September 26, 2009)
Bonding Mode: load balancing (round-robin)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0
Slave Interface: eth0
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 00:50:56:b5:4f:f5
Slave queue ID: 0
Slave Interface: eth1
MII Status: up
Speed: 10000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: 00:50:56:b5:2d:0f
Slave queue ID: 0
三、擴展(多網卡綁定多個bond)
上邊是兩個網卡(eth0、eth1)綁定成一個bond0,如果我們要設置多個bond口,比如物理網口eth0和eth1組成bond0,eth2和eth3組成bond1,eth4和eth5組成bond2,那么網口設置文件的設置方法和上面,是一樣的,只是/etc/modprobe.d/dist.conf文件就不能疊加了。正確的設置方法有兩種:
1、第一種
alias bond0 bonding alias bond1 bonding alias bond2 bonding options bonding max_bonds=3 miimon=100 mode=0 |
這樣所有的綁定只能使用一個mode了。
2、第二種
alias bond0 bonding
options bond0 miimon=100 mode=0 max_bonds=3
alias bond1 bonding
options bond1 miimon=100 mode=1 max_bonds=3
alias bond2 bonding
options bond2 miimon=100 mode=2 max_bonds=3
說明:這種方式不同的bond口可以設定為不同的mode,注意開機自動啟動/etc/rc.d/rc.local文件的設置
特別注意:如果在配置文件的options中沒有max_bonds參數,就會出現下面的報錯信息:Master 'bond1': Error: handshake with driver failed.因為在用modprobe加載bonding模塊時,加上參數指定創建多少個bonding device,否則默認只會創建一個,就是bond0。
[root@wjq2 ~]# ifenslave bond1 eth2 eth3
Master 'bond1': Error: handshake with driver failed. Aborting
多個bond的結果如下所示:
[root@wjq2 ~]# ifconfig
bond0 Link encap:Ethernet HWaddr 00:50:56:B5:4F:F5
inet addr:10.1.1.100 Bcast:10.1.1.255 Mask:255.255.255.0
inet6 addr: fe80::250:56ff:feb5:4ff5/64 Scope:Link
UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1
RX packets:2012 errors:0 dropped:0 overruns:0 frame:0
TX packets:160 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:153964 (150.3 KiB) TX bytes:20786 (20.2 KiB)
bond1 Link encap:Ethernet HWaddr 00:50:56:B5:5A:25
inet addr:10.1.1.101 Bcast:10.1.1.255 Mask:255.255.255.0
inet6 addr: fe80::250:56ff:feb5:5a25/64 Scope:Link
UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1
RX packets:1806 errors:0 dropped:0 overruns:0 frame:0
TX packets:8 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:131984 (128.8 KiB) TX bytes:536 (536.0 b)
bond2 Link encap:Ethernet HWaddr 00:50:56:B5:0B:EB
inet addr:10.1.1.102 Bcast:10.1.1.255 Mask:255.255.255.0
inet6 addr: fe80::250:56ff:feb5:beb/64 Scope:Link
UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1
RX packets:1806 errors:0 dropped:0 overruns:0 frame:0
TX packets:9 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:131920 (128.8 KiB) TX bytes:606 (606.0 b)
eth0 Link encap:Ethernet HWaddr 00:50:56:B5:4F:F5
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:1007 errors:0 dropped:0 overruns:0 frame:0
TX packets:81 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:77033 (75.2 KiB) TX bytes:10939 (10.6 KiB)
eth1 Link encap:Ethernet HWaddr 00:50:56:B5:4F:F5
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:1005 errors:0 dropped:0 overruns:0 frame:0
TX packets:80 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:76931 (75.1 KiB) TX bytes:10929 (10.6 KiB)
eth2 Link encap:Ethernet HWaddr 00:50:56:B5:5A:25
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:903 errors:0 dropped:0 overruns:0 frame:0
TX packets:4 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:65983 (64.4 KiB) TX bytes:252 (252.0 b)
eth3 Link encap:Ethernet HWaddr 00:50:56:B5:5A:25
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:903 errors:0 dropped:0 overruns:0 frame:0
TX packets:4 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:66001 (64.4 KiB) TX bytes:284 (284.0 b)
eth4 Link encap:Ethernet HWaddr 00:50:56:B5:0B:EB
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:903 errors:0 dropped:0 overruns:0 frame:0
TX packets:5 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:65951 (64.4 KiB) TX bytes:342 (342.0 b)
eth5 Link encap:Ethernet HWaddr 00:50:56:B5:0B:EB
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:903 errors:0 dropped:0 overruns:0 frame:0
TX packets:4 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:65969 (64.4 KiB) TX bytes:264 (264.0 b)
lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:4 errors:0 dropped:0 overruns:0 frame:0
TX packets:4 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:240 (240.0 b) TX bytes:240 (240.0 b)
四、bond的七種模式
像samba、nfs這種共享文件系統,網絡的吞吐量非常大,就造成網卡的壓力很大,網卡bond是通過把多個物理網卡綁定為一個邏輯網卡,實現本地網卡的冗余,帶寬擴容和負載均衡,具體的功能取決於采用的哪種模式。
1、mode=0(balance-rr)(平衡掄循環策略)
鏈路負載均衡,增加帶寬,支持容錯,一條鏈路故障會自動切換正常鏈路。交換機需要配置聚合口,思科叫port channel。
特點:傳輸數據包順序是依次傳輸(即:第1個包走eth0,下一個包就走eth1….一直循環下去,直到最后一個傳輸完畢),此模式提供負載平衡和容錯能力;但是我們知道如果一個連接或者會話的數據包從不同的接口發出的話,中途再經過不同的鏈路,在客戶端很有可能會出現數據包無序到達的問題,而無序到達的數據包需要重新要求被發送,這樣網絡的吞吐量就會下降
2、mode=1(active-backup)(主-備份策略)
這個是主備模式,只有一塊網卡是active,另一塊是備用的standby,所有流量都在active鏈路上處理,交換機配置的是捆綁的話將不能工作,因為交換機往兩塊網卡發包,有一半包是丟棄的。
特點:只有一個設備處於活動狀態,當一個宕掉另一個馬上由備份轉換為主設備。mac地址是外部可見得,從外面看來,bond的MAC地址是唯一的,以避免switch(交換機)發生混亂。
此模式只提供了容錯能力;由此可見此算法的優點是可以提供高網絡連接的可用性,但是它的資源利用率較低,只有一個接口處於工作狀態,在有 N 個網絡接口的情況下,資源利用率為1/N
3、mode=2(balance-xor)(平衡策略)
表示XOR Hash負載分擔,和交換機的聚合強制不協商方式配合。(需要xmit_hash_policy,需要交換機配置port channel)
特點:基於指定的傳輸HASH策略傳輸數據包。缺省的策略是:(源MAC地址 XOR 目標MAC地址) % slave數量。其他的傳輸策略可以通過xmit_hash_policy選項指定,此模式提供負載平衡和容錯能力
4、mode=3(broadcast)(廣播策略)
表示所有包從所有網絡接口發出,這個不均衡,只有冗余機制,但過於浪費資源。此模式適用於金融行業,因為他們需要高可靠性的網絡,不允許出現任何問題。需要和交換機的聚合強制不協商方式配合。
特點:在每個slave接口上傳輸每個數據包,此模式提供了容錯能力
5、mode=4(802.3ad)(IEEE 802.3ad 動態鏈接聚合)
表示支持802.3ad協議,和交換機的聚合LACP方式配合(需要xmit_hash_policy).標准要求所有設備在聚合操作時,要在同樣的速率和雙工模式,而且,和除了balance-rr模式外的其它bonding負載均衡模式一樣,任何連接都不能使用多於一個接口的帶寬。
特點:創建一個聚合組,它們共享同樣的速率和雙工設定。根據802.3ad規范將多個slave工作在同一個激活的聚合體下。
外出流量的slave選舉是基於傳輸hash策略,該策略可以通過xmit_hash_policy選項從缺省的XOR策略改變到其他策略。需要注意的 是,並不是所有的傳輸策略都是802.3ad適應的,尤其考慮到在802.3ad標准43.2.4章節提及的包亂序問題。不同的實現可能會有不同的適應性。
必要條件:
條件1:ethtool支持獲取每個slave的速率和雙工設定
條件2:switch(交換機)支持IEEE 802.3ad Dynamic link aggregation
條件3:大多數switch(交換機)需要經過特定配置才能支持802.3ad模式
6、mode=5(balance-tlb)(適配器傳輸負載均衡)
是根據每個slave的負載情況選擇slave進行發送,接收時使用當前輪到的slave。該模式要求slave接口的網絡設備驅動有某種ethtool支持;而且ARP監控不可用。
特點:不需要任何特別的switch(交換機)支持的通道bonding。在每個slave上根據當前的負載(根據速度計算)分配外出流量。如果正在接受數據的slave出故障了,另一個slave接管失敗的slave的MAC地址。
必要條件:
ethtool支持獲取每個slave的速率
7、mode=6(balance-alb)(適配器適應性負載均衡)
在5的tlb基礎上增加了rlb(接收負載均衡receive load balance).不需要任何switch(交換機)的支持。接收負載均衡是通過ARP協商實現的.
特點:該模式包含了balance-tlb模式,同時加上針對IPV4流量的接收負載均衡(receive load balance, rlb),而且不需要任何switch(交換機)的支持。接收負載均衡是通過ARP協商實現的。bonding驅動截獲本機發送的ARP應答,並把源硬件地址改寫為bond中某個slave的唯一硬件地址,從而使得不同的對端使用不同的硬件地址進行通信。
來自服務器端的接收流量也會被均衡。當本機發送ARP請求時,bonding驅動把對端的IP信息從ARP包中復制並保存下來。當ARP應答從對端到達 時,bonding驅動把它的硬件地址提取出來,並發起一個ARP應答給bond中的某個slave。
使用ARP協商進行負載均衡的一個問題是:每次廣播 ARP請求時都會使用bond的硬件地址,因此對端學習到這個硬件地址后,接收流量將會全部流向當前的slave。這個問題可以通過給所有的對端發送更新 (ARP應答)來解決,應答中包含他們獨一無二的硬件地址,從而導致流量重新分布。
當新的slave加入到bond中時,或者某個未激活的slave重新 激活時,接收流量也要重新分布。接收的負載被順序地分布(round robin)在bond中最高速的slave上
當某個鏈路被重新接上,或者一個新的slave加入到bond中,接收流量在所有當前激活的slave中全部重新分配,通過使用指定的MAC地址給每個 client發起ARP應答。下面介紹的updelay參數必須被設置為某個大於等於switch(交換機)轉發延時的值,從而保證發往對端的ARP應答 不會被switch(交換機)阻截。
必要條件:
條件1:ethtool支持獲取每個slave的速率;
條件2:底層驅動支持設置某個設備的硬件地址,從而使得總是有個slave(curr_active_slave)使用bond的硬件地址,同時保證每個bond 中的slave都有一個唯一的硬件地址。如果curr_active_slave出故障,它的硬件地址將會被新選出來的 curr_active_slave接管
其實mod=6與mod=0的區別:mod=6,先把eth0流量占滿,再占eth1,….ethX;而mod=0的話,會發現2個口的流量都很穩定,基本一樣的帶寬。而mod=6,會發現第一個口流量很高,第2個口只占了小部分流量。
mode5和mode6不需要交換機端的設置,網卡能自動聚合。mode4需要支持802.3ad。mode0,mode2和mode3理論上需要靜態聚合方式。但實測中mode0可以通過mac地址欺騙的方式在交換機不設置的情況下不太均衡地進行接收。