聚合链路是将多块网卡逻辑地连接到一起从而允许故障转移或者提高吞吐率的方法。提高服务器网络可用性。

聚合链路和网络故障排查(链路聚合状态down原因)

bond是将多块网卡虚拟成为一块网卡的技术,通过bond技术让多块网卡看起来是一个单独的以太网接口设备并具有相同的ip地址。在linux下配置bond,通过网卡绑定技术既能增加服务器的可靠性,又增加了可用网络宽带,为用户提供不间断的网络服务。team是另一种用来实现链路聚合和方法,类似于bond,team和bond的区别在于,支持hash加密,支持负载均衡,支持8块网卡,更好地支持IPV6

实现方式

bond

mod=0 ,即:(balance-rr) Round-robin policy(轮询)

聚合口数据报文按包轮询从物理接口转发。

负载均衡---所有链路处于负载均衡状态,轮询方式往每条链路发送报文这模式的特点增加了带宽,同时支持容错能力,当有链路出问题,会把流量切换到正常的链路上。

性能问题---一个连接或者会话的数据包如果从不同的接口发出的话,中途再经过不同的链路,在客户端很有可能会出现数据包无序到达的问题,而无序到达的数据包需要重新要求被发送,这样网络的吞吐量就会下降。Bond0在大压力的网络传输下,性能增长的并不是很理想。

需要交换机进行端口绑定

第二种模式:mod=1,即: (active-backup) Active-backup policy(主-备份策略)

只有Active状态的物理接口才转发数据报文。

容错能力---只有一个slave是激活的(active)。也就是说同一时刻只有一个网卡处于工作状态,其他的slave都处于备份状态,只有在当前激活的slave故障后才有可能会变为激活的(active)。

无负载均衡---此算法的优点是可以提供高网络连接的可用性,但是它的资源利用率较低,只有一个接口处于工作状态,在有 N 个网络接口的情况下,资源利用率为1/N。

第三种模式:mod=2,即:(balance-xor) XOR policy(平衡策略)

聚合口数据报文按源目MAC、源目IP、源目端口进行异或HASH运算得到一个值,根据该值查找接口转发数据报文

负载均衡---基于指定的传输HASH策略传输数据包。

容错能力---这模式的特点增加了带宽,同时支持容错能力,当有链路出问题,会把流量切换到正常的链路上。

性能问题---该模式将限定流量,以保证到达特定对端的流量总是从同一个接口上发出。既然目的地是通过MAC地址来决定的,因此该模式在“本地”网络配置下可以工作得很好。如果所有流量是通过单个路由器,由于只有一个网关,源和目标mac都固定了,那么这个算法算出的线路就一直是同一条,那么这种模式就没有多少意义了。

需要交换机配置为port channel

第四种模式:mod=3,即:broadcast(广播策略)

这种模式的特点是一个报文会复制两份往bond下的两个接口分别发送出去,当有对端交换机失效,我们感觉不到任何downtime,但此法过于浪费资源;不过这种模式有很好的容错机制。此模式适用于金融行业,因为他们需要高可靠性的网络,不允许出现任何问题。

第五种模式:mod=4,即:(802.3ad) IEEE 802.3ad Dynamic link aggregation(IEEE 802.3ad 动态链接聚合)

在动态聚合模式下,聚合组内的成员端口上均启用LACP(链路汇聚控制协议)协议,其端口状态通过该协议自动进行维护。

负载均衡---基于指定的传输HASH策略传输数据包。默认算法与blance-xor一样。

容错能力---这模式的特点增加了带宽,同时支持容错能力,当有链路出问题,会把流量切换到正常的链路上。对比blance-xor,这种模式定期发送LACPDU报文维护链路聚合状态,保证链路质量。

需要交换机支持LACP协议

第六种模式:mod=5,即:(balance-tlb) Adaptive transmit load balancing(适配器传输负载均衡)

在每个物理接口上根据当前的负载(根据速度计算)分配外出流量。如果正在接收数据的物理接口口出故障了,另一个物理接口接管该故障物理口的MAC地址。

需要ethtool支持获取每个slave的速率

第七种模式:mod=6,即:(balance-alb) Adaptive load balancing(适配器适应性负载均衡)

该模式包含了balance-tlb模式,同时加上针对IPV4流量的接收负载均衡,而且不需要任何switch(交换机)的支持。接收负载均衡是通过ARP协商实现的。bonding驱动截获本机发送的ARP应答,并把源硬件地址改写为bond中某个物理接口的唯一硬件地址,从而使得不同的对端使用不同的硬件地址进行通信。

其实mod=6与mod=0的区别:mod=6,先把eth0流量占满,再占eth1,….ethX;而mod=0的话,会发现2个口的流量都很稳定,基本一样的带宽。而mod=6,会发现第一个口流量很高,第2个口只占了小部分流量

常用的模式为 0136

mode 1、5、6不需要交换机设置

mode 0、2、3、4需要交换机设置

案例

环境

系统:CentOS8

网卡名称: ens33(vmnet4) ens37(vmnet4)

step1

查看环境

[root@manage01 ~]# nmcli connection NAME UUID TYPE DEVICE ens33 f035d150-9e89-4ee9-a657-03598d4b0940 ethernet ens33 ens37 7726249d-8281-45e8-a8e3-a6a023c64c66 ethernet ens37

step2

创建bond虚拟网卡

[root@manage01 ~]# nmcli connection add type bond con-name bond0 ifname bond0 mode 1 ipv4.addresses 192.168.98.200/24 ipv4.method manual autoconnect yes #type:创建的类型,这里选择bond类型 #con-name:这里写链接名,就是show中第一列,这里写什么生成的文件就是什么名字 #ifname:网卡名,这里bond0是虚拟出来的 #mode:选择bond模式,常用的有主备,轮询,广播,还有其他模式,用tab补全可以看到所有,也可以使用数字0-6表示 #ipv4.mehod:表示自动还是手动,就是使用dhcp还是自己配置地址,关联配置文件中的BOOTPROTO段 #ipv4.address:设置ip地址,注意记得加上掩码 #autoconnect 自动连接

step3

为bond网卡添加成员(真实网卡)

[root@manage01 ~]# nmcli connection add type bond-slave ifname ens33 master bond0 连接 "bond-slave-ens33" (9fb9b3fa-a477-4a6f-a3c1-79cbfe351c7d) 已成功添加。 [root@manage01 ~]# nmcli connection add type bond-slave ifname ens37 master bond0 连接 "bond-slave-ens37" (2b047e49-b606-4b67-9e5c-f721f1e2ff7a) 已成功添加。 #类型为bond-slave,表示这块真实网卡属于一块附属的网卡,原有配置的属性都不能使用了,master表示这块从属网卡属于bond0这个组注意:如果你的网卡没有启用的话需要启用 [root@manage01 ~]# nmcli connection NAME UUID TYPE DEVICE bond0 55e0afdc-d2a6-4c93-b346-0ce207947b81 bond bond0 bond-slave-ens33 9fb9b3fa-a477-4a6f-a3c1-79cbfe351c7d ethernet ens33 bond-slave-ens37 2b047e49-b606-4b67-9e5c-f721f1e2ff7a ethernet ens37 ens33 f035d150-9e89-4ee9-a657-03598d4b0940 ethernet -- ens37 7726249d-8281-45e8-a8e3-a6a023c64c66 ethernet -- [root@manage01 ~]# ifconfig bond0: ether 00:0c:29:a6:ad:95 txqueuelen 1000 (Ethernet) ens33: ether 00:0c:29:a6:ad:95 txqueuelen 1000 (Ethernet) ens37: ether 00:0c:29:a6:ad:95 txqueuelen 1000 (Ethernet) [root@manage01 ~]# nmcli connection up bond-slave-ens33 连接已成功激活(D-Bus 活动路径:/org/freedesktop/NetworkManager/ActiveConnection/81) [root@manage01 ~]# nmcli connection up bond-slave-ens37 连接已成功激活(D-Bus 活动路径:/org/freedesktop/NetworkManager/ActiveConnection/82) [root@manage01 ~]# nmcli connection up bond0 连接已成功激活(master waiting for slaves)(D-Bus 活动路径:/org/freedesktop/NetworkManager/ActiveConnection/83) step4

查看链接信息并测试

#查看信息 [root@manage01 ~]# cat /proc/net/bonding/bond0 Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011) Bonding Mode: fault-tolerance (active-backup)#模式 Primary Slave: None Currently Active Slave: ens33 #当前设备 MII Status: up #启用状态 MII Polling Interval (ms): 100 Up Delay (ms): 0 Down Delay (ms): 0 Slave Interface: ens33 #从接口信息 MII Status: up Speed: 1000 Mbps Duplex: full Link Failure Count: 0 Permanent HW addr: 00:0c:29:a6:ad:95 Slave queue ID: 0 Slave Interface: ens37 #另外一个从接口信息 MII Status: up Speed: 1000 Mbps Duplex: full Link Failure Count: 0 Permanent HW addr: 00:0c:29:a6:ad:9f Slave queue ID: 0 或者 [root@manage01 ~]# ip add ens33: <BROADCAST,MULTICAST,SLAVE,UP,LOWER_UP> mtu 1500 qdisc fq_codel master bond0 state UP group default qlen 1000 link/ether 00:0c:29:a6:ad:95 brd ff:ff:ff:ff:ff:ff ens37: <BROADCAST,MULTICAST,SLAVE,UP,LOWER_UP> mtu 1500 qdisc fq_codel master bond0 state UP group default qlen 1000 link/ether 00:0c:29:a6:ad:95 brd ff:ff:ff:ff:ff:ff bond0: <BROADCAST,MULTICAST,MASTER,UP,LOWER_UP> mtu 1500 qdisc noqueue state UP group default qlen 1000 link/ether 00:0c:29:a6:ad:95 brd ff:ff:ff:ff:ff:ff inet 192.168.98.200/24 brd 192.168.98.255 scope global noprefixroute bond0 valid_lft forever preferred_lft forever #找到另外一台主机使用ping进行测试 [root@manage01 ~]# nmcli connection down bond-slave-xxx 或者直接断开虚拟的网络连接测试还能否ping通

删除

nmcli connection delete bond0 bond-slave-ens33 bond-slave-ens37注意:在配置聚合链路的时候如果使用虚拟机可能会弹出与mac地址相关的信息提示,可以暂时不用去管,如果测试的时候发现断网卡之后无法ping通,则需要在相关网卡配置文件中添加参数,如: [root@manage01 ~]# vim /etc/sysconfig/network-scripts/ifcfg-bond0 #添加一行内容 BONDING_OPTS="miimon=100 mode=1 fail_over_mac=1" #miimon:链路检查时间为100ms #mode:模式为1,要与bond的模式相同 #fail_over_mac=1 mac地址跟随正常工作的网卡,当第一块网卡挂掉之后,自动将mac地址调整为第二块网卡的mac 以上操作只有在虚拟机的环境中使用,生产环境一般不需要

team

step1

建立

[root@manage01 ~]# nmcli connection add type team con-name team0 ifname team0 config '{"runner":{"name":"activebackup","hwaddr_policy":"by_active"}}' ipv4.addresses 192.168.98.200/24 ipv4.method manual autoconnect yes #JSON语法格式如下:’{“runner”:{“name”:“METHOD”}}’其中METHOD 是以下的其中一个 broadcast=mode3 roundrobin=mode0 activebackup=mode1 loadbalance=mode256 lacp=mode4 #"hwaddr_policy":"by_active":硬件地址跟随活跃的网卡,也就是未故障的网卡 #聚合链路获取mac的地址有两种方式,一种是从第一个活跃网卡中获取mac地址,然后其余的SLAVE网卡的mac地址都使用该mac地址;另一种是使用hwaddr_policy参数,team使用当前活跃网卡的mac地址,mac地址随活跃网卡的转换而变,虚机不支持第一种获取MAC地址的方式。

step2

添加网卡

[root@manage01 ~]# nmcli connection add type team-slave ifname ens33 master team0 [root@manage01 ~]# nmcli connection add type team-slave ifname ens37 master team0

step3

启用连接

[root@manage01 ~]# nmcli connection up team-slave-ens33 [root@manage01 ~]# nmcli connection up team-slave-ens37 [root@manage01 ~]# nmcli connection up team0

step4

查看状态

[root@manage01 ~]# teamdctl team0 stat setup: runner: activebackup ports: ens33 link watches: link summary: up instance[link_watch_0]: name: ethtool link: up down count: 0 ens37 link watches: link summary: up instance[link_watch_0]: name: ethtool link: up down count: 0 runner: active port: ens37

测试

网络故障排查

在日常使用中,经常会出现无法连通的情况,这个时候我们就需要找到问题出在哪里,这里面给各位提供一个生产环境排查网络故障的大体思路,一般情况下如果遇到网络故障,都是通过筛选的方式一点一点地确定问题所在,首先判断是本机的问题还是网络上其它设备的问题,如果同一网络环境中的其它主机正常的,要去其它网络设备(路由器)上查看一下是否对网络有问题的主机设置了限制,如果没有的话,问题出在本机,这里面我们主要看下下本机容易出现哪些问题导致页面无法访问

1 网线和网卡

检查网卡的灯是否亮起,普通服务器的话应该是绿灯常亮为正常,交换机绿灯闪烁表示正在传输数据。也可以通过命令ethtool ethX来查看某一网卡的链路是否物理连通。

命令介绍

ethtool

[root@manage01 ~]# ethtool ens33 Settings for ens33: Supported ports: [ TP ] #接口类型 #TP RJ45接口双绞线 #AUI “D”型15针接口 #BNC 细同轴电缆接口,类似于以前的有线电视 #MII 媒体独立接口,一种以太网行业标准 #FIBRE 光纤 Supported link modes: 10baseT/Half 10baseT/Full 100baseT/Half 100baseT/Full 1000baseT/Full #支持的链接模式 Supported pause frame use: No #是否支持暂停帧--一种网卡流量控制技术 Supports auto-negotiation: Yes #是否支持自动协商,网络设备相互告知对方自己的工作方式,包括传输速度,双工状态等,然后选择一个最佳的 Supported FEC modes: Not reported #编码纠错模式,支持编码纠错可提高数据通讯可信度 Advertised link modes: 10baseT/Half 10baseT/Full 100baseT/Half 100baseT/Full 1000baseT/Full #宣告的链接模式 Advertised pause frame use: No #宣告的是否支持帧暂停 Advertised auto-negotiation: Yes #宣告的是否支持自动协商 Advertised FEC modes: Not reported #宣告的是否FEC Speed: 1000Mb/s #当前速度 Duplex: Full #全双工还是半双工 Port: Twisted Pair #线缆类型为双绞线 PHYAD: 0 #PHY地址,主要指PHY芯片,用来发送和接收数据帧 Transceiver: internal #收发器类型 internal/external(内部外部)是否是板载的 Auto-negotiation: on #自动协商功能开启 MDI-X: off (auto) #自适应功能 Supports Wake-on: d #是否支持远程唤醒 d=禁用,p\u\m\b\a\g=不同唤醒方式 Wake-on: d Current message level: 0x00000007 (7) drv probe link Link detected: yes #网卡已连接 ##############常用参数 #-a 查看网卡中 接收模块RX、发送模块TX和Autonegotiate模块的状态:启动on 或 停用off。主要指接收暂停,发送暂停和自动协商暂停功能,也就是暂停帧,主要用于控制数据路停止发送,可以防止瞬间压力过大导致缓冲区溢出而引发的帧丢失(丢包) #[root@manage01 ~]# ethtool -a ens33 Pause parameters for ens33: Autonegotiate: on RX: off TX: off #-A 修改网卡中 接收模块RX、发送模块TX和Autonegotiate模块的状态:启动on 或 停用off。 [root@manage01 ~]# ethtool -A ens33 rx/tx/autoneg on #-i 显示网卡驱动的信息,如驱动的名称、版本等。 [root@manage01 ~]# ethtool -i ens33 driver: e1000 version: 7.3.21-k8-NAPI firmware-version: expansion-rom-version: bus-info: 0000:02:01.0 supports-statistics: yes supports-test: yes supports-eeprom-access: yes supports-register-dump: yes supports-priv-flags: no #-k 显示网卡各项功能的支持和协议状态,如支持某个协议的功能是否开启等 #-p 用于区别不同ethX对应网卡的物理位置,常用的方法是使网卡port上的led不断的闪;N为网卡闪的持续时间,以秒为单位。 [root@manage01 ~]# ethtool -p ens33 10 #-r 如果自动协商状态为on,则重启自动协商功能。 [root@manage01 ~]# ethtool -r ens33 #-S 显示统计参数,如网卡接收/发送的字节数、接收/发送的广播包个数等。 [root@manage01 ~]# ethtool -S ens33 NIC statistics: rx_packets: 609 tx_packets: 130 rx_bytes: 121330 tx_bytes: 16066 rx_broadcast: 0 #-s 修改网卡的部分配置,包括网卡速度、单工/全双工模式、mac地址等。 ethtool –s ethX [speed 10|100|1000] #设置网口速率10/100/1000M [duplex half|full] #设置网口半/全双工 [autoneg on|off] #设置网口是否自协商 [port tp|aui|bnc|mii] #设置网口类型 [root@manage01 ~]# ethtool -s ens33 speed 1000 duplex full autoneg on port tp

2 selinux&防火墙

这两个是最容易产生干扰的项目,selinux和防火墙如何关闭,我们在前面的课程中有涉及,这里就不重复了

3 查看网卡ip地址,网关设置

使用ifconfig或者nmcli命令查看/设置ip地址和网关

4 使用ping命令测试连通性

-c<完成次数>:设置完成要求回应的次数; -f:洪水ping只有root可以使用 -i<间隔秒数>:指定收发信息的间隔时间; -n:只输出数值,不尝试去查找主机名 -s<数据包大小>:设置数据包的大小; -I 指定源地址(源地址必须是本地网卡上存在的配置) [root@rs1 ~]# ping -c 3 -i 0.5 -n -s 1024 -I 192.168.2.220 192.168.2.220 PING 192.168.2.220 (192.168.2.220) from 192.168.2.220 : 1024(1052) bytes of data. 1032 bytes from 192.168.2.220: icmp_seq=1 ttl=64 time=0.047 ms 1032 bytes from 192.168.2.220: icmp_seq=2 ttl=64 time=0.060 ms 1032 bytes from 192.168.2.220: icmp_seq=3 ttl=64 time=0.053 ms --- 192.168.2.220 ping statistics --- 3 packets transmitted, 3 received, 0% packet loss, time 13ms rtt min/avg/max/mdev = 0.047/0.053/0.060/0.008 ms

5 路由

使用route命令查看或设置路由及网关,也可以通过修改静态路由配置文件实现

6 DNS

/etc/hosts&/etc/resolv.conf

nslookup

dig

host

7追踪数据包

tracepath [参数选项] hostname,域名或 IP地址 #替代了以前的traceroute 参数选项: -4 使用IPV4 -6 使用IPV6=tracepath6 -l 设置初始包的大小 默认IPV4 65535,ipv6 128000 -m 设置检测数据包的TTL,默认值为30次; -n 显示IP地址,不查主机名。当DNS不起作用时常用到这个参数; -b 显示主机名和IP地址 -p port 探测包使用的基本UDP端口设置为port ,默认值是33434 [root@rs1 ~]# tracepath -b -l 1000 -m 5 1: localhost (192.168.0.1) 18.324ms 2: localhost (192.168.1.1) 15.622ms 3: localhost (10.70.0.1) 18.640ms 4: 114.244.94.25 (114.244.94.25) 7.213ms 5: 124.65.56.141 (124.65.56.141) 16.020ms Too many hops: pmtu 1000 Resume: pmtu 1000

8硬件故障

更换硬件

总结

bond的方式实现方法

team的方式实现方法

网络故障排查的思路

网络故障的排除方法

重点:两种不同的聚合链路的实现方式,网络故障的排查思路、网络故障排查时涉及到的相关工具

难点:能够独立完成bond和team的两种实现方式,网络故障排查过程中所涉及到的命令,及应用方向