华为交换机堆叠技术
华为交换机堆叠技术
十二、堆叠多主检测
由于堆叠系统中所有成员交换机都使用同一个IP地址和MAC地址(堆叠系统MAC),一个堆叠分裂后,可能产生多个具有相同IP地址和MAC地址的堆叠系统。为防止堆叠分裂后,产生多个具有相同IP地址和MAC地址的堆叠系统,引起网络故障,必须进行IP地址和MAC地址的冲突检查。
多主检测MAD(Multi-Active Detection),是一种检测和处理堆叠分裂的协议。链路故障导致堆叠系统分裂后,MAD可以实现堆叠分裂的检测、冲突处理和故障恢复,降低堆叠分裂对业务的影响。
1.MAD检测方式
MAD检测方式有两种:直连检测方式和代理检测方式。在同一个堆叠系统中,两种检测方式互斥,不可以同时配置。
1.1、直连检测方式
直连检测方式是指堆叠成员交换机间通过普通线缆直连的专用链路进行多主检测。在直连检测方式中,堆叠系统正常运行时,不发送MAD报文;堆叠系统分裂后,分裂后的两台交换机以1s为周期通过检测链路发送MAD报文以进行多主冲突处理。
直连检测的连接方式包括通过中间设备直连和堆叠成员交换机Full-mesh方式直连:
图3 通过中间设备的直连检测方式
1.1.1、通过中间设备直连
如上图3所示,堆叠系统的所有成员交换机之间至少有一条检测链路与中间设备相连。
图4 堆叠成员交换机Full-mesh方式直连
1.1.2、Full-mesh方式直连
如上图4所示,堆叠系统的各成员交换机之间通过检测链路建立Full-mesh全连接,即每两台成员交换机之间至少有一条检测链路。
通过中间设备直连可以实现通过中间设备缩短堆叠成员交换机之间的检测链路长度,适用于成员交换机相距较远的场景。与通过中间设备直连相比,Full-mesh方式直连可以避免由中间设备故障导致的MAD检测失败,但是每两台成员交换机之间都建立全连接会占用较多的接口,所以该方式适用于成员交换机数目较少的场景。
接口配置直连多主检测功能后,不能再配置其他业务。为保证可靠性,成员交换机之间最多可以配置8条直连检测链路。由于MAD报文是BPDU报文,采用通过中间设备的直连检测方式时,在直连检测链路的中间设备上需要配置转发BPDU报文,配置方法请参见后面将要发布的基于接口的二层协议透明传输章节。
1.2、代理检测方式
代理检测方式是在堆叠系统Eth-Trunk上启用代理检测,在代理设备上启用MAD检测功能。
此种检测方式要求堆叠系统中的所有成员交换机都与代理设备连接,并将这些链路加入同一个Eth-Trunk内。与直连检测方式相比,代理检测方式无需占用额外的接口,Eth-Trunk接口可同时运行MAD代理检测和其他业务。
在代理检测方式中,堆叠系统正常运行时,堆叠成员交换机以30s为周期通过检测链路发送MAD报文。堆叠成员交换机对在正常工作状态下收到的MAD报文不做任何处理;堆叠分裂后,分裂后的两台交换机以1s为周期通过检测链路发送MAD报文以进行多主冲突处理。
图5 单机作代理设备的代理检测方式
图6 两套堆叠系统互为代理的代理检测方式
根据代理设备的不同,代理检测方式可分为单机作代理(如上图5)和两套堆叠系统互为代理(如上图6)。
代理设备必须为支持MAD代理功能的交换机,设备支持两套堆叠系统互为代理进行多主检测,此时必须通过配置保证两套堆叠系统的堆叠域的域编号(Domain ID)不同。
组成一个堆叠系统的交换机构成一个堆叠域。一个网络中可以部署多个堆叠系统,因此会有多个堆叠域,不同的堆叠域的域编号不同。
当有9台设备堆叠时,由于每个Eth-Trunk最多加入8个成员接口,导致一个Eth-Trunk不能包含所有的成员交换机。此时需要配置多个Eth-Trunk,来保证任意两台成员交换机之间都有检测链路。
图7 在多个Eth-Trunk上配置代理检测
如上图7所示,Switch1-8配置在Eth-Trunk1里,Switch2-9配置在Eth-Trunk2里,Switch1和Switch9配置在Eth-Trunk3里。
2.MAD冲突处理
堆叠分裂后,MAD冲突处理机制会使分裂后的堆叠系统处于Detect状态或Recovery状态。Detect状态表示堆叠正常工作状态,Recovery状态表示堆叠禁用状态。
MAD冲突处理机制如下:MAD分裂检测机制会检测到网络中存在多个处于Detect状态的堆叠系统,这些堆叠系统之间相互竞争,竞争成功的堆叠系统保持Detect状态,竞争失败的堆叠系统会转入Recovery状态;并且在Recovery状态堆叠系统的所有成员交换机上,关闭除保留端口以外的其它所有物理端口,以保证该堆叠系统不再转发业务报文。
3.MAD故障恢复
通过修复故障链路,分裂后的堆叠系统重新合并为一个堆叠系统。重新合并的方式有以下两种:
堆叠链路修复后,处于Recovery状态的堆叠系统重新启动,与Detect状态的堆叠系统合并,同时将被关闭的业务端口恢复Up,整个堆叠系统恢复。
如果故障链路修复前,承载业务的Detect状态的堆叠系统也出现了故障。此时,可以先将Detect状态的堆叠系统从网络中移除,再通过命令行启用Recovery状态的堆叠系统,接替原来的业务,然后再修复原Detect状态堆叠系统的故障及链路故障。故障修复后,重新合并堆叠系统。
十三、堆叠主备倒换
图1 主备倒换前后成员交换机角色的变化
堆叠主备倒换包括主交换重启引起的主备倒换和通过命令行执行的主备倒换。堆叠主备倒换后,系统内各个成员交换机角色的变化如上图1所示:
1、原来的备交换机升为主交换机。
2、新主交换机重新指定备交换机。
3、原来的主交换机重启后重新加入堆叠系统,并被选举为从交换机。
十四、堆叠升级
堆叠升级方式有三种:智能升级、传统升级和平滑升级。
1.智能升级
在堆叠建立时或新成员交换机加入堆叠时,备从交换机或新加入的成员交换机会与主交换机的软件版本进行比较,如果不一样,会自动从主交换机下载系统软件,并以新的系统软件重启后重新加入堆叠系统。
2.传统升级
先配置启动的系统软件,然后整个堆叠系统重启进行升级,这种升级方式会导致较长时间的业务中断,适用于对业务中断时间要求不高的场景。
3.平滑升级
图1 堆叠系统平滑升级组网图
如上图1所示,平滑升级是指在堆叠系统上行及下行链路形成备份的组网中,将堆叠系统划分成active区(主交换机所在的区域)和backup区两个相互备份的流量区域。
启动升级后,两个区域依次进行升级,以保证其中一个区域的流量不会中断,减少因升级对业务造成的影响。平滑升级方式适用于对业务中断时间要求较高的场景。
上行及下行链路形成备份的组网是指上行和下行的流量都会流经active区和backup区两个区域,当backup区的成员交换机升级时,流量从active区传输,当active区的成员交换机升级时,流量从backup区传输。
堆叠系统平滑升级要求堆叠上行及下行链路为备份组网,为确保后续升级维护成功,建议每台成员交换机至少有一条链路加入跨设备Eth-Trunk。
3.1、平滑升级对堆叠系统和组网的要求:
① 组网方式是上下行链路形成备份的组网。
② 确保堆叠系统下次启动的系统软件版本支持平滑升级。
③ 确保堆叠系统各成员设备中当前启动的系统软件完全一致,包括文件名、版本号及存储路径。
④ 确保堆叠系统各成员设备中下次启动的系统软件完全一致,包括文件名、版本号及存储路径。
3.2、平滑升级划分区域的原则:
① backup区成员和active区成员交换机不能有重叠,且成员交换机个数都不能为0。
② backup区不能包含主交换机。
③ backup区和active区各自的成员交换机在堆叠拓扑中要相互连接,中间不能断开。
④ backup区的成员交换机和active区的成员交换机构成整个堆叠系统。
图2 区域划分示意图
例如,上图2所示,堆叠ID为1的设备为主交换机。如果指定堆叠ID为4~3为backup区,backup区的成员交换机只能为4、6、5、3,active区的成员交换机为1、2。
3.3、平滑升级过程
① 主交换机下发命令触发整个堆叠系统进入平滑升级状态,backup区各个成员交换机以新的系统软件进行启动。
② backup区以新版本建立一个独立的堆叠系统,并通知active区进入升级阶段,主控权由active区的主交换机转移到backup区的主交换机,backup区负责流量传输,active区进入升级过程。
③ active区以新系统软件重新启动并加入backup区的堆叠系统,backup区的主交换机根据最终堆叠建立的结果发布升级的结果。
如果平滑升级过程中出现错误、异常或者升级过程超时(超时时间为70分钟),堆叠系统会自动进行回滚处理,切换为原来的启动系统软件后重新建立堆叠系统。
十五、堆叠应用场景
1.扩展端口数量
图1 扩展端口示意图
如上图1所示,当接入的用户数增加到原交换机端口密度不能满足接入需求时,可以通过在原有的堆叠系统中增加新的交换机而得到满足。
2.扩展带宽
图2 扩展带宽示意图
如上图2所示,当交换机上行带宽增加时,可以增加新交换机与原交换机组成堆叠系统,将成员交换机的多条物理链路配置成一个聚合组,提高交换机的上行带宽。
3.简化组网
如上图3所示,网络中的多台设备组成堆叠,虚拟成单一的逻辑设备。简化后的组网不再需要使用MSTP等协议,简化了网络配置,同时依靠跨设备的链路聚合,实现快速收敛,提高了可靠性。
4.长距离堆叠
图4 长距离堆叠示意图
如上图4所示,每个楼层的用户通过楼道交换机接入外部网络,现将各相距较远的楼道交换机连接起来组成堆叠,这相当于每栋楼只有一个接入设备,网络结构变得更加简单。每栋楼有多条链路到达核心网络,网络变得更加健壮、可靠。对多台楼道交换机的配置简化成对堆叠系统的配置,降低了管理和维护的成本。
十六、堆叠连接方式
设备组建堆叠有两种连接方式:
1.堆叠卡堆叠
设备之间通过专用的堆叠插卡ES5D21VST000及专用的堆叠线缆连接。堆叠卡集成到了设备后面板上,设备通过集成的堆叠端口及专用的堆叠线缆连接。
图1 业务口堆叠连接示意图
2.业务口堆叠
设备之间通过与逻辑堆叠端口绑定的物理成员端口相连,不需要专用的堆叠插卡。业务口堆叠涉及两种端口的概念,如上图1所示:
2.1、物理成员端口
成员交换机之间用于堆叠连接的物理端口。物理成员端口用于转发需要跨成员交换机的业务报文或成员交换机之间的堆叠协议报文。
2.2逻辑堆叠端口
逻辑堆叠端口是专用于堆叠的逻辑端口,需要和物理成员端口绑定。堆叠的每台成员交换机上支持两个逻辑堆叠端口,为stack-port n/1和stack-port n/2,其中n为成员交换机的堆叠ID。
相连的两台堆叠设备之间不能有其他的交换机。
end
推荐阅读
>>>【必备干货】网工入门必会桥接教程,外网+GNS3+Vmware
网工界市场认可度极高的华为认证,你考了吗?
拿下华为HCIE认证之后,你可以:
跨越90%企业的招聘硬门槛
增加70%就业机会
拿下BAT全国TOP100大厂敲门砖
体系化得到网络技术硬实力
技术大佬年薪可达30w+
资源放送
2022新版华为思科双厂商认证18集小白入门到进阶实战课,扫描下方二维码,即可观看: