摘要:
研究背景 随着云计算和大数据应用的快速发展,高性能计算在行业中越来越受欢迎,其在数据中心领域的应用也在不断增加。数据中心网络(Distributed Service Network, DCN)是云计算的关键基础设施,提供基本的云服务。随着网络规模的扩大和复杂性的增加,数据中心网络不可避免地会出现故障,故障的存在可能会减缓数据之间的通信速度,容错性在DCN的运行中变得越来越重要。容错路由是一种必不可少的冗余技术,可提高网络中高效数据传输和安全通信的性能,为DCN的稳定运行提供了保障。RRect是一种以服务器为中心的DCN,具有良好的互连结构。RRect 不仅保持了 BCube 的许多优良性质,而且更灵活,也可通过微调一些参数以适应下一代数据中心网络建设需求。
目的 研究并设计数据中心网络RRect在条件故障模型, 1-,2-限制连通度下的容错单播路径构造算法。相较于传统的连通度的定义而言,1-限制连通度和2-限制连通度更接近于大多数网络的实际故障情形。当网络出现故障时,如何得到两个无故障顶点间的一条没有任何故障的路径?这是容错单播路径所需要考虑的问题。因此,本文中我们将针对RRect在条件故障模型, 1-,2-限制连通度下的容错路由问题进行研究。
方法 首先研究RRn,m,k的1-,2-限制连通度。在此基础上提出容错单播路径构造算法RRFP,并分析算法的时间复杂度,最后通过实验对算法RRFP的性能进行分析。
结果 文章从四个方面评估了算法RRFP的性能:执行时间、构建路径长度、传输失败率(TFR)和可扩展性。算法执行时间. 当改变参数n, k时:RRFP在1-限制连通度下,相较于Dijkstra有84%的提升,相较于BFS有71%的提升;在2-限制连通度下,RRFP相较于Dijkstra有68%的提升,相较于BFS有56%的提升。当改变参数m时,三者运行时间都很小。构造路径长度. 当改变参数时,RRFP在1-限制连通度下,相较于BFS有19%的提升,在2-限制连通度下,RRFP相较于BFS有12%的提升。此外,RRFP构造的路径长度接近于Dijkstra最短路径。传输失败率. 从纵向的角度来看,即网络规模不断扩大,RRFP的TFR持续降低,说明传输故障率持续降低,可靠性持续提高。从横向的角度来看,对于网络本身,基于给定的条件故障模型,随着故障节点数量的增加,TFR的变化不显著,并保持在接近0,范围从0.01到0.02。这说明增加故障节点的数量并不会增加算法的整体传输失败率。我们可以得出结论,即使增加了故障节点的数量,RRFP算法仍然可以保持较低的TFR和较高的可靠性。此外,路径故障率随着服务器/交换机故障率的增加而增加。结果表明,当故障比低于1%时,路径故障率接近于 0,表现了RRect结构的健壮性。当服务器/交换机故障率达到12%时,路径故障率也很小,说明RRect也具有很好的容错能力。此外,实验表明:服务器故障条件下的路径故障率低于交换机故障条件下的路径故障率。可扩展性. 由于RRect是一个递归构造的模块化的数据中心网络,我们的算法适用于这系列递归构造的新数据中心网络,如RCube、BCCC、GBC3等。因此,该算法在可扩展性方面具有突出的性能。
结论 本文提出了一种针对RRect的条件故障模型下的容错路由构造算法。首先,将故障模型建立为1,2-限制连通度,结果表明这大约是其传统连通度的2-3倍。当对大规模RRect网络进行逻辑化时,该结果可以为网络容错提供优越的准确度。其次,在此基础上,提出了故障模型1,2-限制连通度下的容错路由算法。实验结果表明,在运行时间方面,随着参数n和k的变化,RRFP的表现优于Dijkstra,提高了64%至84%,RRFP的表现优于BFS,提高了56%至71%。随着参数m的变化,所有三种算法的运行时间都很小。在平均路径长度方面,随着参数的变化,RRFP的性能优于BFS,提高了12%至19%。此外,RRFP构建的路径正在接近Dijkstra的最短路径。此外,增加故障元素数量时,算法RRFP仍然可以保持低TFR。为了进一步扩展本文的工作,我们将在容错的基础上探索RRect的容错哈密顿性质。