数据中心网络性能:新应用下的新需求

讯石光通讯网
iccsz  
随着机器学习,大数据,云计算和NFV不断完善,数据中心网络性能也随之发展。亚马逊,谷歌,百度和腾讯等大型云服务提供商已更新提供IT服务的方式,使之功能更强大,速度更敏捷,灵活性更高。这敲响了传统运营商的警钟,AT&T技术与运营首席策略官John Donovan 表示,AT&T致力于成为“世界上最具侵略性的IT公司”。OTT产品在业界的应用已变得普遍,应用和服务开发都需要创新完善。

随着机器学习,大数据,云计算和NFV不断完善,数据中心网络性能也随之发展。亚马逊,谷歌,百度和腾讯等大型云服务提供商已更新提供IT服务的方式,使之功能更强大,速度更敏捷,灵活性更高。这敲响了传统运营商的警钟,AT&T技术与运营首席策略官John Donovan 表示,AT&T致力于成为“世界上最具侵略性的IT公司”。OTT产品在业界的应用已变得普遍,应用和服务开发都需要创新完善。

他表示:“厂商正在逐渐成为竞争对手,过去的竞争对手变为开源开发等领域的合作伙伴。整个行业的工作方式正在发生变化。我们在标准机构这个平台上共同管理,交流意见解决问题、制作产品。每个参与者都要在规则内,在竞争中合作。”

基于了未来发展和竞争现状,诸如AT&T这样的运营商已经拥抱NFV和分布式计算,以支持应用交付、机器学习和大数据分析来管理基础设施。这些演变需要在数据中心不断发展的前提下实现,以确保大型数据集和IO密集型工作负载的性能。

普通于云计算的企业工作负载是计算密集型的,但不一定是IO密集型。因此,使用NFV和云计算的通信应用程序需要更高要求的网络结构。运用NFV的运营商,需要收集大量在网络的虚拟和物理层的实时数据。

Global Data首席分析师Peter Jarich解释说:“我们致力于实现可以查找任何字节,操作,捕获,重写;通过网络端到端的每个数据包进行时间戳,对交换机中的缓冲进行连续的实时监控。”

性能杠杆:带宽速度

随着对海量数据传输和网络瞬间数据传输的研究逐渐深入,我们发现影响系统性能的原因有两个:原始吞吐量和延迟。

为了解决原始吞吐量的问题,大容量服务器正在重新定义数据中心内的架构和经济模型。我们对提高服务器速度进行投资,使之从10Gb / s提高到25Gb / s以上,提高组织带宽和消息速率升。跟10Gb / s的相比25Gb / s的带宽提高2.5倍,成本在1.3X到1.5X之间。

Gartner数据中心融合和数据中心实践副总裁兼分析师Joe Skorupa表示“从经济角度来看,此举意义重大,现行的25 Gb / s和50 Gb / s服务架构将转换为50 Gb / s和100 Gb / s的网络连接,与此同时光网络成本也在下降 。40Gb / s连接需要四条10 Gb / s的通道,今天的50Gb / s连接由25b / s链路即可,速度的提升意味着价格下降,因为交换机端口和光纤成本都会下降。“

在数据中心互连方面,容量是影响性能的重要因素。例如,移动边缘计算正在成为趋势,因为运营商希望使用机器学习和人工智能来管理具有更多分布式节点的网络。

Jarich指出:“过去,每两百个基站都有一个EPC节点,所以在美国传统的分组核心中将有十几个站点。现在,您可能有成千上万的站点,因为用户需要更多的带宽将其链接到核心。如果我们要在数据中心的网络边缘实施大量的分析和控制,那么我们必须快速提升分析速度和控制的灵活度。”

降低延迟的架构

考虑到延迟的因素,内部数据中心拓扑也在变化,老式的三层设计被leaf-spine的设计所取代,这种设计方式专门用于大数据行业,如不断发展的电信数据中心。传统的三层模式由核心路由器,聚合路由器和接入交换机组成,通过冗余路径互连。但一般只有一个主要路由,只有在主要路由中断的情况下才启动备份路径。

下一代配置中设有两层leaf-spine。leaf层由连接到服务器,防火墙,负载平衡器和边缘路由器等设备的接入交换机组成。spine层由执行路由的骨干交换机组成。每个leaf交换机与每个spine交换机互连,构成网格拓扑,这意味着所有设备的距离包含了信息传播所需的可预测的延迟量。动态路由根据网络变化确定和调整最佳路径。

Skorupa说:“此举显着降低成本的同时提供了大量的横截面带宽,传输大量数据不成问题。我们相信很快也可以50 Gb / s服务器中得到应用。”

即使是在传输少量数据时,高速连接也十分重要。Skorupa解释说:“当您的工作负载传递少量延迟敏感的数据时,从10 Gb / s转为25 Gb / s就有了用武之地。 网络延迟可能只占用了百分之五的时间,但是在10Gb / s连接线缆需要2.5%乃至更长的时间,转换为25 Gb / s意味着从一个节点到另一个节点的所需时间的缩短。所有的这些都使得这些新应用程序更加易于运转。”

从vSwitch卸载(offload)

影响分布式和虚拟化应用程序延迟的另一个问题是虚拟交换机(vSwitch)的性能不足。

Skorupa表示:“当您查看广域网优化和虚拟防火墙等服务时,推出了大量的开放源代码,这是vSwitch的一个性能问题。我们可以通过将一些交换功能迁移到网卡(NIC)中,或者购买更多的服务器,但这会对NFV的投资回报率产生负面影响。

offload的策略减轻了CPU的工作量。通过移动到支持高级内核旁路技术的技术栈实现最低延迟并显着提高数据传输速率。

消息加速软件等辅助技术有助于实现这一点,它可以降低总体延迟并最小化CPU工作负载来提高应用程序的性能。此外,数据平面开发套件(DPDK)提供了一个可编程架构,能够优化应用程序与NIC通信的数据路径。与此同时,它能够更快地处理数据包,这对处理大量以太网数据包处理或高消息速率的应用程序(如虚拟化网络功能)尤为有益。

Jarich表示:“运营商越来越乐于拥抱云计算,尤其是当他们搭建5G网络并具有较大工作量时。移动分布式计算的可带来更低的延迟,回程节省,更高的可管理性,因此深受运营商青睐。”



THEEND