超级剧透季六: 可编程白盒交换机,云数据中心“新基建”变革的推手

发表时间:2021-12-17

  返回列表

如果说20年前,提起“基建”国人心中第一反应是公路、铁路、机场、桥梁的大建快上,那么未来20年,支撑中国经济繁荣发展的“新基建”则是基于数据中心、云计算、5G、人工智能等科技领域基础设施的大规模建设。

作为云计算、人工智能、5G技术的支撑载体,数据中心自然是“新基建”的核心底座,是未来云网融合发展的战略性基础资源。其中,云计算数据中心又是其中发展最快的一个分支。云计算数据中心,简称云数据中心,是一种基于云计算架构,高度虚拟化、自动化、节能化的新型数据中心。与传统数据中心机房与IT系统相互割裂不同,新一代云数据中心更加强调与IT系统的协同调配能力,通过集约化管理实现虚拟资源的动态配置,用户可以按需调用资源,并自动进行流程化管理,包括对物理服务器、虚拟服务器的管理,对相关业务的管理、对客户计费的自动化管理等等。

云数据中心“新基建”面临的困境
近几年,云数据中心的发展势头可以用高歌猛进来形容,年增速一度超过40%。在规模化商用以及新技术迅猛发展的同时,云数据中心网络发展也面临诸多困境和问题。


- 流量激增带来前所未有的带宽压力
随着流量的爆发和云计算、人工智能等技术的大规模应用,云数据中心对外南北向以及对内东西向流量均迎来大爆发。特别值得一提的是,虚拟化以及大量分布式应用的迁入,促使云数据中心流量模型急速变化,数据和应用从原来的单一分布转变到分布在成千上万个服务器上,导致网络内部东西向流量激增并占据总流量的90%以上,给网络架构带来了巨大的转发压力。高带宽、低时延、低抖动成为衡量数据中心服务质量的关键指标。

- 网络基础设施需要适应灵活多变的网络业务
不同于传统数据中心,IT 能力是云数据中心的核心竞争力,快迭代速、更开放的管控能力,以及更灵活的业务部署能力,是新一代云数据中心基础设施建设的基本特征。如何适应云计算灵活多变的业务场景,快速构建大规模资源池,利用多中心资源统一调配管理,让业务快速弹性上线,是云数据中心网络基础设施必须跨过的槛。


- 急需统一化、智能化网络运维管理
大规模和超大规模建设是云数据中心未来发展的大趋势,目前来看,单个大规模云数据中心机柜数量在4000至100000万之间,数量惊人。另外,云化以及NFV技术的发展,网络动态感知VM的动态迁移及应用的弹性扩缩,频繁的配置变化,传统黑盒模式下不同厂家设备型号难以互通,运维界面不统一,自动化程度低,故障难以定位等等,多方面因素叠加,让云数据中心网元管理对象和管理难度大幅度增加,传统网络运维手段已无法适应云数据中心网络的发展。

面对以上问题,在OCP、ONF和ODCC等联盟的大力推动支持下,可编程白盒设备以其开放开源、高性价比、快速迭代和智能定制化的特性成为新一代云数据中心基础设施的最佳配置选择。由于特有的软硬件解耦及可编程特性,在网络配置中可编程白盒设备可作为交换机、防火墙、网关等设备使用,其中云数据中心交换机是最典型的应用之一。

可编程白盒设备,赋能云数据中心交换机

通常,传统数据中心采用三层网络架构,即接入层、汇聚层和核心层,通过接入交换机、汇聚交换机和核心交换机进行各层之间的数据交换。

  • 接入交换机主要负责服务器物理机和虚拟机的接入。

  • 汇聚交换机连接接入交换机,同时承担一部分网关的作用。

  • 核心交换机连接多个汇聚交换机,主要负责对进出数据中心的流量进行高速转发。


这种网络架构,存在带宽浪费、故障影响范围大、网络可扩展性差等诸多弊端。对新一代云数据中心而言,为了适应云服务快速扩展和高带宽低时延的要求,云数据中心采用Spine-Leaf网络架构,Leaf交换机相当于接入交换机,Spine交换机相当于核心交换机。Spine-Leaf架构中,东西向流量和南北向流量处理模式一致,可以实现流量的无阻塞转发。同时, Spine-Leaf架构具备很好的横向扩展能力,能确保网络的高可靠性。

在Spine-Leaf架构中,可编程白盒交换机完全可以替代传统交换机,承担接入交换机和核心交换机的角色。以恒扬PS系列可编程白盒设备为例,旗下PS7252系列、PS7350系列、PS8465系列可以满足Leaf节点需求,而PS7350系列、PS8550系列、PS8560系列、PS8350系列可满足Spine节点需求。

按照PS7252系列作为 Leaf节点、PS7350系列作为Pod Spine节点,组成一个Pod的Spine-Leaf结构。该Pod中最多可支持24*32=768台服务器,当一个Pod的容量已满,通过增加Pod的方式,并用Spine将这些Pod连通,即可实现网络的继续扩容。

可编程白盒设备为云数据中心交换机带来的价值:

1.  协议无关性的转发:恒扬PS可编程白盒设备完全开源,运行开源SONiC操作系统,使用P4语言自定义包解析器、匹配-动作表的匹配流程和流控制程序实现自有数据中心不同网络数据平面协议和数据包处理行为。

2.  软硬件解耦的开源环境:用户不需要关心底层硬件的细节就可通过P4前后端编译器(前端编译器将P4高级语言程序转换成中间表示IR(Intermediate Representation),后端编译器将IR编译成设备配置)来自动配置目标设备。

3.  模块化的设计提供灵活的重构平台:P4语言的编译器采用了模块化的设计,通过IR实现各个模块之间的输入输出都采用标准格式的配置文件,在开源系统中允许用户随时改变包解析和处理的程序 ,并在编译后配置交换机,真正实现现场可重配能力。