欢迎user
自2006年AWS开始以网络服务的形式向企业用户提供云服务以来,云计算已经走过了蓬勃发展的16年。根据Gartner统计,2021年全球公有云市场(Iaas、Paas、SaaS)规模达到3307.69亿美元。随着市场的繁荣,云计算作为新兴的技术,也引领了计算、网络、存储等领域的技术发展。
云数据中心网关演进历程
近年来,数据中心的网络互联的带宽已经从10G/40G,增长到了100G/400G,云数据中心的东西向流量达到数百T级别。各大云计算厂商为实现功能丰富的云计算产品,例如VPC、EIP、SLB、NAT等,开发了各类NFV网关,以实现云上网络的互联互通。回首十几年云网络的发展,与传统网络类似,都经历了从“软”到“硬”再到“软”“硬”融合的历程。
最初,云上网关采用X86服务器和DPDK技术,实现overlay网络的隧道封装、路由、NAT、限速等功能;利用DPDK技术,可以实现非常灵活的数据面编程,在用户态转发报文以加速网络。后来业界开始采用专用硬件做网络加速,例如使用各类DPU、智能网卡等,释放出的宝贵的CPU算力。
图1:H3C Server-Switch超融合可编程网关
随着可编程交换芯片的出现,业界逐渐开始采用可编程交换芯片扩展系统的数据处理能力,利用灵活的Pipeline编程,实现复杂的云上网络功能。ASIC交换芯片拥有很大的交换容量,常见的有6.4T/12.8T等,对于一个同等级别的服务器集群来说,一般需要几十台到一百余台的服务器能力,才能实现T级别的网络处理能力,因此使用可编程交换机可以极大的节省服务器集群的成本。但是,仅使用可编程ASIC也存在一定的限制,由于交换芯片使用片内有限的TCAM/SRAM硬件资源存储转发表项,因此表项容量限制了网络的规模。
针对可编程交换机的限制,H3C推出了Server-Switch超融合可编程网关产品,Server-Switch拥有媲美服务器的计算能力,和性能堪比交换机的转发能力,同时支持选配FPGA卡,用户可以通过编程扩容转发表项。
图2:超融合可编程网关架构图
Server-Switch融合了高性能的CPU,高带宽和Pipeline可灵活编程的交换机ASIC,以及功能丰富的FPGA器件。可编程交换芯片负责网络功能的卸载和数据面的报文转发,基于PISA架构的交换芯片,Pipeline可以由用户自行编程,很容易实现复杂的数据面转发逻辑,对于想要开发新协议的用户来说,可编程芯片可以方便的进行新协议的验证。由于数据面可编程,用户也可以在报文中加入自定义字段,用于携带某些网络信息。例如,可以自定义加入时间戳、丢包、时延、Buffer等信息,用于报文随流检测。对于对网络要求很高的应用,可以更好的反应业务的真实网络情况,将逐流的信息收集后,可以从全局视角对网络进行优化。
对于首包或交换芯片Hit Miss的数据报文,通过内部以太网互联的网卡,复用成熟的DPDK转发逻辑,通过用户态编程,实现软件转发。软转完成后,CPU将对应表项通过PCIe下发到交换芯片硬件。另外对于ARP等一些协议报文,同样复用原有DPDK代码,避免重复造轮子。对于需要超大规格表项的场景,交换芯片上的TCAM和SRAM资源就会捉襟见肘,尽管可以通过Pipeline折叠等方法缓解,但对于云上某些需要超大表项的场景依旧不能满足业务需求。通过模块化的设计,Server-Switch超融合网关可以针对超大表项场景按需选配FPGA卡,用于扩展可编程交换芯片的硬件表项。对于一般场景,可以无需FPGA卡,节省用户投资。
Server-Switch典型应用场景
Server-Switch的优势在于软硬件融合的能力,在拥有海量接口带宽的同时,还具备灵活的可编程能力与高性能的计算能力。因此Server-Switch非常适合用于对带宽需求很高的云网关场景。例如,专线网关、云互联网关、负载均衡网关等。云网关的北向对接云平台,接受云平台的统一业务编排。通过云平台的SDN控制器向云网关下发流表,实现复杂的网络转发逻辑。高性能CPU作为网关的控制平面,实现业务逻辑。可编程芯片作为网关的数据平面,卸载网络功能,实现T级的流量转发。FPGA芯片可用于扩展流表、Session表项。对于T级别的流量,使用超融合可编程网关可以替代数十台的服务器集群,极大降低成本。
图3:Server-Switch组件示意图
专线网关负责连接公有云VPC与租户云下IDC,负责云上云下数据互通。专线网关需要海量带宽资源用于用户接入,同时也要具备区分租户网络的能力。专线网关负责overlay隧道的封装与解封装,用于与VPC网络互通。对于大客户而言,上云专线带宽可以达到T级别,另外云上云下存在海量路由交互。使用超融合可编程网关,可以有效支撑云上的百万VPC和路由表。
图4:专线接入网关逻辑图
云互联网关负责租户VPC与其他VPC、VPN网关、专线网关等其他组件互通,也提供跨Region的互联互通能力。因此在公有云网络中,云互联网关集群也需要高带宽资源用于网络互通。同时云互联网关需要承载海量路由,采用超融合可编程网关可以满足业务苛刻的需求。
图5:云联网网关逻辑图
负载均衡网关主要指4层负载均衡,用于IDC中underlay网络或云上overlay网络的服务器流量负载均衡。对于互联网服务提供者而言,四层负载均衡网关承载了对外提供服务的所有流量,因此4层负载均衡网关对于互联网企业的重要性不言而喻。一方面,海量的业务流量对负载均衡的网络性能提出了很高的要求;另一方面,在精细化运营的潮流下,如何在保证业务稳定的情况下减少CAPEX和OPEX,也成为了企业考虑的因素。使用Server-Switch超融合可编程网关,单台设备即可提供数T级别的流量承载能力,可以有效节省企业开支。在功能实现上,通过可编程硬件的能力,实现数据面快慢路径分离,将常用流量转发表项下发至交换芯片硬件,实现业务网络加速。由于交换芯片硬件资源有限,在交换芯片硬件上存储的表项也存在一定限制。H3C Server-Switch提供扩展FPGA卡的能力,最大可支持4块FPGA卡,用户可以通过编程,在FPGA卡中存储海量Session表项。
展望
本文总结了超融合网关的发展历程和主要应用场景,在云原生时代,新华三集团将继续秉承“云智原生”的战略,发挥算网融合优势,服务百行百业,铺就算网基石,共创互联网新时代。