• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

互联网技术详解-智能网卡助力UIS实现云端加速

【发布时间:2021-01-28】

聊起服务器,大家首先想到的就是“三大件”,即CPU, 内存,硬盘,但是作为服务器不可或缺的部件,网卡也应该占据一席之地,网卡的功能主要有两个:

一是将服务器的数据封装为帧,并通过网线将数据发送到网络上去;

二是接收网络上其它设备传过来的帧,并将帧重新组合成数据,发送到所在的服务器中。

网卡最重要的参数是速率,代表着服务器网络的整体处理能力。云计算,大数据处理,高速存储的需求推动了网络带宽的发展,云上客户对网络速度及网络带宽的关注度不断提升。业务对数据中心的流量产生巨大的冲击,企业需要大量、大带宽的服务器组成集群系统,协同完成工作。网卡速率从1G到10G普及用了十年时间,但是从10G到加速普及到25G,只用了不到3年时间,互联网头部公司已经基本切换到25G网络,甚至已经开始部署50G和100G网卡。

网卡速率的增长可以解决传输带宽的问题,但是数据包处理的延时却不能很好解决,在一些在线交易业务中,如金融证券行业,要求数据包能够较快的得到处理。在云计算场景下,由于天然是分布式的系统,有大量的数据在东西向流转,如果延时过大,将导致业务不可用。在此情况下传统的x86服务器已经不能很好满足业务的需求,于是出现了如DPDK这种软件的解决方案,采用轮训方式和在用户态实现数据包处理,能够明显提高服务器网络性能。DPDK最大的好处就是投入少,收益大,传统网卡加上软件套件就可以实现性能提升,缺点在于需要专门划出一部分CPU核来处理数据包。但是随着VXLAN等overlay协议以及OpenFlow、Open vSwitch(OVS)等虚拟交换技术的引入,使得基于服务器的网络数据平面的复杂性急剧增加,传统网卡固定功能的流量处理功能无法适应SDN和NFV ,而且网络接口带宽的增加意味着在软件中执行这些功能会占用大量的CPU资源, 和当前云计算的理念背道而驰,于是智能网卡的概念应运而生。

不同于传统网卡,智能网卡同时具备高性能及可编程的能力,既能处理高速的网络数据流,又能对网卡进行编程,实现定制化的处理逻辑

目前,智能网卡设计采用以下三种形式之一:

1. 多核智能网卡,基于包含多个CPU内核的ASIC

2. 基于现场可编程门阵列(FPGA)的智能网卡

3. SOC,即片上系统,它将硬件可编程FPGA与ASIC网络控制器相结合

不同的实现方式在成本、可编程性和灵活性方面各有优劣,ASIC具有价格优势,但灵活性有限,尽管基于ASIC的NIC相对容易配置,但最终功能将受到基于ASIC中定义的功能的限制,某些较复杂的负载可能无法得到支持,相比之下,FPGA NIC是高度可编程的,并且可以相对有效地支持几乎任何功能,不过FPGA最大的问题是编程难度大且价格昂贵,对一些小客户不太友好,针对更复杂的用例,SOC是较佳的SmartNIC选择,价格与性能兼具、易于编程且高度灵活。

具体说来,智能网卡为数据中心网络提供了几项重要优势,包括:

1.通过直接在网络接口卡上执行任务来加速网络、存储和计算任务,消除了在服务器上运行这些工作负载的需要,并释放了CPU周期,从而显着提高服务器性能并降低总体功耗,进而降低总体拥有成本。

2.卸载日益复杂的网络任务,包括诸如VxLAN等复杂隧道协议和OVS虚拟交换机等,使服务器处理器能够执行实际的创收性任务。

3.通过在更快速的硬件而不是较慢的软件中去执行卸载功能,从而提高有效网络带宽和吞吐量,并提供附加的、灵活的功能,以适应新的和不断变化的网络和存储协议。

其实智能网卡在大型互联网公司及头部CSP上已经开始应用,核心思想就是把业务负载卸载到专用硬件上,如微软在Azure上使用FPGA来实现CPU卸载、网络加速,而AWS甚至发展出一套Nitro 架构来实现VPC, EBS,存储等业务的硬件卸载,国内阿里巴巴的神龙架构思想类似,其架构核心就是一块MOC卡,整个Hypervisor完完全全运行在这张卡上面,服务器的CPU和内存完全可以释放出来给客户。

H3C作为优秀的超融合系统厂商,在UIS7.0架构中引入智能网卡的相关技术,加速业务的同时,释放硬件资源,有效降低TCO。

传统的超融合方案,计算、存储、网络均采用CPU处理,存储和网络占用大量CPU资源,导致真正用于计算的CPU资源减少,CPU的算力无法完全发挥。UIS赤霄智能加速架构的核心是实现了网络加速和存储加速。采用加速卡加速以后,在主机上仅需运行虚拟化平台,承担CPU、内存、及少量外设的虚拟化,而网络访问,存储访问及存储的处理逻辑全部下沉到加速卡上去处理。

下面我们来介绍下具体的处理逻辑

网络加速

使用普通网卡时,虚拟交换机需要使用主机的CPU和内存来处理用户报文,软件处理报文导致无法满足高性能需求,而且占用的CPU和内存会减少用户可以创建的虚拟机数量。

使用智能加速卡时,虚拟交换机下沉到智能加速卡中,使用硬件芯片转发用户报文,性能更高,原先的软件虚拟交换机小包性能约为2G左右,而采用智能加速卡则可以达到15G。另一个更大的好处是,原来占用的主机资源可以释放出来,用于创建更多的虚拟机。

存储智能加速

赤霄架构首创加速卡运行分布式存储方案,解决了传统分布式存储占用X86 CPU资源过多的顽疾,相比传统分布式存储:

l 高性能:采用硬件方案直接访问SSD盘,相比传统存储内核态IO的访问方式性能提升显著,并且采用无中心分布式架构,集群性能随着规模的增长线性增长。

l 高可靠性:多块卡组成了分布式集群,并实现了集群中的每个数据至少保存两份副本,且集群会自动将数据分布在不同服务器的卡上,硬件损坏的情况下依然可以获取一份完整的数据,并且丢失的数据会自动重构。

l 高可用性:存储集群提供多副本机制,当某个故障单元发生故障后,整个集群依然可以对外提供服务。

UIS赤霄智能加速架构,可以带来如下优化成果:

l 1) CPU和内存损耗大幅度降低;

l 2) 可承载的虚拟机数量大幅度增加;

l 3) 单VM的成本降低20%以上;

l 4) 网络IO性能大幅提升,小包性能从2G提升到15G以上;

l 5) 存储性能大幅提升,4K随机IOPS至少提升1倍以上。

云计算技术发展依赖于底层基础架构的变革,将传统的由CPU计算的底层模块卸载到专用硬件上是未来重要的发展趋势之一,新华三的UIS7.0 超融和架构很好的迎合了这一趋势,让客户的云端业务更有效率的运行。

新华三官网
联系我们