摘要:如果说算力是新的生产力,那么算力网络则是一种新的生产工具,整合零散的多方资源,将业务需求、算力资源和网络资源协同优化,服务智能社会。
伴随着AI的快速发展,算力已成为了支撑智能化社会发展的关键要素。IDC发布的《2019-2020中国人工智能计算力发展评估报告》中提及“人工智能三大要素包括:数据,算法和算力。算力已经成为承载和推动人工智能走向实际应用的基础平台和决定性力量。” 算力是新的生产力,是未来智能社会中重要的一种通用基础设施资源。算力的发展推动整个人工智能系统的发展和快速演进。
大量的人工智能应用诸如个人的AR/VR、云游戏,企业级别的工业质检等都需要大小不一的算力资源,如果没有算力的支撑,人工智能应用将难以真正走向落地。同时随着大数据、云计算、物联网等技术的发展,数据量呈现爆炸式增长,这也需要极强的算力以满足海量数据的智能分析。算力越充沛,数据分析和利用的程度、分析效率就越高,进而加快企业从数字化迈向智能化的步伐。
边缘计算需求与日剧增
传统云计算中,虚拟化、云化技术发展促使了数据中心向集约化、集群化发展,资源利用率得到大大提升。但是随着物联网、视频业务、车联网等新兴业务发展,对数据本地化服务、业务响应时延都提出了更高要求,这便需要算力就近及时响应,边缘计算需求与日剧增。Gartner预测到2022年,75%的企业数据将会在传统集中式数据中心或云端之外的位置创建并得到处理。各类丰富的计算密集型边缘应用及相关工作负载、服务和数据越来越多地分布在边缘,这些都需要广泛的、有保障的、多样化的算力资源支撑。
边缘计算的发展离不开生态,边缘计算生态系统涵盖了不同算力提供方,包括云提供商、应用/服务提供商、网络运营商、中小型的企业甚至是个人智能终端等。对于广泛分布在云、边、端的算力,同时归属于不同运营方、企业或个人,如何融合利用好各级、各方算力资源,并实现高效协作则充满了挑战。
图1 层次化网络架构
随着边缘计算的进一步发展,未来社会中将在靠近用户的不同距离遍布许多不同规模大小的算力资源,为了将这些分散的算力资源连接起来,未来网络架构也将由层次化架构(如图1所示)向网状架构转变。未来网络上将会承载着多种云(包括混合云、公有云、私有云、边缘云等),云上将会运行多种应用类型或多个供应商及第三方合作伙伴的工作负载。如图2所示。
触手可及的网络边缘(如MEC)就近能为用户提供丰富的算力资源和实时的智能数据处理能力及计算能力,承载各类计算密集型应用,适用于车联网、AR/VR等低时延要求比较高的场景,实现为应用生态赋能。
图2 网络架构将从层次架构向网状架构演进
算力供需矛盾突出
边缘大量业务如车联网、AR/VR等低时延要求比较高的服务需要更多有保证的算力资源,边缘算力需要依托网络协同,为不同用户提供边缘算力及时响应服务。但是现有算力供需之间缺乏灵活调度能力,当算力资源过载、甚至不可用时,需依赖应用层重连,等待时间达到秒/分钟级,导致算力使用者体验下降。
近些年各行业都在建设数据中心、边缘数据中心。当今业务静态部署,资源无法复用,大量闲置资源浪费。据统计每年闲置算力折合建设费用近万亿元。
现有网络不关注应用,只确保应用供需之间联接能力,网络中没有业务或用户相关信息导致无法确定较佳的服务处理节点,很难满足及时响应业务的要求,最终影响了客户和垂直行业用户的业务体验。
针对以上算力供需矛盾、算力分配不均衡、应用缺乏网络协同等问题,急切需要一种新的算力传递途径,能够根据不同的业务需求、网络实时状况、算力资源实时状况,将客户需求动态路由到不同距离的边缘节点上执行计算任务,算力网络应运而生。
算力网络的价值
网络自诞生至今,联接能力不断提升,联接范围持续扩大,已成为数字化社会建设和发展的基础能力。算力网络作为一种新型网络方案被业界提及并逐渐得到认可。从定义上看,算力网络是一种通过网络分发服务节点的算力、存储、算法等资源信息,结合网络信息(如路径、时延等),针对客户需求,提供较佳的资源分配及网络联接方案,并实现整网资源的优化。
算力网络可以简单理解为一个开放性的平台,以网络为中心纳管协同机构或个人所提供的算力资源,对外为客户提供高可靠、高质量的算力资源,同时提供满足客户需求的SLA保障,对内可达到全网算力资源和网络资源利用率优化。算力网络也是一张具备主动联接能力的网络,主动地将计算、存储、网络资源进行协调、调度,向业务或用户提供优质资源。
运营商在算力网络中将会起到关键的作用。5G 时代,随着运营商网络的云化改造,将有大量的IT资源在各级通信云进行部署,这些云资源相比传统数据中心更靠近用户。在当今AI需求旺盛的背景下,运营商结合其强大的网络能力,更适合为客户提供诸如赋能AI应用等算力服务。
其次,算力的输送对网络质量、确定性等方面都有很高的要求,网络是运营商的强项,这点无人能及。
最后,算力网络促使运营商在商业模式上进行创新,使运营商计费量纲更丰富、购买模式更灵活。在计费量纲上,算力网络除带宽外,还能实现时延及算力可承诺;在购买模式上,除传统资源租赁模式外,还可基于算力交易市场实现资源竞拍模式,分成给算力提供者,以此来提升运营商自身价值与运营收入。
算力网络的几种能力
如果说算力是新的生产力,那么算力网络则是一种新的生产工具,它将促进基础设施释放更多算力。为了将业务需求、算力资源和网络资源协同优化,同时满足客户应用SLA保障,算力网络需要至少具备如下几种能力:
1. 算力网络是一种分布式的网络,它在网业分离的同时也具有两者协同的能力。
2. 算力网络需要具有原生智能的能力以实现主动联接。如可通过AI对应用和业务需求进行预测,通过AI实现对网络资源的动态调度及通过AI驱动网络主动发起联接等能力。
3. 算力网络需要具有高效的协同能力,支持多边缘之间、边缘与中心之间的算力均衡,流量调度和拥塞管理,以实现全网算力资源利用的优化。
4. 算力网络需要具有主动数据安全保障能力。在零信任环境下保障算力供给及交易安全,具有面向“边-云”及“边-边”协同的安全体系及基于区块链的交易验证和防篡改能力。
5. 算力网络需要具有确定性能力,可提供确定的带宽,确定时延抖动、安全可靠、业务可用性、专业服务等明确的SLA等级保障。
当前,算力网络的技术研究开始不久,现有算力网络实现方案中业界目前有两种——集中式和分布式方案。集中式方案是基于SDN/NFV思想,利用集中控制编排平台统一收集、计算和分配算力和网络资源,为用户提供较佳的算力分配及网络联接。此种方案对基础架构改造小,状态同步和控制简单,易落地。而分布式方案主要通过在IP层以上增加一个算力路由层,以信令方式进行计算和网络信息发布到网络,网络再将计算任务报文路由到相应的计算节点,这种方案技术创新性比较强,对基础网络改动可能比较大。除此以外,算力网络的其他实现方案和相关关键技术如可信、安全等方面,各大运营商、设备厂商及产学研各界也正在依据自己的技术优势进行积极探索,H3C也正在积极参与算力网络方案、标准的制定,相信不久将会有更多技术方案推出及关键技术突破。
算力网络应用
与算力相关的业务及应用多种多样,如AI训练、AI推理、多流视频、视频会议、网红直播、智能监控、图像识别、云AR/VR、自动驾驶等,业界公认的算力网络应用典型场景如下:
云VR应用中从云生成的视频和音频输出,经过编码、压缩,然后通过高带宽网络传输回终端设备,实现VR业务内容上云、渲染上云。通过计算任务分级卸载,提高云、边、网资源利用率,提高业务体验。在中心云,Cloud VR中计算负载重的大型计算、内容产生等任务可部署在中心云上。在边缘云,计算要求较低的视频编解码、内容渲染等任务动态卸载至边缘节点处完成。云VR服务对网络质量和计算都有很高的要求,通过算力感知网络选择符合服务请求的边缘节点,避免计算过载同时可满足时延要求。
智能驾驶是智慧城市的一部分,如无人物流车,无人出租车等。车联网辅助智能驾驶场景中,车辆感知周围环境,边缘计算节点获取车辆位置周边的路况交通信息,并进行数据统一处理,对于有安全隐患的车辆发出警示信号,辅助车辆安全驾驶。当本地的边缘节点过载时,通知会发生延迟,可能导致交通事故的发生。通过算力网络将时延不敏感的业务如车载娱乐从本地节点调度到其他节点进行计算,以降低本地节点的负载,使低时延业务在本地优先处理,保证其用户体验和可用性。
结束语
相信未来无处不在的算力资源在算力网络的协同下,将为用户提供有保障的、灵活的、丰富的算力资源,同时丰富的算力资源与网络资源将不断地深度融合互补,为用户和垂直行业提供优秀的业务体验。