欢迎user
近日,以“光电引领未来 驱动应用创新”为主题的第25届中国国际光电博览会(CIOE中国光博会)在深圳举办。紫光股份旗下新华三集团携多款51.2T智算交换机产品亮相本届盛会,并在同期举办的“讯石光通信市场暨技术专题研讨会”上演示了400G智算交换机与十余家模块厂商的DSP&LPO模块现场互联测试,良好的测试结果充分体现了新华三智算交换机产品强大的稳定性与兼容性,基于光互连技术为智算网络建设提速、降耗,全面赋能AI产业高速发展。
随着全球AI话题持续升温,智算无疑成为推动技术升级和应用进化的核心引擎。在大规模智算集群场景中,选择具备更高端口速率和交换容量的交换机,既能提升计算集群内部的数据交换能力,也能拓展计算集群的规模上限,为后续的升级扩容打下坚实基础。然而,随着端口速率不断攀升,关键器件的功耗也将提升一个量级,如何在实现高速传输的同时,兼顾能耗降低的诉求?LPO(线性驱动可插拨光模块)凭借其低功耗、低延迟、低成本、可插拔的优势,成为智算时代备受关注的方案之一。
创新与生态兼容并济
赋能高效、绿色智算中心建设
新华三集团积极探索与实践多样化的节能降耗策略,将绿色低碳理念融入交换机产品研发设计当中,在51.2T的交换平台上充分融合了CPO/LPO技术,为客户智算中心提速、降耗保驾护航。以本次展示的H3C S9827系列为例,该系列产品通过精密的设计与验证,拥有包含400G QSFP112/800G OSFP/800G QSFP-DD等丰富的接口类型,支持全端口LPO可插拔模块应用,通过LPO与液冷技术的融合,实现整机功耗降低25%~40%,满足PUE≤1.14的要求。
此外,在本次DSP&LPO模块互联测试中,数据显示不同厂商的LPO模块在H3C S9827上的误码率均低于IEEE定义的门限要求,且经过与主机适配调优后的LPO模块具有更好的性能参数、误码率更贴近DSP模块。
不同厂商的LPO模块在不同端口上的误码率对比图
误码率是衡量光模块性能的重要参数之一,误码率越低表示交换机端口设置的参数与光模块的匹配度越高,光链路传输特性越好。
这一结果充分说明LPO模块需要与设备强强联合才能真正发挥优势,实现绿色节能的目标。同时新华三交换机凭借稳定的性能和良好的兼容性,能够为不同端口走线的LPO模块提供良好的电信号驱动能力,这将进一步为LPO的广泛应用奠定坚实基础,促进光通信产业持续发展。
智能软件调优助力智算网络高效运维
AI大模型训推需要超大规模网络互联支撑,以万卡场景为例,所需服务器约1250台,网络设备约140台,高速模块约5万个,设备配置项总量约41万条。海量高速模块在部署、使用中也会面临连线准确性、故障快速定位等问题。为此,新华三集团为智算网络开发了多种自动化运维功能:
●端网拓扑可视化,分钟级故障检测:支持多维度拓扑故障检测,可基于整网、设备、服务器维度自动检测连线故障,异常组网告警可视,连线问题分钟级检测,节省人力成本90%;
●智算模块健康检测技术:通过AD-DC检测分析模块功率、温度、电流、电压、CRC等多维度指标,预测光模块健康度、光链路衰减、光功率衰减等问题,并通过Web大屏、邮件、短信等多种方式第一时间告知管理员异常原因和所在位置。
400G ZR DCI技术助力异地智算中心互联
当前,智算集群已经达到万卡规模,正向着十万卡演进,未来必将面临同城长距集群间的互联互通问题。对此,新华三也推出了400G/800G ZR/ZR+ DCI硬件方案,在高速智算交换机S12500CR、S9827、S9825系列使用ZR/ZR+ 模块,采用密集波分复用(DWDM)和高阶调制相结合的方案,可以在长达120km/1000km的数据中心互连(DCI)链路上传输,实现更低的传输时延,并通过部署MACSec技术实现安全的点对点通信,相较于传统的OTN技术降低30%的传输成本。
探索高速、高效的互联技术是新华三在智算时代自始至终的追求,基于当前广受关注的 LPO 方案,新华三推出了 400G/800G LPO 高密智算交换机,凭借前瞻性视角,为大模型的绿色、高效发展持续贡献力量。展望未来,新华三集团将秉持“精耕务实,为时代赋智慧的理念”, 不断致力于技术创新和产品研发,进一步携手业界合作伙伴共同推动光互连技术应用,为智算中心发展贡献更多智慧和力量。