欢迎user
2025年8月,全球权威AI性能基准评测组织MLCommons®公布最新一轮MLPerf® Storage v2.0基准测试结果。紫光股份旗下新华三集团发布的新一代高性能分布式融合存储Polaris X20000以单节点158.92 GB/s、集群总带宽突破476.752GB/s的优异成绩,登顶高性能RoCE AI存储解决方案榜首。
这一成绩不仅彰显了新华三在高性能存储领域的持续创新能力,更标志着Polaris X20000已跻身全球顶尖行列,为大模型训练、AI推理与高性能计算等数据密集型场景提供坚实的数据底座。
MLPerf® Storage v2.0
AI存储性能的全球标杆
在AI大模型训练中,算力不足往往并不是GPU的问题,而是存储系统供给不够。当数百甚至上千张GPU同时等待数据时,即使最强大的加速器也会因“无米下锅”而空转,造成训练效率大幅下降。
MLPerf® Storage v2.0正是面向这一核心痛点设立的全球权威基准测试。它通过模拟真实AI训练负载,从根本上考察存储对智算系统的支撑能力:
•聚焦GPU利用率:在MLPerf® Storage v2.0基准测试中,3D-UNet与ResNet50模型需在保持GPU利用率90%以上的条件下进行带宽测评,这一标准被视为检验存储能否真正“喂饱”算力的核心指标。
•覆盖真实应用场景:包含对带宽要求极高的3D-UNet医学影像分割训练,以及大模型训练中必不可少的Checkpoint断点保存与恢复,全面检验存储在AI全流程中的作用。
•行业广泛认可:本轮v2.0测试共有26家全球主流厂商提交200余项数据,成为AI存储选型与性能对比的事实标准。
正如MLPerf存储工作组联合主席Curtis Anderson所言:“存储性能已经从幕后配角,转变为决定训练能否高效推进的核心要素。”新华三Polaris X20000在本次测试中登顶,不仅刷新了性能数字,更证明其在真实AI生产环境中,能够为超大规模智算集群提供稳定而高效的数据底座。
3D-UNet模型
苛刻负载下的实测登顶
在本次测试的3D-UNet医学影像分割模型场景中,存储系统需应对持续高吞吐、低时延高并发访问以及长周期一致性三大挑战。
测试结果显示:
•单节点性能:Polaris X20000单节点持续带宽158.92 GB/s;
•集群性能:总带宽突破476.752GB/s,显著领先同类产品;
•GPU规模:可同时支持320个GPU;并实现GPU利用率大于90%。
新华三Polaris X20000系列专为AI智算场景设计,采用全新自研存储引擎,面向AI/HPC场景下的海量数据处理需求提供极致性能,满足AI大模型训练中海量小文件高并发和百TB级带宽需求;并将块、文件、对象与HDFS协议集成于统一存储平台,从数据采集、模型训练到分发全流程实现数据零迁移。同时,系统大幅提升可靠性,ms级故障上报与秒级切换确保训练任务不中断,计划内/外升级扩容对上层应用无感,为企业提供稳定、高效的存储支持。
在本次测试中,带宽与并发性能的双突破,充分印证了Polaris X20000在高性能存储与AI训练真实负载下,可以有效避免算力空转,显著缩短模型训练时间,有效保护用户算力投资。
RoCE:AI存储网络的主流演进方向
随着大模型规模和GPU数量的持续攀升,存储网络已成为影响AI集群效率的关键因素。RoCE(RDMA over Converged Ethernet)凭借高性能、低延迟以及更优的TCO,正在迅速成为智算中心的主流网络选择。相比传统高成本的InfiniBand网络,RoCE在性能接近的同时具备更高的性价比和更友好的运维体验,这也使得其在实际用户部署中更具吸引力。
新华三选择基于高性能RoCE AI存储方案,正是立足于这一趋势和客户的实际落地需求。通过RDMA技术实现的零拷贝与低时延传输,有效降低了CPU占用率,将更多算力释放给模型训练;无损以太特性的引入,则消除了网络拥塞与丢包风险,为大规模训练的稳定性提供保障。依托这一方案,Polaris X20000不仅展现了性能上的领先优势,更为用户在实际AI项目中构建高效、可靠、可扩展的智算基础设施提供了可复制的参考路径。
“内生智能成就智慧”
持续引领AI基础设施演进
新华三始终秉持“内生智能成就智慧”的发展理念,在产品架构设计、性能调优和智能运维方面持续创新。Polaris X20000在MLPerf® Storage v2.0权威评测中登顶,不仅是一次性能突破,更是新华三体系化能力与行业地位的集中体现。未来,新华三将继续深耕高性能存储领域,推动AI基础设施向更高性能、更高可靠、更智能化方向演进,携手生态伙伴助力全球AI产业加速发展。