新华三打造千卡集群算力底座，为自动驾驶训练加速

【发布时间：2026-03-05】

随着自动驾驶技术从L2辅助驾驶向L4自动驾驶跨越，算法模型正经历从CNN（卷积神经网络）到Transformer的架构变革，参数量也呈指数级增长。文远知行WeRide作为全球领先的自动驾驶科技公司，已经在全球7国30城开展自动驾驶研发、测试及运营，是业内唯一同时拥有中国、美国、阿联酋、新加坡四地自动驾驶牌照的企业，业务覆盖智慧出行、智慧货运和智慧环卫三大领域，日均产生路测数据早已达到PB级别。面对海量数据清洗、标注及大模型训练的算力“洪峰”，原有基础设施捉襟见肘。为此，紫光股份旗下新华三集团协助其构建了基于AMD EPYC处理器的超200台H3C UniServer R5350服务器、搭载近2000块GPU的超大规模智算集群，以高带宽、低延迟的AI基座，破解“算力焦虑”，助力研发效率跃升。

descript

困境：高阶自动驾驶落地的“隐形围墙”

在追求“数据驱动”的自动驾驶2.0时代，算力基础设施的瓶颈日益凸显，文远知行在推进技术迭代时面临三大核心技术挑战：

算力密度与扩展性难题

亟需超强算力AI服务器

随着BEV（鸟瞰图）+Transformer架构成为主流，单一感知模型参数量突破亿级，训练算力需求每3-4个月翻一番。文远知行原有的小规模集群难以支撑千卡级并行训练，且传统服务器在支持多卡互联时存在PCIe带宽瓶颈，限制了GPU性能的极致释放，亟需具备高扩展性与强并行能力的AI服务器底座。

通信墙制约

分布式训练呼唤网络“高速公路”

在大模型分布式训练中，多节点间的梯度同步（All-Reduce）对网络带宽极其敏感。千卡集群若网络配置不当，通信延迟甚至可能占据训练周期的50%以上，导致“GPU空转、等待数据”的算力空耗现象。文远知行迫切需要构建一套能够承载百亿级参数高频交互的高速无损网络架构。

TCO（总体拥有成本）高企

追求极致性价比

自动驾驶研发属于典型的“算力密集型”投入，硬件采购成本与后期电力运维成本构成了巨大的资金压力。如何在保障模型训练精度的前提下，选择高能效比、高性价比的硬件组合，成为文远知行平衡技术领先与商业落地的关键考量。

破局：千卡集群构筑智能AI基座

针对上述技术痛点，新华三为文远知行量身定制了“高算力、高通量、高能效”的智算平台解决方案：

澎湃算力底座

打造异构计算集群

方案部署了超200台R5350 AI服务器，每台服务器搭载8块高性能GPU，总计近2000块GPU形成超大算力矩阵。

H3C UniServer R5350服务器搭载最新AMD EPYC处理器，支持PCIe 5.0高速接口，带宽较上一代翻倍，有效消除了数据从CPU到GPU传输的I/O瓶颈，确保单机内部GPU直通效率最大化。此外，通过优化机柜布局与散热设计，实现了单机柜高密度部署，大幅降低了数据中心空间占用，为后续算力扩容预留了充足空间。

descript

400G RoCE无损网络

打通数据传输“主动脉”

为解决分布式训练的通信墙问题，方案构建了基于400G RoCE v2（RDMA over Converged Ethernet）的高速无损网络架构。

方案配置高规格交换机，实现全链路无阻塞通信。通过PFC（基于优先级的流量控制）和ECN（显式拥塞通知）机制，构建零丢包网络环境。实测数据显示，该网络架构可将节点间通信延迟降低至微秒级，在千卡并行训练场景下，线性加速比提升至90%以上，确保上千块GPU如同一块超级GPU般高效协同。

成就：效率、性能、商机全面跃升

该智能算力平台一经上线并投入算法训练后，便以扎实的数据验证了方案的有效性：

大幅提升自动驾驶算法开发效率

依托澎湃的并行计算能力与优化的集群调度策略，平台极大缩短了模型训练周期。在典型的BEV感知模型训练任务中，千亿级参数模型的训练时间缩短40%以上，模型迭代频率从“周级”提升至“天级”，显著加速了长尾场景的解决速度。

增强自动驾驶系统性能与可靠性

400G高速网络与RDMA技术的应用，彻底消除了数据传输瓶颈。数据读取与预处理吞吐量提升3倍，系统网络有效带宽利用率超过95%。确保了在处理复杂路况（如雨雪天气、拥堵路段）的高维数据时，系统能够快速收敛，训练出的感知模型精度提升约5%，进一步增强了车辆对环境的感知与决策鲁棒性。

加速产品上市，提升投资回报率

通过打造高性价比的算力基础设施，文远知行在硬件采购成本上实现优化；同时，高能效的服务器设计降低了PUE值。相比同类方案，该方案在同等算力规格下，TCO（总体拥有成本）降低约20%。研发效率的提升直接转化为商业价值，帮助文远知行提前抢占L4级自动驾驶商业化落地的市场先机。

面向自动驾驶技术决胜未来的关键期，新华三通过融合高性能硬件架构与先进的400G RoCE网络技术，成功为文远知行构建了高效、稳定的千卡智算平台。这不仅是一次算力基础设施的升级，更是对自动驾驶研发模式的一次效能重塑，为智能出行时代的加速到来注入了强劲动力。

新华三公司新闻

热门推荐

热门推荐

H3C服务器

HPE服务器

热门推荐

H3C存储

HPE存储

热门推荐

商用台式机

商用笔记本

商用显示器

配件

热门推荐

热门推荐

智能终端

技术解决方案

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

专业安全服务

安全运营服务

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

技术支持

自助服务

热门推荐

热门推荐

热门推荐

热门推荐

合作伙伴培训与认证

热门推荐

热门推荐

公司刊物

加入我们

国家/地区

新华三打造千卡集群算力底座，为自动驾驶训练加速

困境：高阶自动驾驶落地的“隐形围墙”

破局：千卡集群构筑智能AI基座

成就：效率、性能、商机全面跃升

联系我们