欢迎user

郑州素有“九州腹地,十省通衢”之称,自古便是交通与商贸核心枢纽。如今,这座城市正在将其得天独厚的地理枢纽优势,转化为智能时代算力高地的核心竞争力。位于郑州航空港经济综合实验区的河南空港智算中心,正是这一战略蓝图的关键落子,作为中部地区率先向万P级算力集群迈进的智算中心,它不仅是河南布局超大规模智算、推动产业升级的核心基础设施,更肩负着为百行百业输送澎湃算力、激活数字经济发展动能的重要使命。

中部算力之城崛起
直面万P级算力集群网络困境
河南空港智算中心规划总算力超10万P(1PFLOPS约等于每秒1000万亿次浮点运算),志在成为辐射中部、影响全国的核心算力枢纽。目前,中心已建成万P级算力集群,并率先完成与DeepSeek-R1等开源大模型的深度对接,坚实的算力基座已初步成型。但庞大的算力规模与公共服务定位,也让其面临智算行业普遍难题:难以同时兼顾高性能、低成本与易运维,一场关乎算力高效释放的考验已然来临。
这场考验聚焦于三个核心挑战:一是性能与成本的平衡,大模型训练要求网络极高稳定性,而传统方案成本高、交付慢,亟需性价比更优的替代路径;二是运维可视性不足,设备规模指数增长,人工部署耗时漫长,故障定位缺乏端到端可见性,影响业务连续性;三是多租户安全隔离,作为公共算力平台,必须实现严格的逻辑隔离,杜绝性能干扰与数据泄露风险。
“算力是引擎,网络是动脉。只有打造出智能、无损的网络,算力价值才能最大化。” 河南空港智算中心相关负责人表示,为释放算力潜能,实现高质量运营,必须攻克一个核心难题,那就是为眼前的超大规模集群打造一张足以承载未来的智算网络。
应对大规模集群多维挑战
新华三以智算网络高效破局
立足河南空港智算中心的实际需求,紫光股份旗下新华三集团量身定制了一套适配超大规模集群、兼顾性能与成本、保障安全与高效运维的智算网络,助力智算中心实现算力效能最大化,为10000P算力铺就“不限速高速路”。
400G RoCE无损网络,万P级集群高速互联
为满足AI训练低延迟、高吞吐的极致需求,新华三集团为河南空港智算中心构建了高带宽、低时延的400G RoCE无损网络,可稳定支撑超大规模算力集群的高速互联。该方案基于开放以太网生态,在保持同等低延迟、高吞吐能力的同时,更好兼顾了性能、成本与可扩展性,为算力传输打造了稳定、高速、经济的核心通道。
在组网设计上,方案通过深度解耦实现参数网、存储网、管理网的物理与逻辑双重隔离,进一步强化网络底座稳定性与高效性。参数网Leaf节点采用上下行1:1无收敛设计,确保每一张GPU卡都能获得满额带宽;存储网通过合理的收敛比平衡性能与成本,高效承载存储的高并发吞吐;管理网承载业务流与运维管理流量,配合AD-DC智算版实现全网精细化分析。这种极致通信效率,支撑中心在DeepSeek-R1等模型的多机多卡并行训练中,始终保持高效集群协同。
全流路径智能导航,通信效率提升143%
针对大规模组网中易出现的链路拥塞问题,新华三创新应用全流路径智能导航技术,相当于为算力传输“高速路”配备智能导航。通过交换机实时识别上报流量特征,依托AD-DC智算版实现动态选路策略调整,无需修改业务代码、不依赖特定硬件,实测可使有效通信带宽提升约143%,大幅提升算力传输效率与稳定性,进一步释放网络底座的传输潜能。

NCCL Test 实测:全流路径导航开启前后有效总线带宽对比
AD-DC智算版自动化部署,业务实现天级上线
为破解运维管理“黑盒困境”,方案引入AD-DC智算版,通过自动化部署与一体化管控,打通算网管理壁垒,将部署周期从月级压缩至天级,实现了快速上线与降本提效。在此基础上,AD-DC智算版还具有可视化监控与全景可观测能力,使运维模式从“被动响应”转向“主动预警”,保障系统持续稳定运行。

AD-DC智算版全网设备可视与智能运维
多租户算力隔离管理,灵活高效运营
依托AD-DC智算版的自动化管控能力,新华三针对性解决智算中心多租户服务需求,实现多租户算力隔离管理。方案支持按需分配VLAN,通过AD-DC智算版与交换机联动,自动下发ACL策略,为不同租户划定独立“数字空间”,实现算力、网络、数据三重隔离,助力智算中心灵活高效运营。
如今,新华三集团与河南空港智算中心携手突破传统网络瓶颈,完成了从物理连接到智慧调度的全面升级,为全国智算基础设施升级提供了可借鉴的实践经验。未来,新华三将持续深耕智算网络技术创新,以更高效、智能、安全的网络基础设施,助力国家算力枢纽建设,推动算力便捷取用,共绘中国智算高质量发展新篇章。

