• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

实力派的新选择
有孚网络携手新华三打造HPC超算平台

【发布时间:2022-05-19】

解决方案:高性能计算解决方案

产品:基于AMD EPYC处理器的H3C UniServer R4950 G5服务器

上海有孚网络股份有限公司(简称“有孚网络”)是IDC业界领军企业,深耕IDC行业二十年,拥有遍布全国的高等级数据中心和网络传输资源。有孚网络对技术和应用的发展趋势有着精准的把控,近年来随着HPC应用的不断普及和增长,有孚网络敏锐地发现很多企业和机构(尤其是中小企业)对HPC的需求与日俱增,但并不是每个企业和机构都有资金、技术或必要性去打造自有的系统,而那些已经拥有HPC系统的企业和机构往往也无法随时升级和扩容,去满足个别项目或高峰时段对算力的需求。以此为契机,有孚网络选择与新华三合作,建设首个HPC超算平台并将其作为全新的业务发展方向,以云服务的方式为教育、科研、人工智能和制造等领域提供灵活和强大的算力支持。

重新定义IDC 用HPC稳固竞争力基石

作为IDC行业知名的头部企业,有孚网络凭借雄厚的技术积累,早在多年前就对自己的数据中心业务进行了重新定义,在传统的主机托管业务(机位、机架、机柜、机房出租)和增值业务(负载均衡、智能DNS、流量监控等)基础上,打造出国内领先的云计算服务平台,用灵活的云服务满足不同行业、不同场景下的业务需求。而近年来随着云应用的迅速普及,各大IDC运营商陆续加大对云计算的投入,云计算领域的竞争愈演愈烈,在此背景下,有孚网络洞察先机,以打造强大的HPC平台,提升数据中心服务方式和能力,为需要进行高性能计算的客户提供强大的算力支持。

HPC是高性能计算集群的简称,通常用来服务有大规模计算需求的高精尖项目,由于建设成本高昂和技术复杂性,HPC一直给人“高高在上”的感觉。但实际上,随着各行业数字化转型的深入和数据量的激增,人们对HPC的需求与日俱增。早在2016年,HPC就与云计算、人工智能和物联网等被同时列为"十三五"期间重点发展的技术。在实际应用层面,HPC已呈现出遍地开花的趋势。例如在教育领域,HPC几乎已成为高等学府的“标配”,并且规模在不断扩大,不过即便如此,很多高校的科研项目仍然面临资源有限,需要“取号”和“排队”的问题。有孚网络正是在这种情况下,敏锐捕捉到客户的需求,决定率先打造基于云服务的HPC平台。

简单明了+精挑细选

建设HPC超算平台投入巨大,且技术复杂,需要强大和可靠的设备供应商,有孚网络对合作伙伴的要求可以用“简单明了+精挑细选”来概括。其核心要求比较“简单明了”,只有两点,其一是合作伙伴必须能够提供最先进的技术和最好的产品,无论是整体解决方案和核心的服务器设备,还是处理器、内存和网卡等组件,都要提供顶级品质,因为有孚网络HPC的建设目标就是给用户提供先进的技术和卓越的体验。其二要求合作伙伴在网络适配方面要有强大的能力,因为HPC超算平台不是供少数项目使用的内部平台,而是面向广大用户的云服务平台,客户在接入和使用该平台的过程中不能受网络延迟和卡顿的影响,要像使用本地平台一样顺畅,这就要求超算平台的网络架构必须具有强大的处理能力,合作伙伴必须具备长期的网络技术积累和丰富的部署经验。

在筛选出少数合格的备选供应商后,有孚网络又表现了精挑细选的一面。比如要求各大供应商搭建出小型的HPC测试平台,然后基于其制定的几十项考核指标,模拟不同的应用环境,对每个平台进行测试,然后再对每项指标进细致的打分和评估。再者,有孚网络会对服务器上每个组件都提出细化的要求。以硬盘为例,虽然不同的厂商的硬盘都能满足主要的指标要求,整体质量都在水准之上,但有孚网络会要求合作伙伴必须提供性能最佳的和稳定性最强的配件,甚至会对硬盘的品牌和与服务器的适配能力提出具体的要求。

拥有24960个AMD计算核心的首个HPC超算平台

最终,有孚网络选择与新华三合作,基于H3C UniServer R4950 G5服务器打造首个HPC超算平台。新华三在首期项目中为有孚网络部署了195台R4950 G5服务器,每台服务器插装两颗AMD EPYC 7H12处理器,每颗处理器拥有64个计算核心,整个超算平台共有高达24960个AMD计算核心。有孚网络之所以选择AMD处理器作为核心的算力组件,是因为AMD EPYC架构近年来在工艺升级和架构创新上取得了令人瞩目的进步,在7nm工艺的加持下,AMD的64核心处理器能够带来显著的性能提升,并且在提供超强算力时仅需280瓦的能耗,这与有孚网络打造高算力和低能耗的绿色数据中心理念高度吻合。在高性能计算方面,AMD EPYC的128条PCIe 4.0可以让服务器连接更多更强的GPU加速卡,在GPU大行其道的今天,AMD EPYC处理器能够为HPC带来惊人地算力提升。

在有孚网络高度重视的HPC网络架构上,新华三将HPC服务器的网络接入从常规的10G升级至25G,全部采用迈络思专为高速网络环境开发的25G网卡,并基于SeerFabric无损网络解决方案,以及新华三的交换机和SDN控制器等网络设备,构建能够进行低延时数据交换,支持灵活调度,和提供网络环境分析、预测、报警等先进功能的无损网络体系。该无损网络还能够为HPC超算平台提供云边的AI协同,可借助AI智能学习为不同业务场景构建智能的无损控制模型,并能实现对业务场景进行智能识别,动态匹配相应的模型参数,为HPC用户提供高带宽、低时延、零丢包的精确转发和具有确定性的网络体验。

有孚网络的相关负责人表示,此次采用新华三全新的服务器产品打造HPC超算平台看似是一次大胆的尝试,实则是双方多年合作的自然延续。该负责人介绍说:“我们与新华三有长达十年的合作,之前的合作主要是基于网络层面,我们大部分的网络设备都来自新华三,新华三很多最新网络设备的首单都是在我们数据中心落地。长期的合作让我们建立了信任,也让我们开始关注新华三的其它产品。在此次HPC超算平台的建设中,我们发现新华三拥有成熟的HPC解决方案,其核心设备AMD服务器拥有强大的性能、深厚的技术积累和广泛的行业应用,并且与英伟达和迈络思等业界重要的企业有深度的合作和技术交流,完全匹配我们的平台建设要求,并且能够给后续的扩展与升级提供有力的支持。与新华三合作能够让我们把重点放Slurm和E-shell等作业系统和应用环境的搭建和调适上,我们可以把基础架构层面的各种事务放心地交给新华三处理。”

H3C UniServer R4950 G5服务器

用户使用成本至少降低60% 效率提升数倍

2021年12月底,有孚超算的首期平台正式上线提供服务,该平台集成了用户登录、文件传输、程序编译、算力分配、作业执行、资源监控和计量计费等,将高性能计算物理集群封装为可进行统一管理和调度的算力应用平台。该平台极大降低了客户应用HPC的门槛,让客户无需自建集群和进行集群的维护和更新,就可随时从云端获取超算能力,即开即用,将精力聚焦在自身的业务和科研项目上。

以高等院校为例,虽然基本都有自建的HPC,但很多高校的HPC算力固定,资源供不应求,有些科研项目不得不排队等待有限的HPC资源,直接影响了科研工作的进度和效率。如果高校建设新的HPC或升级现有的HPC,一方面需要高昂的投资,另一方面要履行各种流程和遵从财务制度的要求,要看是否能够获得预算以及获批的具体金额。而采用有孚网络的超算平台,这些问题都能迎刃而解。无需排队,无需受资源配额的限制,随时可以接入强大的HPC系统,灵活调配自己所需的算力。在成本支出上,自建平台可能需要几千万的投入,而使用按时间付费的有孚超算平台可能几万块钱就能帮助科研项目迅速取得成果。经过综合评估,使用灵活高效的有孚网络超算平台至少能够帮助客户降低60%的使用成本,并将科研等超算项目的工作效率提升数倍。

目前有孚网络HPC超算平台的应用场景主要包括教育科研、生命科学、人工智能和智能制造等。以教育科研为例,有孚网络HPC超算平台可以有效满足气象预测、计算物理/化学、 材料研究、生命科学、金融分析、地质勘探等各类教育或科研计算需求,提升科研能力,打破算力瓶颈。再以人工智能为例,有孚网络HPC超算平台能为用户的深度学习和机器学习开发按需提供高性能计算资源,在保障核心数据私密性和安全性的基础上,同时提供灵活高效的个性化服务,将算力、数据、算法、应用市场等核心要素整合在统一平台进行生产、聚合、调度和释放。

有孚网络HPC超算平台上线后,吸引了大量HPC用户的关注和使用。对此有孚网络的相关负责人表示:“HPC超算平台和新华三AMD服务器都是我们全新的选择,我们在技术上主张积极创新,主动发掘客户需求,主动测试最新的产品和技术,只要能够为客户提供更好的性能和体验,只要能够提高数据中心的算力和能源效率,我们就会大胆引入。用户的需求越复杂,我们就越欢迎。在对产品和技术的研发上,在服务各自客户的态度上,我们与新华三有很多一致之处,这种契合将会帮助我们在更多领域展开合作,共同打造适合未来经济发展的新型数据中心。”

新华三官网
联系我们