HPE 推出功能强大的新型超级计算机平台,用于 AI 和高性能计算工作负载

Admin 271 2024-11-25 14:54

惠普企业公司今天表示,正在更新其高性能计算平台产品组合。


扩展的产品线包括几个新的 HPE Cray Supercoming EX 系统,以及一对新的 HPE Proliant 服务器,这些服务器针对人工智能工作负载进行了优化,包括大型语言模型训练和微调。


HPE 表示,这些系统是为负责解决一些世界上最棘手问题的研究机构设计的。它们针对的是更传统的 HPC 工作负载,例如 DNA 测序和股票交易自动化,而不是只专注于 AI 工作负载。


利用超级计算机制造巨头HPE 于 2019 年收购的Cray 的专业知识,它们也是同类产品中第一台采用100% 无风扇、直接液体冷却系统架构制造的机器,该架构涵盖机器的每一层,包括计算节点、网络和存储。


这些产品包括 HPE Cray Supercomputing EX154n 加速器刀片,将于明年年底推出,旨在大幅缩短完成超级计算任务所需的时间。它还设计用于处理 AI 工作负载,为此,它可以在一个机柜中容纳多达 224 个 Nvidia Corp. 的全新Blackwell 图形处理单元。每个加速器刀片都配备一个 Nvidia Grace Blackwell NVL4 超级芯片,总共可容纳四个通过 NVLink 连接的 Blackwell GPU,并通过 NVLink-C2C 与两个 Nvidia Grace 中央处理单元配对。


即将推出的是新的 HPE Cray Supercomputing EX4252 Gen 2 Compute Blade,将于明年春季推出。它更像是一个传统的超级计算平台,因为它经过优化,可以支持更广泛的计算应用。


它缺乏 GPU 硬件,这可能使它对 AI 的用处不大,但就传统工作负载而言,它是一款强大的产品,单个机柜中最多可容纳 98,304 个 CPU 内核,使其成为同类产品中最强大的单机架系统。每个内核配备八个由 Advanced Micro Devices Inc. 制造的第五代 EPYC CPU,可提供极高的 CPU 密度,使客户能够在比以前小得多的空间内实现更高性能的计算。


为了配合新的 Cray Supercomputing EX 型号,HPE 还推出了下一代百亿亿次级互连产品组合,捆绑了支持高达 400 千兆位/秒速度的网络接口控制器、电缆和交换机。此外,还有一个新的存储系统和服务软件值得期待。


新的网络基础设施被称为 HPE Slingshot Interconnect 400,其线速是上一代互连的两倍。它还支持自动拥塞管理和自适应路由等高级功能,这意味着它可以动态重新路由和优化连接,以确保它支持的任何给定工作负载的延迟尽可能低。它将于明年秋季面向基于最新 HPE Cray 系统的集群推出。


至于 HPE Cray 超级计算存储系统 E2000,它提供的输入/输出容量性能是 HPE 前代超级计算机存储系统的两倍多。在底层,它利用开源 Lustre 文件存储系统,这有助于减少与 I/O 操作相关的空闲时间。这一切加起来比以前快得多的存储读写速度,并将在明年初推出时显著提高超级计算操作的性能。


最后还有新的 HPE Cray 超级计算用户服务软件,该软件旨在通过优化系统效率、管理功耗等新功能来改善其超级计算平台的用户体验。


适用于 AI 工作负载的全新 HPE ProLiant Compute XD 服务器

虽然 Cray 超级计算机针对更广泛的 HPC 工作负载进行了优化,但新的 HPE ProLiant Compute XD 服务器专为当今几乎每个企业都渴望接受的所有重要的 AI 工作负载而构建。


HPE 高级副总裁兼 HPC 和 AI 基础设施解决方案总经理 Trish Damkroger 表示,企业和政府对“自主 AI 计划”越来越感兴趣,因为这些计划使他们能够完全控制自己的 AI 模型和训练数据。但对于自主 AI,这些组织需要访问一些非常强大的硬件,而这正是 ProLiant Compute XD 服务器所提供的。


HPE 于 3 月推出了首批用于 AI 的 ProLiant Compute 服务器,但 XD 型号是一种全新的机器类别,经过优化,可支持部署大型高性能 AI 集群。该公司一直与 Nvidia 密切合作,对它们进行微调以支持最先进的 LLM。


新款机型包括 HPE ProLiant Compute XD685,这是两款机型中功能最强大的一款,面向优先考虑性能而非成本的客户。该公司表示,这款产品面向 AI 训练和推理,买家可以选择 8 个 Nvidia H200 SXM Tensor Core GPU 或五机架机箱中相同数量的 Nvidia Blackwell GPU。这是一款液冷系统,将于明年初上市,与 Nvidia 推出 Blackwell GPU 的时间大致相同。


除了 Nvidia 硬件,客户还有更多选择。HPE 最近宣布推出HPE ProLiant Compute XD685 的独立版本,该版本配备八个 AMD Instinct MI325X 加速器和两个 AMD EPYC CPU,而不是 Nvidia 的硬件,后者也将于明年初上市销售。


至于风冷式 HPE ProLiant Compute XD680 服务器,它是一种替代方案,面向那些希望优化性价比,同时仍能处理最苛刻的 AI 训练、调优和推理任务的客户。它没有使用 Nvidia 的 GPU,而是使用英特尔公司的八个Gaudi 3 AI 加速器,这些加速器被压缩成一个紧凑的节点。它们将很快开始销售,发布日期定于下个月。


这两款新服务器均采用了 HPE 的 Integrated Lights-Out 技术,用于远程管理,使选定的授权人员能够从任何位置访问它们,与传统的带内网络访问相比,提供了更高的安全性。


HPE 表示,新款 Proliant XD 服务器附带可选服务,例如安装、定制、集成和验证,以及在公司自己的制造工厂内进行的全面测试,以满足希望加快现场部署的客户的需求。


Damkroger 表示:“我们的客户希望我们能够加快他们的人工智能系统部署,从而更快、更高效地实现价值,并利用我们数十年交付、部署和服务全集成系统的经验。”


【销售电话】:17380538992
【销售经理】:王经理

【代理级别】:成都H3C新华三网络IT设备代理商

联系我们
您好,咨询客服了解更多促销产品
售前优惠在线咨询
QQ咨询
微信咨询
售前优惠电话咨询专线:
17380538992

请用微信扫描二维码

1.332015s