英伟达发布最强AI超算:4608个H100 GPU
Eos是全球性能排名第九的超级计算机。英伟达周四发布了一段视频,首次向公众展示了其最新的面向企业的超级计算机Eos的架构,Eos是专为数据中心规模的高级人工智能开发而设计的,也是该公司速度最快的人工智能超级计算机。Eos 机器目前由 Nvidia 自己使用,在最新的 Top 500 榜单中,它被评为世界上性能最高的超级计算机的第 9 位,该榜单以 FP64 为衡量标准;在纯 AI 任务中,它很可能是速度最快的超级计算机之一。同时,它的蓝图也可用于为其他公司建造面向企业的超级计算机。
"Nvidia在视频中表示:"每天,EOS都在迎接Nvidia数千名从事人工智能研究的内部开发人员的挑战,帮助他们解决以前无法解决的问题。Nvidia的Eos配备了576个DGX H100系统,每个系统包含8个Nvidia H100 GPU,用于人工智能(AI)和高性能计算(HPC)工作负载。该系统总共装有1,152个英特尔至强Platinum 8480C(每个CPU有56个内核)处理器和4,608个H100 GPU,使Eos在HPC和AI方面分别达到了Rmax 121.4 FP64 PetaFLOPS和18.4 FP8 ExaFLOPS性能。Eos(依托于DGX SuperPOD架构)的设计专为人工智能工作负载和可扩展性而打造,因此它采用了Nvidia的Mellanox Quantum-2 InfiniBand with In-Network Computing技术,该技术的数据传输速度高达400 Gb/s,这对于有效训练大型人工智能模型和扩大规模至关重要。除了强大的硬件,Nvidia 的 Eos 还配备了强大的软件,该公司表示,这些软件也是专为人工智能开发和部署而设计的。因此,Nvidia 的 Eos 可以应对从类似 ChatGPT 的生成式人工智能到人工智能工厂等各种应用。"Eos拥有一个集成的软件栈,其中包括AI开发和部署软件,包括协调和集群管理、加速计算存储和网络库,以及针对AI工作负载优化的操作系统,"Nvidia在视频中说。"Eos是Nvidia DGX超级计算机(如Saturn 5和Selene)知识的结晶,是Nvidia人工智能专业技术的最新实例。通过创建像Eos这样的人工智能工厂,企业可以承担他们最苛刻的项目,并在今天和未来实现他们的人工智能愿望。"我们不知道 Eos 的成本是多少,而且 Nvidia DGX H100 系统的定价是保密的,取决于很多因素,比如数量,这也无济于事。与此同时,考虑到每台 Nvidia H100 的成本可能在 3 万至 4 万美元之间,这取决于数量,因此我们可以大致估测出其有多昂贵。来源:芯榜
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。