英伟达首席执行官 Jensen Hiang 在他的 Computex 主题演讲中发布了一系列公告,包括有关公司下一代 DGX 超级计算机的详细信息。鉴于行业的明确 发展方向,DGX GH200 主要用于帮助公司开发也就不足为奇了生成式人工智能楷模。
超级计算机使用新的 NVLink 开关系统,使 256 个 GH200 Grace Hopper 超级芯片能够充当单个 GPU(每个芯片都有一个基于 Arm 的 Grace CPU 和一个 H100 Tensor Core GPU)。据 NVIDIA 称,这使 DGX GH200 能够提供 1 exaflop 的性能并拥有 144 TB 的共享内存。该公司表示,这几乎是单个 DGX A100 系统内存容量的 500 倍。
为了比较, 最新排名Top500 超级计算机列表田纳西州橡树岭国家实验室的前沿作为唯一已知的 exascale 系统,在 Linmark 基准测试中达到了近 1.2 exaflops 的性能。这是排名第二的日本系统峰值性能的两倍多富岳.
实际上,NVIDIA 声称已经开发出一台超级计算机,可以与地球上最强大的已知系统并驾齐驱(Meta 正在建造一台它声称一旦完全建成将成为世界上最快的 AI 超级计算机)。 NVIDIA 表示,DGX GH200 的架构提供的带宽是上一代产品的 10 倍,“通过对单个 GPU 进行编程的简单性来提供大型 AI 超级计算机的强大功能。”
一些知名人士对 DGX GH200 很感兴趣。谷歌云、Meta 和微软应该是首批获得超级计算机访问权限的公司之一,以测试它如何处理生成式 AI 工作负载。 NVIDIA 表示,DGX GH200 超级计算机应该会在 2023 年底上市。
该公司还在构建自己的超级计算机 Helios,它结合了四个 DGX GH200 系统。 NVIDIA 预计 Helios 将在今年年底上线。
Huang 在他的主题演讲中讨论了其他生成式 AI 的发展,包括游戏方面的发展。 NVIDIA Avatar Cloud Engine (ACE) for Games 是一项服务,开发人员可以利用该服务为语音、对话和动画创建自定义 AI 模型。 NVIDIA 表示,ACE for Games 可以“赋予不可玩的角色对话技能,这样他们就可以用不断进化的逼真个性来回答问题。”
本文最初出现在 Engadget 上,网址为 https://ift.tt/oVPR5zT