英伟达最新AI芯片成本能耗降低25倍

号称今年全球头号人工智能（AI）领域开发者大会的英伟达2024 GTC AI大会于美东时间3月18日周一拉开帷幕。今年是英伟达时隔五年首次让年度GTC重回线下，也是此前分析认为英伟达要“拿出点真家伙”的AI盛会。

当地时间周一下午，英伟达创始人兼CEO黄仁勋在美国加州圣何塞SAP中心进行主题为“面向开发者的1#AI峰会”（1#AI Conference for Developers）演讲。黄仁勋介绍了运行AI模型的新一代芯片和软件。英伟达正式推出名为Blackwell的新一代AI图形处理器（GPU），预计将在今年晚些时候发货。

Blackwell平台能够在万亿参数级的大型语言模型（LLM）上构建和运行实时生成式AI，而成本和能耗比前身低25倍。

另据媒体报道，英伟达CEO黄仁勋在GTC宣布，将在其企业软件订阅中增加一款名为NIM的新产品。NIM可以更容易地使用旧的英伟达GPU进行推理，并允许公司继续使用他们已经拥有的数亿个英伟达GPU。该产品将使新人工智能模型的初始训练推理所需的算力更少。该公司的策略是让购买英伟达服务器的客户注册英伟达企业版，每个GPU每年收取费用4500美元。黄仁勋表示，该软件还将帮助在配备GPU的笔记本电脑上运行人工智能，而不是在云服务器上运行。

此外，英伟达CEO黄仁勋宣布推出下一代人工智能超级计算机，英伟达还发布6G研究云平台，以便用AI技术推进无线通信。

英伟达推新AI芯片
据外媒报道，英伟达于周一宣布推出新一代人工智能芯片和用于运行人工智能模型的软件。该公司在美国圣何塞举行的开发者大会上宣布了这一消息，正值这家芯片制造商寻求巩固其作为人工智能公司首选供应商的地位。

自OpenAI的ChatGPT于2022年末掀起人工智能热潮以来，英伟达的股价上涨了五倍，总销售额增长了两倍多。英伟达的高端服务器GPU对于训练和部署大型AI模型至关重要。微软和Meta等公司已经花费了数十亿美元购买这些芯片。

新一代AI图形处理器命名为Blackwell。首款Blackwell芯片名为GB200，将于今年晚些时候发货。英伟达正在用更强大的芯片吸引客户，以刺激新订单。例如，各公司和软件制造商仍在争相抢购当前一代的“Hopper”H100芯片及类似产品。

“Hopper很棒，但我们需要更大的GPU，”英伟达首席执行官黄仁勋周一在该公司于加利福尼亚州举行的开发者大会上表示。不过，周一盘后交易中，英伟达股价下跌超过1%。该公司还推出了名为NIM的创收软件，该软件将简化AI的部署，为客户提供了在日益增多的竞争者中坚持使用英伟达芯片的另一个理由。

英伟达高管表示，该公司正从一个唯利是图的芯片提供商转变为更像微软或苹果的平台提供商，其他公司可以在此基础上构建软件。

“Blackwell不仅仅是一款芯片，而是一个平台的名称，”黄仁勋表示。

英伟达企业副总裁Manuvir Das在接受采访时表示：“可销售的商业产品是GPU，而软件则是为了帮助人们以不同的方式使用GPU。当然，我们现在仍然这样做。但真正改变的是，我们现在真的有了商业软件业务。”

Das表示，英伟达的新软件将更容易在任何英伟达GPU上运行程序，甚至是那些可能更适合部署而不是构建AI的老旧GPU。“如果你是开发者，你有一个有趣的模型，你希望人们采用它，如果你把它放入NIM中，我们会确保它可以在我们所有的GPU上运行，这样你就可以覆盖很多人，”Das说道。

Blackwell拥有六项革命性技术
英伟达每两年更新一次其GPU架构，实现性能的飞跃。过去一年发布的许多AI模型都是在该公司的Hopper架构上训练的，该架构被用于H100等芯片，于2022年宣布推出。

据悉，英伟达称，Blackwell拥有六项革命性的技术，可以支持多达10万亿参数的模型进行AI训练和实时LLM推理：

全球最强大的芯片：Blackwell架构GPU由2080亿个晶体管组成，采用量身定制的台积电4纳米工艺制造，两个reticle极限GPU裸片将10 TB/秒的芯片到芯片链路连接成单个统一的GPU。

第二代Transformer引擎：结合了Blackwell Tensor Core技术和TensorRT-LLM和NeMo Megatron框架中的英伟达先进动态范围管理算法，Blackwell将通过新的4位浮点AI支持双倍的计算和模型大小推理能力。

第五代NVLink：为提高数万亿参数和混合专家AI模型的性能，最新一代英伟达NVLink为每个GPU提供了突破性的1.8TB/s双向吞吐量，确保最复杂LLM之间多达576个GPU之间的无缝高速通信。

RAS引擎：Blackwell支持的GPU包含一个专用引擎，实现可靠性、可用性和服务性。此外，Blackwell架构还增加了芯片级功能，利用基于AI的预防性维护进行诊断和预测可靠性问题。这可以最大限度地延长系统正常运行时间，并提高大部署规模AI的弹性，使其能连续运行数周甚至数月，并降低运营成本。

安全人工智能：先进的机密计算功能可在不影响性能的情况下保护AI模型和客户数据，并支持新的本机接口加密协议，这对于医疗保健和金融服务等隐私敏感行业至关重要。

解压缩引擎：专用解压缩引擎支持最新格式，加快数据库查询，提供数据分析和数据科学的最高性能。未来几年，在企业每年花费数百亿美元的数据处理方面，将越来越多地由GPU加速。

Blackwell GPU体积庞大，将两个单独制造的晶粒组合成一个由台积电制造的芯片。它还将作为一款名为GB200 NVLink 2的整个服务器提供，该服务器结合了72个Blackwell GPU和其他旨在训练AI模型的英伟达部件。

亚马逊、谷歌、微软和甲骨文将通过云服务提供对GB200的访问。GB200将两个B200 Blackwell GPU与一个基于Arm的Grace CPU配对。英伟达表示，亚马逊网络服务将构建一个包含20000个GB200芯片的服务器集群。

英伟达没有提供新款GB200或其使用系统的成本。据分析师估计，英伟达基于Hopper的H100芯片成本在2.5万至4万美元之间，而整个系统的成本高达20万美元。

英伟达推理微服务
英伟达还宣布，将在其英伟达企业软件订阅中添加一款名为NIM（英伟达推理微服务）的新产品。NIM让使用较旧的英伟达GPU进行推理（或运行AI软件的过程）变得更加简单，并允许公司继续使用其已经拥有的数亿个英伟达GPU。与新AI模型的初始训练相比，推理所需的计算能力较少。对于那些希望运行自己的AI模型，而不是从OpenAI等公司购买AI结果作为服务的企业来说，NIM无疑是他们的得力助手。

英伟达的策略是吸引购买基于英伟达的服务器的客户注册英伟达企业版，每个GPU每年的许可费为4500美元。

英伟达将与微软或Hugging Face等AI公司合作，确保他们的AI模型能够在所有兼容的英伟达芯片上运行。随后，开发者可以使用NIM在自有服务器或基于云端的英伟达服务器上高效运行模型，无需繁琐的配置过程。

“在我原本调用OpenAI的代码中，我只需替换一行代码，将其指向从英伟达获取的NIM即可。”Das说道。

英伟达表示，该软件还将助力AI在配备GPU的笔记本电脑上运行，而非仅限于云端服务器。

每日经济新闻综合第一财经、公开消息

原标题：重磅！“我们需要更大的GPU”，英伟达宣布推出最强AI芯片，成本和能耗较前代改善25倍