港美股软件开发:英伟达跌超3%!黄仁勋GTC演讲来了:Blackwell芯片全面投产 下一代Rubin将于2026年推出

作者:金策略小编 发布时间:2025-03-19 浏览量:

港美股软件开发:当地时间 3 月 18 日,周二,英伟达首席执行官黄仁勋在加州圣何塞举办的英伟达 AI 盛会 GTC 2025 上发表了主题演讲。

黄仁勋表示,去年的 GTC 大会被赞誉为 AI 领域的 Woodstock 音乐节,而今年的 GTC 则被称作 AI 行业的美版春晚 “超级碗”。他指出,这两种称呼的唯一差异在于,在 “超级碗” 的赛场上,每一个参与者都是赢家。

此次演讲中,黄仁勋不仅探讨了 AI 科技的演进历程以及计算需求,对 AI 扩展定律进行了预测,还公布了英伟达 Blackwell 架构的最新一代产品,以及后续几代产品的计划出货时间,同时分享了英伟达在机器人领域合作研发的进展情况。

在二级市场方面,美东时间周二,英伟达(NVDA,股价为 115.43 美元,总市值达 2.82 万亿美元)的股价下跌了 3.43%。

进入今年以来,英伟达的股价累计跌幅已超过 16%,不过近期出现了一定程度的反弹。以今年的预期收益来计算,英伟达目前的市盈率不到 27 倍,相较于去年 GTC 大会时降低了 23%,甚至比多数增长速度更缓慢的超大型科技股的市盈率还要低。

瑞穗证券交易部门的分析师乔丹・克莱恩表示,投资者当前正密切关注英伟达所面临的一系列不利因素。他提到:“许多人并不相信,也不期望 GTC 大会能够掩盖所有的不确定性和担忧,其中包括美国宏观经济的疲软态势、关税的不确定性、短期内毛利率的下降,以及供应链问题对新产品增速的限制等。”

即将迈入代理式 AI 时代


黄仁勋介绍了 AI 研发的发展脉络,从最初的意识 AI(Perception AI),到如今的生成式 AI(Generative AI),他预计我们即将进入代理式 AI(Agentic AI)时代,而紧接着到来的将是物理 AI(Physical AI)时代,也就是机器人的时代。

黄仁勋表示,当下我们正在探索如何扩展 AI,未来必须重点关注 AI 模型的训练与扩展构建。他详细阐述了 AI 扩展定律(scaling law)的发展演变过程,从预训练扩展、训练后扩展,到测试时间扩展,即 “长思维” 模式。

在周二当天,英伟达发布了一系列面向开发者和企业的开源 AI 模型,旨在帮助他们构建 Agentic AI 平台。同时,针对企业推出了 Blackwell Ultra DGX SuperPOD。

黄仁勋称,自 Blackwell 芯片推出一年以来,AI 行业取得了巨大的进步,AI 功能变得愈发强大。2024 年,全球前四大云服务提供商共采购了 130 万片 Hopper 架构芯片。到了 2025 年,这些云服务提供商又采购了 360 万片 Blackwell 芯片。据预计,到 2028 年,数据中心建设方面的支出将达到 1 万亿美元。

黄仁勋展示了英伟达用于简化加速平台处理以及在数据和 AI 等领域应用的 CUDA-X 库。他表示,AI 加速能够服务于众多行业,各行各业都可以应用 CUDA-X 库,并且强调这仅仅是实现加速计算的众多库中的一小部分。

黄仁勋预测,未来每家公司都将拥有两个工厂,一个用于生产实际产品,另一个则用于 AI 数学运算。他强调,AI 将渗透到所有行业当中。

此外,黄仁勋还宣布,英伟达将扩大与通用汽车的合作规模。通用汽车将借助英伟达的技术来助力开发自动驾驶汽车,并利用英伟达的技术训练 AI 制造模型。

英伟达推出了一款专注于汽车安全的 AI 解决方案,名为英伟达 Halos。黄仁勋自豪地表示:“我相信,我们是世界上第一家对每一行代码都进行安全评估的公司。”

黄仁勋同时宣布,英伟达将与思科和 T-Mobile 等公司展开合作,共同研究和开发适用于下一代无线网络 6G 的 AI 原生网络。

当天,黄仁勋还宣布英伟达发布了两款 AI 电脑,分别命名为 DGX Spark 和 DGX Station,并将它们誉为 “AI 时代的计算机”。这两款电脑均采用了 Blackwell 架构的芯片。其中,DGX Spark 采用 GB10 Grace Blackwell 超级芯片,外形与 Mac-Mini 相似;而 DGX Station 体积更大,由 GB300 Grace Blackwell Ultra Desktop 芯片驱动。

Blackwell 架构实现全面投产


在谈到数据中心时,黄仁勋表示,Blackwell 架构的芯片已经实现全面投产,并且 “客户需求极为旺盛,令人难以置信”。

他再次展示了今年 1 月在 CES 上演示过的超级芯片 Grace Blackwell NVLink 72。该芯片在一个晶圆上集成了 72 个 Blackwell GPU,并且配备 18 个 NVLink Switch,在 4 位浮点数 FP4 运算上能够实现 1.4 EFLOPS 的计算性能。

英伟达推出了一款新的开源软件 Dynamo,号称未来的 “AI 工厂操作系统”。它是一个 “分布式推理服务库”,本质上是一个开源解决方案,旨在解决无法提供足够用户所需 token 的问题。微软和 Perplexity 成为了 Dynamo 的首批合作伙伴。

黄仁勋展示了 Blackwell 架构相较于 Hopper 超级计算机的优势。通过将 Grace Blackwell NVLink72 芯片与 Dynamo 相结合,Blackwell 架构的性能比 Hopper 架构提升了 25 倍。他指出:“在推理模型中,Blackwell 的性能是 Hopper 的 40 倍。”

黄仁勋开玩笑地说,Hopper 在一些任务中已经能够胜任,但 Blackwell 的出现,让他成为了 “破坏收入的头子”。他表示,有了 Blackwell 等最新技术的支持,搭建 AI 工厂的厂商 “无论怎样,购买的数量越多,节省的成本也就越多”。

下一代 Vera Rubin 将于一年后出货


黄仁勋宣布了英伟达芯片新品的相关消息。Blackwell 系列的新品 Blackwell Ultra NVL72 平台将于今年下半年出货,其带宽是前代 GB200 的两倍,内存速度是前代的 1.5 倍。Blackwell Ultra 有两个版本,一个是基于 Arm 设计的 CPU,名为 GB300,另一个是名为 B300 的 GPU。

英伟达表示,Blackwell Ultra 平台为 AI 推理时代奠定了基础。GB300 NVL72 采用机架级设计,连接 72 块 Blackwell Ultra GPU。与 Hopper 架构相比,B300 NVL16 在大语言模型(LLM)上的推理速度提高了 11 倍,计算能力提升了 7 倍,内存增加了 4 倍,能够为 AI 推理等最复杂的工作负载提供突破性的性能。

黄仁勋还公布了 Blackwell 之后下一代 GPU 架构 Rubin AI 数据中心芯片的计划面世时间。

英伟达预计,名为 Vera Rubin 的平台将于 2026 年下半年开始出货。该平台将得到 NVLink 144 技术的加持,包括英伟达首款定制 CPU 设计 Vera 和 GPU 设计 Rubin。Vera Rubin NVLink 144 的性能将是 GB300 NVL 72 的 3.3 倍。

与三年前英伟达在 GTC 大会上首次发布的前代 Grace CPU 相比,Vera 芯片的性能提高了一倍。Vera 基于 Olympus 核心设计,其速度将是去年采用 Blackwell 架构 CPU 的两倍。

Rubin 在进行推理时能够达到每秒 50 千万亿次浮点运算(petaflops)的速度,比当前 Blackwell 芯片每秒 20 petaflops 的速度高出一倍多。Rubin 还可以支持高达 288 GB 的快速内存。实际上,Rubin 是由两块 GPU 组成,从 Rubin 开始,英伟达将把两个或多个芯片组合成一个芯片,并将其视为一个单独的 GPU。

在 Vera Rubin 之后,英伟达预计下一代 Rubin Ultra NVL576 将于 2027 年下半年推出,其性能将是 GB 300 NVL72 的 14 倍。

黄仁勋表示,Rubin 之后的下一代架构名为 Feynman,这个名字来源于著名物理学家理查德・费曼,该架构将于 2028 年亮相。

英伟达推出 Isaac GR00T N1


黄仁勋对机器人市场的潜力给予了高度评价,他认为机器人市场 “很可能会成为最大的产业”。

英伟达宣布推出通用的机器人基础模型 GR00T N1,这是全球首款开源的人形机器人功能模型。

黄仁勋透露,英伟达正与谷歌的 DeepMind 和迪士尼合作,共同开发一款用于机器人模拟的开源、可扩展物理引擎,名为 Newton,预计今年晚些时候完成开发。英伟达表示,Newton 旨在推动机器人技术的学习与发展。

在黄仁勋演讲的现场,展示了一部由英伟达、谷歌与迪士尼合作研发的机器人,名为 Blue,它由英伟达最新的 GR00T N1 模型提供支持。

英伟达称,正在研发一款受《星球大战》电影启发的 BDX 机器人。迪士尼将成为首批使用 Newton 来改进其机器人角色平台的公司之一,该平台将为下一代娱乐机器人提供动力。黄仁勋表示:“通用机器人时代已经来临。借助英伟达 Isaac GR00T N1 以及新的数据生成和机器人学习框架,世界各地的机器人开发人员将开启 AI 时代的下一个前沿领域。”