新浪科技

黄仁勋出手!45倍性能暴涨,英伟达定义物理AI新纪元

创事记

关注

来源:新智元

GPU里模拟世界,这事儿英伟达真做到了

计算机图形学顶会SIGGRAPH 2025上,英伟达演示了如何把世界装进GPU:先仿真,再落地,GPU里跑通物理世界。

黄仁勋发表了特别演讲,回顾了英伟达的「光辉岁月」。

随后,英伟达副总裁Sanja Fidler、Aaron Lefohn和Ming-Yu Liu劉洺堉展示了AI应用于图形学和图形学应用于AI方面的研究成果。

NVIDIA AI研究副总裁Sanja Fidler解释道:

AI的发展推动了仿真技术进步,而仿真技术又反过来促进了AI系统的提升。

为此,NVIDIA展示了一整套完整生态,包括采用最新Blackwell架构的硬件产品、专门的仿真平台,以及能执行逻辑推理的新一代AI模型。

在大会上,英伟达祭出「物理AI」全家桶.

  • Blackwell架构的RTX PRO 6000服务器显卡性能暴涨45倍、能效翻18倍;

  • 桌面级RTX PRO 4000 SFF仅70 W即带来2.5倍AI加速;

  • 开放Isaac Sim 5.0与Omniverse NuRec,把真实工厂 1:1 搬进云端;

  • 7B视觉语言模型Cosmos Reason加持机器人「常识」;

  • Metropolis平台联动CrowdStrikeUber,做智能围栏、交通眼。

英伟达新货上新

为了满足对算力需求极高的AI应用,NVIDIA推出了RTX PRO 6000 Blackwell Server Edition GPU,采用业内常见的2U机箱设计,适合主流数据中心部署。

与传统CPU系统相比,这些新服务器的性能提升最高达45倍,能效提升18倍。GPU内置第五代Tensor Cores核心,支持FP4数值格式;在AI推理任务中,性能较上一代L40S GPU提高多达6倍。

面向机器人工作流的新服务器方面,英伟达推出RTX PRO Blackwell Server,为机器人开发类负载提供统一架构。

同时NVIDIA DGX Cloud作为基于云的管理平台也同步亮相。

在桌面端,NVIDIA推出了RTX PRO 4000 SFF和RTX PRO 2000 Blackwell两款紧凑型显卡,适用于工程、设计及3D可视化等对能耗敏感的应用场景。

在功耗不变的前提下,RTX PRO 4000 SFF把AI性能比上一代提升了2.5倍。

而RTX PRO 2000在CAD设计方面性能提升了1.4倍。

这两款显卡预计今年稍晚上市。

上述硬件专为实现NVIDIA的物理AI愿景打造。

物理AI,不止AI

物理AI的核心思想是,通过仿真创造出与现实高度一致的数字孪生系统,让机器人等AI系统能在虚拟环境中安全地学习和试错,从而在真实环境中更高效地执行任务。

为此,NVIDIA基于Omniverse和Isaac平台提供了关键技术支持。

GPU的实时模拟与协作平台,专为基于皮克斯(Pixar)通用场景描述(USD)的3D生产流程设计

例如,最新发布的Omniverse NuRec软件库,可利用3D高斯泼溅(Gaussian splatting)算法,将现实场景的数据快速、逼真地重建为数字模型。

此外,机器人仿真应用Isaac Sim 5.0 与Isaac Lab 2.2也实现了开源并整合了上述新技术。

NVIDIA Isaac库和AI模型提供了全面的CUDA加速库以及优化的AI模型,为开发、训练、模拟、部署、操作和优化机器人系统提供了一种更好、更高效的方式

亚马逊的「零接触」制造流程便是该技术的典型案例。

通过仿真生成大量合成图像训练AI模型,使机器人无需改造现有硬件设备即可自主完成质检与生产线作业,甚至面对未接触过的产品,也能迅速准确识别。

具身智能,不止世界基础模型

NVIDIA同时推出了Nemotron Nano 2和Llama Nemotron Super 1.5两款AI模型。

新模型通过混合架构及量化技术(NVFP4),帮助企业级AI智能体更高效地完成客服、网络安全等复杂任务。CrowdStrike、Uber、Zoom等企业已率先部署或测试这些新模型。

为进一步支持物理AI(Physical AI)的发展,NVIDIA专门开发了Cosmos世界基础模型。

Cosmos世界基础模型共有三种模型类型,均可在训练后进行定制:cosmos-predict、cosmos-transfer和cosmos-reason。

AI系统的发展

其中最引人注目的是Cosmos Reason1。

Cosmos-Reason1是一套专门的工具集,用于帮助多模态大语言模型(multimodal LLMs)理解物理世界并做出符合现实的推理,其中包含相关的模型、知识框架(本体,ontologies)和评测基准

新模型Cosmos-Reason1-7B,是用于物理AI应用与机器人的推理型视觉语言模型(VLM),规模为70 亿参数。它的训练分为两个阶段:基于物理常识的监督微调(Physical AI SFT)和基于物理反馈的强化学习(Physical AI reinforcement learning)。

英伟达还定义了专门用于描述物理常识与具身推理(embodied reasoning,即与身体感知、动作相关的推理)的知识框架,并搭建了一系列评测基准,用于检测多模态大语言模型在物理推理方面的表现。

根据NVIDIA的介绍,Cosmos Reason之所以能帮助机器人实现「推理」,是因为它具备记忆与对物理环境的理解能力,能够预测智能体下一步的动作或规划路径。该模型可应用于数据整理、机器人行动规划以及视频分析任务中。

Cosmos系列的新成员还包括Cosmos Transfer-2,这个模型能加快通过3D仿真场景或空间控制指令生成合成数据。此外,还有Cosmos Transfer蒸馏版,它经过特别优化,运行速度更快。

NVIDIA还发布了新的神经重建库,其中包括能利用传感器数据对真实世界进行3D模拟的渲染技术。这种技术正被整合到知名的开源模拟器CARLA中。

同时,Omniverse软件开发工具包也推出了新版本。

集成平台

为推动这些前沿技术落地到智能基础设施建设中,NVIDIA将多个关键组件统一集成到了Metropolis平台。

平台新近加入了Cosmos Reason模型,且在TAO Toolkit中新增了一批基础视觉模型,并通过扩展Isaac Sim平台,可模拟在现实中较难遇到的特殊场景,以更好地训练 AI 系统。

多家合作伙伴已经开始基于该平台推出创新解决方案。比如,有公司正在利用Omniverse平台开发「智能虚拟围栏」,提升工人在工业机器人周围的作业安全性。

加载中...