NVIDIA开源技术铁三角:重构机器人研发的速度与精度边界
2025/10/02在机器人学习大会(CoRL)的技术发布现场,NVIDIA Omniverse与仿真技术副总裁Rev Lebaredian表示:“人形机器人是物理AI的下一个前沿领域,需要在不可预测的世界中进行推理,适应环境并安全行动。”
随着开源物理引擎Newton、推理模型Isaac GR00T N1.6与Cosmos世界基础模型的协同发布,NVIDIA正以“大脑-身体-训练基地”的技术铁三角,彻底重塑机器人从研发到落地的全链路生态。
物理仿真革命:Newton引擎破解“虚实鸿沟”
机器人在仿真环境中的学习速度更快、安全性更高,但人形机器人关节结构、平衡控制和动作模式非常复杂,现有物理引擎的性能已经难以满足。全球超过25万机器人开发者亟需精准的物理仿真技术,以确保在仿真环境中教会机器人技能,同时安全可靠地迁移到现实世界。
作为由Linux Foundation管理的开源项目,Newton基于NVIDIA Warp加速库与OpenUSD框架构建,其突破性在于实现了精度与效率的双重飞跃。借助GPU并行计算能力,该引擎使人形机器人仿真速度大幅提升。这种性能突破让复杂场景仿真成为可能:机器人在雪地碎石路面的步态调节、对瓜果等柔性物体的精细抓取,这些以往物理引擎难以模拟的交互行为,如今能在虚拟环境中精准复现并无缝迁移至现实。
Newton的开源属性更激活了全球创新力量。苏黎世联邦理工学院用其优化机器人运动控制算法,北京大学将其应用于触觉交互研究,光轮智能等企业则借助其多求解器兼容特性开发定制化仿真方案。
认知能力跃迁:GR00T模型赋予机器人“深度思考”
如果说Newton是机器人的“骨骼肌肉”,那么Isaac GR00T N1.6就是驱动其行动的“智能大脑”。传统机器人往往局限于执行明确指令,面对“拿那个东西”这类模糊需求或未知场景时便极易“卡壳”,而GR00T N1.6通过集成Cosmos Reason推理模型,实现了从“执行指令”到“理解意图”的跨越。
最新发布的开源机器人基础模型 NVIDIA Isaac GR00T N1.6,即将在Hugging Face平台上线。这一模型将集成NVIDIA Cosmos™ Reason——一款专为物理 AI 打造的开源、可定制的推理视觉语言模型。作为机器人的“深度思考大脑”,Cosmos Reason 能够利用已有知识、常识和物理原理,将模糊的指令转化为逐步执行的计划,从而应对新场景并泛化到多种任务中去。
据了解,Cosmos Reason的下载量已超过100万次,目前在Hugging Face 的物理推理模型排行榜上位居榜首。借助NVIDIA Isaac GR00T N1.6,人形机器人可以同时完成移动和物体操控动作,其躯干和手臂拥有更大的活动自由度,能够完成各种高难度任务,比如推开较重的房门。
开发者还可以利用Hugging Face平台上的开源NVIDIA物理AI数据集,对NVIDIA Isaac GR00T N系列模型进行后训练。该数据集包含数千条合成及来自真实世界的轨迹数据,目前下载量已超过480万次。
数据引擎升级:Cosmos模型破解训练瓶颈
机器人AI的进化离不开海量数据喂养,但真实世界数据采集成本高昂、场景覆盖有限,成为制约研发效率的关键瓶颈。下载量超300万次的Cosmos世界基础模型,通过生成式AI技术构建了可持续的“数据工厂”,为物理AI训练提供了无限可能。
这款基于2000万小时视频训练的模型,采用扩散与自回归双重架构,可通过文本、图像等提示生成高度逼真的合成数据。即将推出的Cosmos Predict 2.5实现三大模型的整合,支持30秒长视频生成与多视角输出,能模拟从家庭厨房到工厂车间的多样化场景;Cosmos Transfer 2.5则将模型体积压缩至前代的1/3.5,同时提升生成速度与质量,可基于3D场景数据生成含深度信息的高保真训练素材。
这些合成数据与真实数据的结合产生了显著效能:借助Cosmos生成的75万个合成轨迹,GR00T模型性能提升40%,且能有效应对极端天气、复杂地形等罕见场景的训练需求。Uber用其优化自动驾驶决策系统,小鹏汽车借助其生成恶劣天气训练数据,1X机器人则通过其实现动态规划优化,充分展现了Cosmos跨领域的应用价值。
全栈生态支撑:从实验室到生产线的无缝衔接
先进软件工具的落地离不开硬件基础设施的支撑。NVIDIA同步推出的GB200 NVL72、RTX PRO服务器与Jetson Thor构成三级算力体系,覆盖从云端训练到终端推理的全场景需求。其中,搭载Blackwell GPU的Jetson Thor实现了机器人端实时推理突破,支持多AI工作流并行运行,成为Figure AI、宇树科技等企业人形机器人的核心算力单元。
为打通研发全流程,NVIDIA还构建了完整的工具链生态:Isaac Lab 2.3新增的灵巧抓取工作流,通过梯度调整重力、摩擦力等参数,让Boston Dynamics的Atlas机器人抓取能力显著提升;即将推出的Isaac Lab Arena框架,则提供了标准化的大规模测试环境,避免机器人在“完美仿真”中形成的能力错觉。
这些技术创新已获得全球学界与产业界的广泛认可。CoRL收录论文中近半数引用NVIDIA技术,斯坦福、苏黎世联邦理工等顶尖高校用其推进基础研究;Agility Robotics、Franka Robotics等领军企业借助Isaac与Omniverse技术加速产品迭代。从实验室的算法验证到工厂的柔性生产,NVIDIA正以开源生态为纽带,推动机器人技术从“单点突破”走向“体系成熟”。
在智能制造的智能化转型浪潮中,机器人的普及速度取决于研发效率与落地可靠性的双重突破。NVIDIA通过开源技术打破行业壁垒,用“大脑-身体-训练基地”的协同架构解决了推理、仿真、数据三大核心痛点。当Newton的精准仿真、GR00T的深度思考与Cosmos的数据生成形成合力,机器人从实验室走向生产线的路径正变得前所未有的清晰,一个更智能、更灵活的智能制造时代已近在眼前。
