NVIDIA Cosmos平台: 打破物理AI开发壁垒革命性人形机器人进展!
来源:乐鱼网.com 发布时间:2025-03-18 23:56:32
来源:乐鱼网.com 发布时间:2025-03-18 23:56:32
在科技浪潮的推动下,NVIDIA最近在CES 2025大会上重磅推出了名为Cosmos的新型世界基础模型平台。这位科技巨头的创始人兼首席执行官黄仁勋亲自揭晓这一创新,这一举措旨在为无人驾驶和通用机器人领域解决长期以来的数据瓶颈问题。
Cosmos平台结合了先进的生成式世界基础模型、高效的视频分词器、安全的护栏以及快速的视频处理流水线,特别为NVIDIA数据中心的GPU进行了深度优化,以此加速物理AI系统的发展,无论是无人驾驶汽车,还是机器人。开发物理AI历来需要高昂的成本、海量的真实数据和繁琐的测试流程,而Cosmos的发布则旨在简化这一过程,使开发者能够轻松生成基于物理学的高逼真合成数据,极大地降低数据获取的门槛。
开发者不仅仅可以通过微调Cosmos模型来创建符合特定需求的定制模型,还能在开发途中利用NVIDIANeMoCurator加速视频处理,使用NVIDIANeMo框架来定制其世界模型,甚至通过NVIDIADGXCloud平台轻松将模型部署到实际应用中。
在Cosmos平台的首批用户中,包括多个全球物理AI领域的领军企业,如1X、思灵机器人、Agility、FigureAI等,跨越了机器人、无人驾驶、共享出行等多个领域。NVIDIA还以开放模型许可证的方式推出了8款模型,参数量从40亿到140亿不等,开发的人能在NVIDIA API目录中查阅,下载模型和微调框架。
黄仁勋在演讲中指出,“机器人技术的ChatGPT时代即将来临。与大语言模型一样,世界基础模型将成为推动机器人和无人驾驶汽车开发的关键力量。”为实现这一目标,NVIDIA创建Cosmos的初衷是让每一位开发者都能接触到通用机器人技术,推动整个行业的迅速崛起。
Cosmos世界基础模型采用了一套开放扩散和自回归Transformer模型架构,借助2000万小时真实世界数据的训练,它具备了根据文本、图像及视频等输入生成高度真实的物理学视频的能力,还能重现仿真工业环境和多样化的驾驶场景。黄仁勋展示了多个Cosmos的实际应用场景,包括视频搜索、物理AI模型开发与评估等,充分体现了Cosmos在推动物理AI发展过程中的巨大潜力。
在隐私和数据保护方面,NVIDIA认认真真地对待,Cosmos遵循可信AI原则。平台包括了减少有害文字与图像的护栏,能有效提升文字提示的准确性。生成的视频更会带有隐形水印,以减少错误信息和错误归属。
许多物理AI企业慢慢的开始采用Cosmos技术并取得显著成果,例如1X借助CosmosTokenizer推出了全新的1XWorldModelChallenge数据集;Hillbot和SkildAI加速了通用机器人的开发;小鹏汽车也在利用Cosmos进行人形机器人的研发。这些成功案例进一步印证了Cosmos在物理AI推进中的巨大价值。
在交通运输领域,Waabi、Wayve与Foretellix等企业同样热衷于探索Cosmos的应用,Uber的CEO也表示,借助NVIDIA,他们将能更快地研发出安全、可扩展的无人驾驶解决方案。可以说,NVIDIA的Cosmos平台不仅是在技术层面的一次飞跃,更是在推动整个行业未来发展的重要动力。返回搜狐,查看更加多