乐鱼网.com

CES大会后独家专访:黄仁勋解读机器人、AI与未来技术(附视频)

来源:乐鱼网.com    发布时间:2025-02-24 19:06:46

  在拉斯维加斯“CES2025”科技盛会的聚光灯暗淡之后,NVIDIA CEO接受独家专访,深入分享了令人振奋的技术新进展。从Cosmos平台彻底改变机器人训练模式,到与丰田在自动驾驶领域的重大合作,NVIDIA正在用创新重塑多个技术领域的未来。

  让机器理解物理世界的方式正在发生革命性变化,黄仁勋这样描述Cosmos和Omniverse的突破性进展。通过在虚拟环境中进行学习,机器人的训练周期从原本需要的数年时间被大幅压缩到了数小时。这不仅仅是效率的提升,更代表着AI领域的一个重要里程碑。

  在自动驾驶领域,NVIDIA与丰田的合作展现了将尖端技术转化为现实应用的典范。通过创新的三计算机系统架构,他们不仅推进了技术边界,更着重强调了安全性这一核心要素。这个合作标志着汽车制造业与AI技术的深层次地融合正在加速。当被问及他认为最具影响力的技术时,黄仁勋的回答揭示了更宏大的愿景。在他看来,我们正站在一个前所未有的技术变革起点,未来发展的轨迹将超出人们的想象。这不是一个简单的预测,而是建立在深刻的产业洞察之上。

  主持人:听说您在 CES 上发布了一些突破性公告,尤其是在机器人领域。我特别想知道,您对机器人领域的可能性最感兴趣的是什么?

  黄仁勋:现在有了像 Cosmos 和 World Foundation Models 这样的工具,我们正处于机器人技术的一个非凡时期。构建通用仿人机器人的关键技术就在眼前。其中一项关键技术是一种理解世界的 AI 模型,就像我们现在有了理解语言的 AI 模型,例如 ChatGPT 和 Llama。我们应该一个‘世界模型’,一个关于世界的语言模型。

  黄仁勋:世界需要机器人,原因之一是我们的人手不够用。老龄化人口、工作偏好的变化,以及出生率的下降,都使得世界需要更加多的劳动力。因此,开发机器人系统的时机非常紧迫。

  黄仁勋:构建通用仿人机器人的技术是最有用的,因为我们是围绕人类自身设计了这样一个世界。然而,这项技术极其困难。但这是第一次,凭借 Transformers、大型语言模型以及基础模型的突破,我们终于拥有了必要的技术,可以在这一领域做出真正的贡献。要实现这一目标,需要将多个方面结合起来。首先,机器人需要理解语言,例如 ChatGPT 的突破就让这成为可能。但是,现在还缺少的是一个理解物理世界的 AI 模型。它需要理解物理世界的动态,比如重力、惯性和摩擦力,还需要理解空间关系、几何关系,以及一些常识,比如物体恒常性等。因此,我们开始创建一个类似于 ChatGPT 的‘世界模型’,叫做 World Foundation Model。这是一个理解世界的基础模型。

  黄仁勋:如果我们也可以创建这样的模型——这就是 Cosmos 的核心——我们已将它开放给所有人使用。希望它能真正点燃和加速机器人技术的发展。

  主持人::在机器人教学方面,我知道您也发布了关于 Isaac Groot 的公告,尤其是围绕虚拟现实训练这一块。您怎么看这种技术的发展前途以及它可能带来的机遇?

  黄仁勋:训练 AI 的第一步是为其提供基础知识,也就是常识。第二步是对其进行技能微调,教会它具体的事情。训练通用机器人有点像训练一个人,你需要给它做示范。比如,你能告诉机器人如何拿起一个杯子,但每次杯子的形状、位置和高度可能都不一样。然而,本质上来说,这仍是教它如何拿起一杯水。通过 Isaac Groot,我们大家可以进行几次人类示范,然后利用 AI、Cosmos 和 Omniverse 生成大量的未来场景。我们大家可以生成不一样的尺寸、不同位置和不同摆放方式的杯子版本。然后,我们将这些训练数据作为模仿数据提供给机器人学习。这样,机器人就可以学会大量的泛化版本。

  主持人:是的,因为这听起来似乎有无穷无尽的版本可供训练。而这种方式的真正意义就在于,通过提供这些版本,能够更好地训练机器人。

  黄仁勋:没错。与其只提供一个例子,我们大家可以为机器人提供数百万个不同的例子。

  主持人:您提到了 Omniverse,我对此非常感兴趣,尤其是在制造等行业中的虚拟训练方面。您怎么看这一些行业利用 Omniverse 进行培训的发展?

  黄仁勋:机器人行业的起步一直很困难,因为训练机器人很难。要为机器人创建大量的体验场景,同时在物理世界中训练机器人也很危险。因此,我们创建了一个虚拟的游乐场,专门为机器人而设计。这个 Omniverse 是一个虚拟游乐场,对于机器人来说,它感觉就像真实的世界,因为它遵循物理定律,视觉上也与现实世界非常相似,机器人分辨不出两者的区别。我们在这个名为 Omniverse 的虚拟世界中训练机器人,为它创造了大量场景供其学习。当机器人学会了如何在 Omniverse 中执行任务后,我们会将这个机器人大脑移植到真实的机器人中。如果模拟与现实之间的差距足够小,机器人几乎察觉不到区别。

  主持人:这真是太了不起了,而且我相信这也节省了大量资源和时间。如果用其他方式来进行训练的话,应该会十分艰难吧?

  黄仁勋:是的,否则几乎是不可能的。如果你想在物理世界中训练一个机器人学会行走,它会以人类时间、线性时间进行学习。但在 Omniverse 中,我们大家可以创建许多平行的‘多元宇宙’进行训练。机器人能同时以 10 万种不同的方式学习本领。这样一来,原本要消耗 10 年时间训练机器人的任务,现在只需要几个小时就能完成。试想一下,如果我们人类也能有多元宇宙版本,那我们会多么聪明!不同版本的‘你’可能同时在学习数学、科学、英语和地理,而这一切可以同步进行。Omniverse 的本质就是这样一个学习环境。我们真希望人类也能拥有这样的学习方式。

  主持人:NVIDIA还 公布了与 Drive AI 相关的公告,重点是提升无人驾驶汽车的安全性。我知道您还宣布了与丰田的合作,这真是非常激动人心的消息。

  黄仁勋:是的,这是一则重磅新闻。丰田是全球最大的汽车公司,我们对此感觉到很兴奋。

  主持人:那么,您认为 NVIDIA Drive AI 的未来发展趋势是什么?

  黄仁勋:我们在无人驾驶领域已经耕耘了一段时间,目前这一业务已经为我们创造了约 50 亿美元的收入。我们服务自动驾驶汽车行业的方式主要通过三个计算系统:

  在自动驾驶中,安全性是重中之重。解决安全问题的方法首先在于算法必须是安全的——它需要能够聪明地识别和规避风险,知道怎么安全驾驶。但这只是算法层面的事情。更深入来看,操作系统本身也必须设计得安全,车载计算机也必须确保设计不可能会出现故障,即使发生故障,也能以安全的方式来进行。这涉及很复杂的技术,比如多样化的算法和计算冗余,所有这些复杂的技术最终让安全成为可能。

  主持人:您提到的这一点非常有意思。从消费者的角度来看,人们更多地将安全性与物体检测联系在一起,但正如您所说,这其实涉及多个层面,最核心的还是算法层面的安全性。

  主持人:黄仁勋,您带领 NVIDIA 在游戏和众多 AI 突破中取得了巨大成就。您认为未来十年中,哪项新兴技术将对我们产生最深远的影响?

  黄仁勋:人工智能无疑是我们这个时代最重要的技术。如果退一步思考,当我们大家可以扩展智能,将其应用到更多领域,比如医疗中的新药研发、应对气候平均状态随时间的变化,或者开发机器人来解决老龄化和人口下降问题时,我们大家可以提升生产力,从而缓解全世界内的通货膨胀压力。人工智能的影响是如此深远,这也是为什么我们公司完全专注于人工智能的原因。人工智能还影响到我们其他所有业务。比如,尽管 GeForce 曾是推动人工智能发展的载体,现在人工智能反过来又让计算机图形技术变得更出色。通过将AI与物理科学结合,我们正在彻底改变科学计算的方式;通过将 AI 融入芯片设计中,我们也可以设计出更好的芯片;同时,我们也用 AI 优化了软件开发过程。

  主持人:人工智能正在影响我们所做的一切,它将对各个行业产生深远的影响。毫无疑问,这是当前最重要的技术。那么,这也引出了我的一个问题。关于职业建议:我的很多观众和粉丝都在计算机科学或技术领域工作。他们经常问这样一个问题:在科技行业中有如此多的方向可以再一次进行选择,该怎么样发展自己的职业生涯?从商业和技术的角度来看,人工智能似乎是一个很值得继续深入的领域,您怎么看?

  黄仁勋:当然,推动人工智能的基础科学发展是很棒的,我对此非常赞赏。然而,在接下来的十年里,人工智能的应用科学将变得很重要。就像我天天都会把 ChatGPT 当作我的伙伴。我随时都在使用它,不断向它提问并处理问题。与 AI 互动是一项需要学习的技能,而‘提示设计’(Prompting)是一门有艺术性和科学性的技巧。无论是与人交流,还是与 AI 互动,我们都需要学会怎么样进行有效的交流。更重要的是,我们应该研究怎么样将AI应用到内容创作、工程、软件开发、市场营销、金融、法律等领域。无论你对哪个行业感兴趣,都应该探索如何在其中应用 AI。我认为,这是一个值得深入研究和发展的方向。

  就像我的那一代人专注于如何应用计算机解决芯片设计和软件工程的问题,这一代人则需要探索如何应用AI回答这些同样基本的问题。比如,如何将 AI 应用于森林管理、海洋科学等等。人工智能的潜力是无限的,每个行业、每个科学领域都能从中受益。

  星标公众号, 点这里 1. 点击右上角 2. 点击设为星标 ← AI深度研究员 ⋮ ← 设为星标

上一篇:2024年最伟大的六款科学技术产品推荐! 下一篇:人形机器人SE01火爆海外!抓住未来科技风潮的先锋