【48812】谷歌称Gemini AI正在让机器人变得更智能
来源:乐鱼网.com 发布时间:2024-07-20 01:33:01
来源:乐鱼网.com 发布时间:2024-07-20 01:33:01
谷歌正在运用 Gemini AI 练习其机器人,以便它们可以更好地导航和完成任务。
DeepMind 机器人团队在一篇新研讨论文中解说了怎么样去运用Gemini 1.5 Pro的长上下文窗口(决议 AI 模型能处理多少信息)让用户更轻松地运用自然语言指令与其RT-2 机器人进行交互。
这项技能的作业原理是拍照指定区域(例如家庭或办公室空间)的视频,研讨人员运用 Gemini 1.5 Pro 让机器人观看视频以了解环境。
然后,机器人能依据观察到的状况,运用口头和/或图画输出履行命令 - 例如在向用户展现手机并问询「我在哪里可以给它充电?」之后,引导用户到电源插座。
DeepMind 标明,其 Gemini 驱动的机器人在 9,000 多平方英尺的操作区域内对 50 多条用户指令的成功率到达 90%。
研讨人员还发现开始依据,标明Gemini 1.5 Pro 使其机器人可以规划怎么样履行除导航之外的指令。
例如,当办公桌上有许多可乐罐的用户问询机器人是否有他们最喜欢的饮料时,该团队标明 Gemini知道机器人应该导航到冰箱,查看是不是有可乐,然后回来给用户陈述成果。
谷歌供给的视频演示令人形象十分深入,虽然依据研讨陈述,机器人承认每个恳求后显着的切换掩盖了处理这些指令需求 10-30 秒的时刻。咱们或许还需求一段时刻才能与更先进的环境地图机器人同享咱们的家乡,但至少这些机器人或许能找到咱们丢掉的钥匙或钱包。