“预测未来”!谷歌DeepMind推Dreamer,用已知模型解决未知问题
lipiwang 2025-03-26 13:50 5 浏览 0 评论
智东西(公众号:zhidxcom)
编 | 云鹏
智东西12月13日消息,据外媒报道,谷歌DeepMind和多伦多大学的研究人员在NeurIPS 2019会议上介绍了AI “Dreamer”,可以通过已知世界模型在新环境中对视觉图像的运动方式进行预测。Dreamer在观察到图像运动方式时,会先构想出一些可能的动作,然后判断这些构想动作可能得到的奖励,根据奖励来最终预测动作。
研究人员表示,Dreamer利用了与上一代PlaNet相比,达到相同性能的训练时间缩短了将近一半。并且这种训练方式将来可能在视觉复杂度更高的环境中得以应用。以下是对Venturebeat相关报道的原文编译。
一、运用了“想象力”的Dreamer
一些AI系统通过借助过去经验所提供的世界信息,可以在具有挑战性的环境中实现目标。他们把这些概括为新的情况(novel situations),这使他们在没有遇到过的设置环境中也可以完成目标。
事实证明,强化学习(reinforcement learning)这种利用奖励来推动软件策略朝着目标前进的培训技术,特别适合于学习总结AI经验的世界模型(world models),并通过扩展(extension)来促进新行为(novel behaviors)的学习。
来自DeepMind和多伦多大学的研究人员试图利用这一点,为此他们设计了名为“Dreamer”的AI,旨在将一个世界模型内化,并通过“想象(imagining)”行为的长期结果来提前计划如何选择行为。
研究人员表示,Dreamer不仅适用于任何学习型任务,并且在数据效率、计算时间、最终性能等方面都超越了现有方法。
二、使用复杂的潜在动力学模型
在AI的整个生命周期中,无论是交错(interleaved)的还是并行(in parallel)的,Dreamer都会学习一个潜在的动力学模型(latent dynamics model),然后从行动和观察中对回报进行预测。
在这种情况下,“潜在动力学模型”是指从输入的图像信息中学习并执行计划来总结新经验的模型。“潜在(latent)”表示它依赖于隐藏(hidden)或潜在状态的紧凑序列(compact sequence),这使得它能够学习更抽象的表示,例如对象的位置和速度。
▲Dreamer在钟摆任务中进行预测(中间行为预测行)
Dreamer使用了一个多部分(multi-part)潜在动力学模型,该模型在结构上有些复杂。
Dreamer总体来说分为四个部分,第一部分负责对图像运动进行观察并编码为机器可以理解的信息;第二部分根据这些已知信息,对图像中没有观察到的部分进行预测;第三部分是一个奖励组件,负责针对不同的预测动作给出奖励;最后一部分是一个价值模型,估计了预测动作可能得到的奖励,并据此不断优化预测动作,让其更加精准。
▲Dreamer在迷宫导航游戏中进行预测(中间行为预测行)
研究人员在DeepMind用于评估AI机器学习能力的仿真软件中,对Dreamer进行了20个视觉控制任务的测试。他们首先使用Nvidia V100图形芯片和10个处理器核对它进行训练,他们说,每106个环境步骤的花费时间是9小时。相比之下,Dreamer的上一代PlaNet花了17个小时才达到类似的性能。
▲Dreamer在Atari游戏中进行预测(中间行为预测行)
三、用已知世界模型解决未知问题
研究人员说,Dreamer有效地利用了从少量的经验中总结出来的已知世界模型(learned world models),它的成功证明了通过潜在的想象力(latent imagination)学习行为的效率已经可以优于先前的顶尖方法。他们还表示,Dreamer的价值模型即使在短期规划(short-term planning)中也表现良好,在20项任务中有16项任务的表现优于其他模型,在另外4个任务中打平。
研究人员写到:“表征学习(representation learning)的未来研究可能会将潜在的想象力放大到视觉复杂度更高的环境中。”他们在本周于温哥华举办的NeurIPS 2019上展示了他们的研究成果。Dreamer项目的代码已经在GitHub公开。
结语:Dreamer为表征学习领域研究提供新思路
此次DeepMind推出的Dreamer,相比前代的主要突破在于将“潜在想象力”运用在AI的训练中,不仅训练效率提升,也为今后在视觉更加复杂的环境中进行研究提供了新思路。
通过现有的认知信息建立模型,预测和解决新环境中的问题,是将来AI研究的大方向之一,我们也期待DeepMind后续有更多新突破。
文章来源:Venturebeat
相关推荐
- 小程序-如何获取用户表单控件中的值
-
背景在小程序开发中,经常有用到表单,我们往往需要在小程序端获取用户表单输入框中的值(通常用户输入的有:switch,input,checkbox,slider,radio,picker)等,通过触发事...
- Js基础7:表单元素属性
-
一、封装获取元素的方法封装思想——函数封装——代码复用 function get_id(id){ //这个函数是专门来通过id获...
- 泰媒:到泰国曼谷旅游,注意别被嘟嘟车司机坑!
-
据泰国《世界日报》微信公众号报道,近日,一名导游投诉称,3名外籍游客在泰国曼谷搭载嘟嘟车时,被嘟嘟车司机坑。该导游认为嘟嘟车司机坑害外国游客的行为,破坏泰国的旅游形象,希望能以此为戒。当地时间25日上...
- 快速了解JavaScript的表单操作
-
前言在HTML中使用<form>表单元素在JavaScript中对应的是HTMLFormElement类型,而HTMLFormElement继承了HTMLElement接口...
- 10《Vue 入门教程》Vue 双向绑定指令
-
1.前言本小节我们将介绍Vue中数据的双向绑定指令v-model。v-model的学习相对简单。我们可以用v-model指令在表单<input>、<textarea&...
- 手把手教你搭建消防安全答题小程序-实现答题及提交答卷到数据库
-
手把手教你搭建答题活动小程序系列,第一阶段为界面设计篇,分别描写了如何搭建答题小程序界面。第二阶段为功能交互篇。而上两篇文章分别描写了,如何用云开发实现查询题库功能,以及将获取到的题目数据动态更新到答...
- 你还在使用Guava的Lists.newArrayList()吗
-
Guava说起Guava,做Java开发的应该没人不知道吧,毕竟“google出品,必属精品”。虽然应该没有Spring那样让Javaer无法避开,但是其中很多工具类的封装还是让人欲罢不能。而我们今天...
- Mybatis参数传递
-
1.概述Mybatis的sql参数传递就是将接口方法中定义的参数传输到sql中。sql有两种形式,一种是XML格式(Mapper映射器)中的sql;一种是注解方式的sql。常用参数的类型主要包括:基...
- python中的map和filter避坑指南
-
Pythonic的方式使用map和filter列表迭代在python中是非常pythonic的使用方式definc(x):returnx+1>>>list(map...
- 2025 年 Object 和 Map 如何选择?
-
大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力。1.什么是...
- 如何使用Java读取Excel文件到List>格式
-
引言在开发过程中,我们经常会遇到需要读取Excel文件并将数据转换成Java对象的需求。ApachePOI是一个强大的库,它提供了读取和写入MicrosoftOffice格式文件的功能,包括Exc...
- Nginx L4 stream Solution white list map
-
nginx正向透明代理nginx正向透明代理安全方面的一些限制对于代理而已,有时候可能还不够安全,而且这个是基于4层的,所以想要在http上,或者所谓的http头上做限制还是比较难实现了。所以变...
- Java响应式编程 第五篇 flatMap vs map
-
1作用不同1.2映射?展平?map只执行映射flatMap既执行映射,也执行展平什么叫只能执行映射?我理解是把一个数据执行一个方法,转换成另外一个数据。举个例子:mapper函数把输入的字符...
- Java对象拷贝原理剖析及最佳实践
-
作者:宁海翔1前言对象拷贝,是我们在开发过程中,绕不开的过程,既存在于Po、Dto、Do、Vo各个表现层数据的转换,也存在于系统交互如序列化、反序列化。Java对象拷贝分为深拷贝和浅拷贝,目前常用的...
- mybatis手把手教学,希望大家能拿下它
-
目录1.jdbc封装中的问题12.mybatis介绍43.框架搭建41)导包52)配置文件6配置dtd约束73)创建SqlSessionFactory对象94.入门案例91.部门实体...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- maven镜像 (69)
- undefined reference to (60)
- zip格式 (63)
- oracle over (62)
- date_format函数用法 (67)
- 在线代理服务器 (60)
- shell 字符串比较 (74)
- x509证书 (61)
- localhost (65)
- java.awt.headless (66)
- syn_sent (64)
- settings.xml (59)
- 弹出窗口 (56)
- applicationcontextaware (72)
- my.cnf (73)
- httpsession (62)
- pkcs7 (62)
- session cookie (63)
- java 生成uuid (58)
- could not initialize class (58)
- beanpropertyrowmapper (58)
- word空格下划线不显示 (73)
- jar文件 (60)
- jsp内置对象 (58)
- makefile编写规则 (58)