网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
01月10日
漏签
0
天
强人工智能吧
关注:
3,742
贴子:
50,364
看贴
图片
吧主推荐
游戏
11
回复贴,共
1
页
<<返回强人工智能吧
>0< 加载中...
【转】感知与行为相对论
只看楼主
收藏
回复
seusimon
意核
14
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Alva Noë 在他的书里面解释了很多深层次的东西,而不仅仅是「感知是为了行为」。在书中,他更多地阐述道,「行为是未来感知」。他的意思是,没有了行为,我们将不会对世界有任何真实有意义的经验。这本书也提出了探索行为如何使感知成为可能。
seusimon
意核
14
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
深度| 感知与行为相对论:用生成论搭建认知科学和强化学习之间的桥梁
2016-09-18 机器之心
链接:
http://chuansong.me/n/801016942097
seusimon
意核
14
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
在认知科学领域,有很多互相竞争的理论框架,它们都试图来解释智能的行为。我个人特别喜欢的一方面是具身化(embodiment)/生成进路(enactive approach),这也是从法国的现象学家到现在的神经系统科学家也都认可的个体多样性研究方法。
身体和环境在认知、行为、有机体而非大脑的生成意义中占有中心支配地位,这也是使他们取得一致的关键。虽然这些想法涉及到许多认知科学和神经科学,但我们很少听到有人在关于人工智能的文章里讨论它们。我想要改变这一现状。
我最近读完了 Alva Noë 的 Action in Perception,他是生成论方法的提倡者之一。根据 Noë 所言,行为是认知的基础。作为智能生物,如果不能熟练地使用我们的感觉运动能力,我们将不能真正地拥有一套完整的感知经验。也是通过在特定环境里行为的方式,我们创造了这个感知的世界。这些技能都非常依赖于我们的身体,并且也存在着具身化影响力的理论。最近我一边研究增强学习算法一边看这本书,我不禁认为,这两个学科的方法是相互贯通的。
在人工智能的大环境中,身体和环境都不是触手可及的实体。对于每一个机器人或是自动驾驶汽车而言,我们日常遇到的基本都是一个无实体的 Siri 或其他聊天机器人。更有意思的是,我们创造了能够在围棋上打败世界冠军但并不拥有物理实体的 AlphaGo。(除非你认为服务器是它的物理实体,我不这样认为的原因会在另一篇文章里说明。)
在这篇文章中,我想要解释的是,虽然 AlphaGo 和其他类似的智能助手可能并没有字面意义上的物理实体,但是,他们拥有的是一种存在于虚拟增强学习环境中的虚拟身体。这种虚拟的具身化替身使得人工智能能够学习和生物一样的技能。
seusimon
意核
14
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
这些方向上目前的研究
得到能考虑不能直接带来益处的但具有能带来更大奖励的可能性的经历的强化学习代理的基本问题已经以多种方式得到了解决。其中首要的一个问题是发现奖励探索其环境的代理的方式。这些方向的思想是通过鼓励探索,代理会遇到允许带来更大奖励的新型环境。这方面的有一些研究试图为探索开发不同类型的奖励。这种奖励的尺度通常被认为需要达到足以让探索新环境的代理惊讶的水平。
对于这样的一般定义,存在一些计算惊喜因子(surprise factor)的方法。一个研究团队使用的方法是确定代理对自己行动的预期奖励与真实奖励之间的差异。通过探索他们所称的 Prioritized Replay(点击「阅读原文」下载相关论文),代理可以更频繁地在可能产出预期之外的奖励的经历上进行训练。
另一种方法是分层规划(Hierarchical Planning)。其中的基本思想是开发能够学习将任务分解成更小的子任务的代理。这种方法是在代理完成一项必需的子任务后就给予奖励,而非固有地奖励它们自身,这让该代理可以以一种能够发现能带来新类型的行动的感知的方式采取行动。研究者已经使用这种技术构建了一个代理,其可以在 Atari 游戏《蒙特祖玛的复仇》上得到良好的表现。这个游戏对传统的强化学习很困难,因为该代理必须找到每个房间的锁的钥匙以得到奖励。这对我们来说可能听起来挺简单,但其涉及到在得到奖励前执行一系列有目的的行为。
尽管所有这些领域都是很有前途的方法,但对于社区来说还没有什么让人「豁然开朗」的方法。我们目前还不清楚可以如何让行为以一种自然的和通用的方法影响感知——就像神经结构中的「感知→行为」关系那样直观。但所有这些方向的研究目前都还处于起步阶段,而且我们也有一点怀疑我们能否在某一天发现这种方法。这种能力本质上对世界上的生物的生存是至关重要的,而且也是未来人工智能的关键。
seusimon
意核
14
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
---------------------------------------(搬砖收工的分割线)------------------------------------
本人的想法也类似:人在感知空间的时候,是在用身体各部位的动作配合起来去“丈量”。例如,头往左转,或者眼珠往左转,就和“左边”的语义相关联,就产生了某物在左边的认知。
seusimon
意核
14
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
不过不同意文章里“行为是为了感知”的说法,个人认为行为本身也促成了感知,或者说根本就没有什么xx为了yy的关系,而是平等服从于一个更上层框架的调度。
飞行于天
代码化
11
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
有意思的想法,认真学习下。
火星的日升日落
意核
14
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
确实是相互的.
贴吧用户_0E7M8VR
反复抽象
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
没从根本上思考动物智能为什么要有感知和行为,没回答根源的观点、理论,都站不住脚
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示