张阔:奖励和惩罚在注意控制过程中的优化和分离:眼动研究论文

张阔:奖励和惩罚在注意控制过程中的优化和分离:眼动研究论文

奖励和惩罚在注意控制过程中的优化和分离:眼动研究*

张 阔1何立媛2 赵 莹1王敬欣2

(1南开大学周恩来政府管理学院社会心理学系, 天津 300071) (2天津师范大学心理与行为研究院, 天津 300074)

摘 要 通过两个眼动实验考察金钱奖励和惩罚引起的动机对个体在不同空间线索条件下注意控制加工的影响。实验1采用朝向/反向眼跳范式, 被试通过内源性线索提供心理准备的情况下做出简单的朝向眼跳以及需要抑制优势反应的反向眼跳。结果发现, 相比无奖惩条件, 奖励条件下朝向眼跳任务的正确率更高, 惩罚条件下反向眼跳任务的正确率更高; 两种眼跳任务中有奖惩条件下的眼跳峰速度均比无奖惩条件高。实验2采用Go/No-go任务, 进一步探讨了由副中央凹加工外源性边缘线索从而不能提供充分心理准备的情况下奖励和惩罚对注意控制的影响。结果发现, 奖励条件下Go反应的眼跳潜伏期更短, 惩罚条件下No-go反应正确率更高, 眼跳峰速度在两种条件下均比无奖惩条件高。以上结果表明, 奖励和惩罚均能够促进个体的注意控制, 但二者的加工过程是分离的, 奖励能够改善趋近行为, 惩罚则能够显著促进抑制控制行为, 且奖励和惩罚在注意控制加工过程中具有不同的作用模式, 奖励能够更早唤醒注意控制系统从而更快地促进行为的发生与执行, 惩罚则能够通过调节注意资源促进以目标为导向的行为中对优势反应的抑制。

关键词注意控制; 奖励; 惩罚; 动机; 眼跳

1 引言

注意控制(Attention Control)是指个体为了完成任务要求的目标, 对优势反应、习惯性行为或无关行为进行抑制, 并调节适当的行为以满足复杂任务的要求从而适应不断变化的环境, 是执行功能的核心成分(Diamond, 2013; Herrera, Speranza, Hampshire, & Bekinschtein, 2014)。研究发现, 冲动、ADHD、OCD以及药物成瘾等特殊群体都存在注意控制减弱这一核心特征(Aarts et al., 2015; Chambers, Garavan, & Bellgrove, 2009; Masui & Nomura, 2011; Pekny, Izawa, & Shadmehr, 2015)。因此, 实现对注意控制的优化调节不仅有利于个体进行高效的学习和适应环境, 也有助于心理障碍个体的干预和治疗(Becker et al., 2013)。近年来, 奖惩动机与注意的关系在决策和认知控制研究领域引起了越来越多的关注, 已有不少研究者对奖励在执行控制过程中的调节作用进行了考察(van Steenbergen, Band, & Hommel, 2012; Braem, Hickey, Duthoo, & Notebaert, 2014; Bucker, Silvis, Donk, & Theeuwes, 2015; 纪丽燕, 陈宁轩, 丁锦红, 魏萍, 2015)。最近, 也有研究者开始尝试探索奖励和惩罚这两种不同的动机如何作用于认知调控中的检测和控制过程, 以期来厘清奖励和惩罚、预测和反馈等信息对个体注意控制的影响, 但相关研究还很少, 结果也不一致。当前比较统一的发现仅在于, 相比无预期动机条件, 奖惩(特别是奖励条件)能够对注意控制系统产生调控(Kubanek, Snyder, & Abrams, 2015; Kilpeläinen, & Theeuwes, 2016 )。

研究发现, 动机系统在评价情境的危险性和自身行为倾向的适当性中起到重要作用(张晓雯, 禤宇明, 傅小兰, 2012), 而奖励和惩罚需通过激发个体的动机才能对行为进行调节, 因此, 要了解奖励和惩罚如何影响个体的行为并进一步探索其调节注意控制的过程, 需要首先明确动机如何作用于抑制控制加工。Gray (1987)提出的强化敏感理论(Reinforcement Sensitivity Theory, RST)认为, 个体内部存在两种动机系统:行为趋近系统(Behavior Approach System, BAS)和行为抑制系统(Behavior Inhibition System, BIS)。相关研究也一致发现, 行为趋近系统对奖励刺激敏感, 激活后引发趋近行为, 而行为抑制系统则对惩罚刺激敏感, 激活后引发抑制行为(Gray, 1987; de Pascalis, 2014; Heym, Kantini, Checkley, & Cassaday, 2015; 谷莉, 白学军, 王芹, 2015)。由此可见, 奖励和惩罚所引发的动机是不同的。近期又有不少研究提出, 奖赏预期作为一种正强化动机可以优化注意资源, 提高自上而下的注意控制, 有效调节注意分配(Chelazzi, Perlato, Santandrea, & Libera, 2013; 纪丽燕 et al., 2015)。Pessoa等在大量研究的基础上提出了双竞争模型(Dual Competition Model), 认为动机会重新分配执行功能所获得的注意资源, 以保证潜在奖赏的最大化(Pessoa, 2009)。由于注意资源是有限的, 同时进行的加工会共用有限资源, 因此, 动机对注意资源的重新分配不仅影响到与奖励行为直接相关的加工, 也会影响到与其共用资源的加工。在Padmala的一项研究中, 要求被试完成停止信号任务, 其中只在无停止信号任务上的表现(正确率和速度)会得到奖赏, 结果导致停止信号任务上的反应时延长, 被试的抑制行为受到了奖赏的损害(Padmala & Pessoa, 2010)。另有研究者也发现了一致的结果, 认为被试为了最大化奖励而增强了对无停止信号刺激的注意, 优先分配资源给了能获得奖赏的加工过程, 从而使得停止信号任务上的注意资源减少(Chelazzi et. al, 2013)。另外, 双竞争模型还进一步提出, 奖赏会增强个体的注意控制, 影响外源性(Engelmann & Pessoa, 2007)和内源性任务(Engelmann, Damaraju, Padmala, & Pessoa, 2009)中注意的定位与再定位。最近的一项研究发现, 在三个停止信号任务中, 奖赏能够通过增强对相关信号的监测来提升认知控制, 使个体更高效地解决控制冲突, 其中注意资源的分配可以调节相关信号的监测速度(王宴庆, 陈安涛, 胡学平, 尹首航, 2019)。来自fMRI的研究结果也显示, 随着奖赏水平的提高, 被试觉察的敏感性会随之提高, 相应的视皮层区域的活动也随之增强(Eliana et al., 2014; Hauser, Iannaccone, Walitza, Brandeis, & Brem, 2015)。

综上不难发现, 当前对动机调节注意控制的研究多集中于奖励这一获益(Gain)方面, 对于惩罚这一类基于损失(Loss)方面的研究仍十分匮乏(Spear, 2011; Schmitt, Ferdinand, & Kray, 2015)。虽然在行为经济学研究领域早已有关于损失比获益更敏感的著名理论提出(Tversky & Kahneman, 1992), 但是, 当前关于惩罚如何影响个体注意控制的研究还是非常少见, 仅有的少数实验研究结果也很不一致。由于动机并非是单一结构, 而是由多个成分构成的连续系统, 包括趋向奖励、回避损失和逃避惩罚等, 因此, 奖励和惩罚也可能具有不同的加工模式。一部分研究发现, 奖励和惩罚均会降低抑制控制行为的错误率, 且两者的影响是对称的, 不存在显著差异(Masui & Nomura, 2011; 谷莉等, 2015); 但也有一些研究发现, 仅有惩罚能够增强个体的抑制控制能力(Jazbec et al., 2006)。另外, 还有研究发现, 奖励和惩罚与不同的行为状态相关, 受到不同神经系统的调节, 奖励预期会使注意范围增大, 趋向搜索新异刺激(Berridge, Robinson, & Aldridge, 2009); 而惩罚预期则使注意范围变窄, 与回避反应的神经系统相关(Ross, Lanyon, Viswanathan, Manoach, & Barton, 2011; Murty, Labar, & Adcock, 2016)。

之所以存在以上不一致的结果, 有可能奖惩动机引发注意控制过程中受到了注意资源分配的调节。事实上, 关于奖惩动机如何作用于选择性注意加工的研究中, 已有研究者尝试使用不同的范式和研究工具分别以灵长类动物和人类进行了一些基础性的探索, 但结论尚不清晰, 且多集中于探讨奖赏线索的作用模式。例如, Peck, Jangraw, Suzuki, Efem和Gottlieb (2009)对猴子进行的眼跳研究发现, 当目标与之前的奖赏线索出现在同一位置时, 猴子的眼跳更加有效, 由此提出奖赏能够调节空间注意和视觉选择, 而与执行反应的效价无关。随后, Ross等(2011)通过使用朝向和反向眼跳任务对奖励和惩罚在人类的视觉注意选择及行为执行中的作用进行了研究。Ross等的研究目的之一是为了考察奖赏调节人类的视觉选择是否与猴子有相同的模式, 另外也为了进一步考察是否在需要更多注意资源的反眼跳任务下奖惩线索效应会更大, 且该效应是否会受到刺激位置的影响从而表现出空间注意选择的返回抑制效应(IOR)。结果发现, 奖惩动机线索均使反应时减少, 且奖励比惩罚更显著; 更为重要的是, 在奖惩线索位置呈现靶子时出现了返回抑制效应, 但与猴子的眼跳模式不同的是, 奖惩线索效价未影响朝向眼跳, 且反向眼跳中的返回抑制效应反倒有一些增加而非减少。该研究认为, 人类表现出的奖赏效应不同于猴子, 不是基于视觉选择而是基于行动效价的。人类的眼跳系统既包括对多个位置同时进行反应的能力, 也包括对于是否包含奖惩结果的位置进行灵活性调整的能力, 且在需要更多注意资源的反眼跳任务中表现更为显著。另外, 还有研究者使用眼动追踪技术记录了被试对有金钱惩罚线索的区域进行视觉搜索的眼跳模式, 分别对受罚前、受罚中和受罚后三个连续阶段进行了分析, 结果发现, 与无惩罚区域的任务表现相比, 惩罚显著影响到被试的眼动行为, 表现为有惩罚区的眼跳比率显著减小, 潜伏期明显增长, 说明个体能够在认知控制过程中灵活地分配注意资源引导眼动行为去回避惩罚从而趋向有奖赏的环境(Kilpeläinen et al., 2016)。最近, 有研究者采用系列停止信号任务对奖赏动机影响认知控制的加工过程进行了研究, 结果发现, 奖赏能通过注意资源分配来增强相关信号的监测, 更早地启动、实施抑制反应, 从而有效提升认知控制效率(王宴庆等, 2019)。但是, 惩罚在影响认知控制的过程中是否和奖赏动机具有相同的作用模式呢?已有的相关研究中尚未涉及。

选取我院2017年1月—2018年1月收治的30例黄疸型病毒性肝炎患者为研究对象,随机分为观察组与对照组,各15例。观察组男性8例,女性7例,年龄30~65岁,平均年龄(42.5±3.5)岁;对照组年龄31~66岁,平均年龄(43.0±3.5)岁;所有患者均已通过相关检测,符合黄疸型病毒性肝炎诊断标准,排除其他传染性疾病,经我院伦理委员会同意,签署知情同意书,其性别、年龄、基础疾病等一般资料经统计学分析均差异无统计学意义,P>0.05,有可比性。

综上, 虽然惩罚如何作用于认知控制的过程迄今尚未厘清, 但其对注意控制加工的影响应该与奖赏一样重要。特别重要的是, 二者在作用于抑制控制加工的过程中可能受注意资源的调节从而表现出不同的加工模式。那么, 当奖励和惩罚动机同时存在, 且认知加工过程既包括自上而下的内源性注意又包括自下而上的外源性注意时, 两种动机预期是如何分配执行功能所获得的注意资源呢?惩罚是否与奖励一样调节着注意控制的不同加工阶段?当注意控制中的抑制加工过程占用较多注意资源时奖励和惩罚引发的行为模式是否不同?以往的文献中针对这些问题的研究还极少见。另外, 成功完成抑制控制行为需要个体首先要抑制自动的、习惯性的反应, 随后产生符合目标的自主反应, 因此抑制控制行为包含两个过程:抑制和发起自主行为。虽然已有研究发现奖励和惩罚会影响个体的抑制控制行为, 但奖惩对抑制自动反应以及发起自主行为过程的影响分别是怎样的?目前还未有研究涉及。鉴于此, 本研究采用金钱奖励和惩罚的反眼跳范式(实验1)和基于眼跳的Go/No-go任务(实验2)对两种动机如何影响注意控制的具体过程进行深入探讨。反眼跳范式是近年来研究者采用较多的考察个体抑制控制加工过程的有效范式。该范式包含朝向眼跳和反向眼跳任务, 朝向眼跳要求被试在目标出现后眼动朝向目标所在位置, 属自主性的简单眼跳; 反向眼跳则要求被试目标出现后注视与目标方向相反、距离相等的镜像位置, 需要使用较强的心理努力抑制住反射性朝向眼跳的优势反应然后做出正确的眼跳, 该任务可以通过分析多个指标来充分考察被试抑制控制加工过程的整体状况(Munoz & Everling, 2004; Dafoe, Armstrong, & Munoz, 2007)。

在基于眼跳的Go/No-go任务中, Go任务要求被试眼睛追随出现的目标刺激, 类似于朝向眼跳过程; No-go任务则需要被试抑制自动反应并维持对中央注视点的注视(Machado & Rafal, 2000; Sommer & Wurtz, 2001), 这一过程与反眼跳任务中的眼跳抑制相似, 但不像反眼跳任务中还包括发起正确眼跳的过程。本研究即采用伴随奖励和惩罚动机线索的反眼跳范式和Go/No-go任务, 来探讨奖励和惩罚对个体注意控制加工过程的影响。同时, 为提高被试对奖惩的敏感性和期待性, 减少实验过程中被试对相同金额存在不同感受的影响, 采用分数反馈来代替直接的金钱反馈, 最后换取相应数量金钱的奖惩方式。

依据强化敏感理论和双竞争模型以及已有的研究发现(Ross et al., 2011; Murty et al., 2016), 我们预期, 奖励和惩罚引发的动机会优化注意资源将其分配到与目标相关的加工中去, 因此相比无奖惩控制条件, 奖励和惩罚均会改善被试注意控制加工的行为表现; 但是, 奖励和惩罚会激活不同的动机系统, 表现出对抑制控制的不同调节过程。当奖惩混合呈现时, 不同动机系统之间会相互作用, 因此当奖惩动机线索作用于注意控制的不同准备状态时, 对抑制行为产生的影响也会存在差异。具体表现为, 当对具有充分准备状态的基于自上而下线索的优势反应进行抑制时, 两种动机线索能够引发充分的注意资源分配, 出现系统的优化和调节; 而对基于无准备且需要付出更多心理努力的自下而上线索驱动的优势反应进行抑制时, 则出现资源分配困难, 因而虽然奖励和惩罚依然可能促进行为产生, 但较多的心理努力将会使奖励的趋向性逐渐减弱; 由于惩罚比奖励更敏感且容易被唤醒, 则会因占有更多注意资源从而在回避行为反应中作用依然明显。

2 实验1:奖惩与反眼跳任务中的注意控制

2.1 被试

本科生和研究生共24名被试参加了实验, 均为右利手, 无躯体疾病及精神障碍, 视力或矫正视力1.0以上, 无色盲色弱。由2名经过训练的评定员用汉密尔顿焦虑量表对他们施测并独立评分, 入选被试的评分都在6分以下(无焦虑症状)。剔除2名眼跳正确率过低的被试数据, 得到有效被试22名, 其中男性8人, 女性14人, 年龄分布为22.72 ± 2.97岁。实验完成后, 所有被试都会获得与其所获得分数相应的金钱报酬。

2.2 实验设计

采用2(任务:朝向眼跳、反向眼跳) × 3(效价:奖励、惩罚、无奖惩)被试内设计。

2.3 实验程序

对被试进行单独施测, 实验步骤如下:

作家必须克服自身中的作家(作家气、文学气)。 只有做到这一点,才能成为作家; 不是“做过而已”,而是“成就事业”[3]202。

(1)被试进入实验室熟悉环境之后, 坐在仪器前, 戴好头盔, 将下巴放在下颌托上, 此时告知被试在实验过程中保持头尽量不动。(2)用PPT呈现并讲解奖励方法、指导语及实验流程, 确保被试理解。(3)进行五点校准, 校准成功后, 开始实验。实验分为练习和正式实验两部分。练习结束且被试完全熟悉整个实验流程后, 正式实验开始。

实验共包括144个试次, 每个被试需要进行24次练习后开始正式试验。每个试次分别包含三个阶段(如流程图1):(1)线索阶段, 首先在屏幕中心随机呈现6个线索中的一个(白色或者灰色的“+”、“–”、“O”, 1.5°×1.5°视角), 线索提示眼跳类型(白色为朝向眼跳, 灰色为反向眼跳)和奖惩类型(“+”代表奖励、“–”代表惩罚、“O”代表无奖惩), 呈现时间在1250 ms至1750 ms之间随机。(2)反应阶段, 线索消失后, 目标刺激(一个白色方块, 0.7°×0.7°视角)会随机出现在两个可能的位置(左侧5.7°, 右侧5.7°)之一, 呈现1000 ms。在朝向眼跳任务中, 要求被试在目标出现后尽快注视目标所在位置; 而在反向眼跳任务中, 则要求被试在目标出现后不要去注视它, 而是尽快注视目标的镜像位置, 即与目标距屏幕中心方向相反、距离相等的位置。成功完成一次眼跳需要在刺激呈现之后的500 ms内将注视点落在以正确点为圆心, 130像素为半径的圆范围之内(一般确定500 ms为基准是为了保证被试又快又准地做出眼跳反应, 若大于500 ms说明被试虽然做出了正确眼跳, 但期间可能发生了眨眼或微调, 因此也被记录为错误眼跳)。(3)反馈阶段, 刺激消失后会在正确位置呈现反馈信息(绿色的“+5”, “–0”、“+0”代表反应正确的得分; 红色的“+0”, “–5”、“–0”代表反应错误的得分, 都为1.5°×1.5°视角, 数字代表该试次所得分值), 呈现时间为1000 ms。

2.4 实验仪器

实验采用由加拿大SR Research公司开发的EyeLinkⅡ型头盔式眼动仪, 采样频率为500 Hz。实验材料由戴尔19英寸纯平显示器呈现, 显示器的刷新率为150 Hz, 分辨率为1024像素×768像素。显示器与被试眼睛之间的距离为75 cm。在实验过程中, 被试双眼注视屏幕, 只记录其右眼的眼动轨迹。

图1 实验流程

注:图中的反馈阶段所呈现出的反馈信息是反向眼跳反应正确和错误的试次举例

2.5 结果与分析

首先, 根据以下标准(Jazbec et al., 2006)对无效数据进行删除:(1)首次眼跳落在屏幕之外; (2)没有眼动记录、目标屏出现在一次眨眼期间的试次; (3)为了减少其他类型眼跳的混入, 删除眼跳幅度小于3°的眼跳数据; (4)眼跳持续时间小于25 ms或大于100 ms的数据; (5)首次眼跳潜伏期低于或等于80 ms及等于或高于700 ms; (6)把500~700 ms间的眼跳潜伏期计为错误眼跳潜伏期, 但数据不被删除。总共删除的数据占全部数据的7.66%。

(1) 首次眼跳正确率:目标屏出现后, 被试所做的第一次正确眼跳次数占第一次眼跳总次数的百分比, 它能够反映出朝向和反向眼跳的总体状况, 是眼跳范式中最敏感的指标。反向眼跳正确率反映抑制加工的能力, 正确率越高说明抑制控制能力越强(Derakshan, Ansari, Hansard, Shoker, & Eysenck, 2009)。

采用2(任务类型:朝向眼跳、反向眼跳) × 3(效价:奖励、惩罚、无奖惩)的重复测量方差分析(下同), 对被试的首次眼跳正确率数据进行统计。结果显示, 任务主效应显著, F(1, 21) = 97.00, ηp2 = 0.82, p < 0.001; 效价主效应显著, F(2, 42) = 4.74, ηp2 = 0.18, p = 0.014; 两因素的交互作用显著, F(2, 42) = 3.27, ηp2 = 0.14, p = 0.048。对任务类型和效价的交互作用进行简单效应分析发现:朝向眼跳任务上, 效价的简单效应显著, F(2, 42) = 4.12, p = 0.023。均值比较的结果显示, 奖励条件下的正确率显著高于无奖惩条件下的, p = 0.006; 而惩罚与无奖惩(p = 0.995)、奖励与惩罚条件下(p = 0.137)的正确率差异均不显著。反向眼跳任务上, 效价的简单效应也显著, F(2, 42) = 3.80, p = 0.031。均值比较的结果表明, 惩罚条件下的眼跳正确率显著高于无奖惩条件, p = 0.017, 而惩罚与奖励(p = 0.108)、奖励与无奖惩条件下(p = 0.321)的正确率差异均不显著。见图2(A)。

(2) 首次眼跳潜伏期:指从目标屏出现开始, 到被试做出第一次眼跳之间的反应时间。正确朝向眼跳潜伏期反映被试执行眼跳的时间, 正确反向眼跳潜伏期反映抑制优势反应的效率, 潜伏期越短, 说明抑制控制的效率越高(Munoz & Everling, 2004; Jazbec et al., 2006)。

对首次正确眼跳潜伏期的方差分析结果显示, 任务主效应显著:F(1, 21) = 70.35, p < 0.001, ηp2 = 0.79, 朝向眼跳潜伏期显著小于反向眼跳潜伏期; 效价主效应不显著, F(2, 42) = 2.16, p = 0.128, 交互作用也不显著, F(2, 42) = 1.27, p = 0.292。

(3) 首次眼跳峰速度:目标屏出现后, 被试所做的第一次眼跳的速率峰值。该指标是考察映射到特定神经功能的认知控制过程更为精确的指标, 反映出注意控制对行为的执行所进行的调节。正确反向眼跳峰速度越高说明抑制控制过程效率越高(Jazbec et al., 2006)。

对首次正确眼跳峰速度的方差分析发现, 任务主效应不显著, F(1, 21) = 0.01, p = 0.941, 朝向眼跳峰速度与反向眼跳峰速度无显著差异; 效价主效应显著, F(2, 42) = 5.67, p = 0.007, ηp2 = 0.21。事后检验发现, 奖励和惩罚条件下的眼跳峰速度都显著高于无奖惩条件, p = 0.015, p = 0.006; 奖励和惩罚间的差异不显著, p = 0.995; 效价与任务类型的交互作用也不显著, F(2, 42) = 0.11, p = 0.898。见图2(B)。

设计基于B/S架构的高校人力资源管理系统,不可忽视人力资源培训工作。在互联网时代,运用慕课开展人力资源培训工作可以有效提升工作质量。一般来讲,慕课使用的技术非常简单,能够通过短视频和清晰的课程设置对于人力资源培训工作进行科学调控,指导高校人力资源管理系统操作人员做好本职工作。

2.6 小结

实验1的结果与我们的预期基本一致。在混合了奖惩两种动机线索的眼跳任务中, 奖励显著提高了被试朝向眼跳的正确率, 惩罚则显著提高了反向眼跳的正确率; 奖惩两种条件下的首次正确眼跳潜伏期无显著差异, 在伴有奖惩动机线索的注意控制过程中, 奖励和惩罚对于行为的产生存在不同的影响, 且朝向眼跳和反向眼跳的峰速度在这两种条件下均得到显著提高。该实验结果说明, 奖励能够促进趋近行为, 而惩罚能够改善抑制控制行为, 同时奖励和惩罚均能够促进趋近行为和抑制控制行为的执行。根据强化敏感理论(Gray, 1987), 个体内部的行为趋近系统对奖励的敏感使被试在朝向眼跳任务上的成绩显著优于惩罚和控制条件; 而行为抑制系统则因对惩罚敏感从而在随后的反向眼跳任务中表现出比奖励和控制条件更好的成绩。另外, 在眼跳潜伏期上没有表现出效价的差异可能是因为本实验中奖励和惩罚线索混合呈现, 使被试采用了更为谨慎的策略, 出现了一个权衡, 但眼跳峰速度上表现出的奖惩显著高于控制条件的结果, 说明奖惩动机在注意控制过程中起到了优化和调节作用。另外, 本实验中发现了惩罚对抑制控制的明显促进, 但这种促进并没有发生在奖励动机上, 这是非常值得关注的。Kubanek等(2015)通过视听刺激伴随不同级别的奖惩动机任务发现, 奖励促进了对前一刺激的重复效应, 而惩罚强化了对前一刺激的回避效应。但不同级别的奖励和惩罚在行为调节上表现出明显的不同步, 奖励促进行为的重复效应随级别加权, 而惩罚的回避效应却保持恒定, 出现了两种动机在加工上的分离。本实验的结果在一定程度上支持了该实验发现, 说明奖励和惩罚两种动机都能调节和优化注意控制, 但两者的加工过程是不同的。

图2 奖惩条件下眼跳实验结果 (A区为首次眼跳正确率; B区为首次正确眼跳峰速度)

然而, 鉴于本实验中奖励和惩罚的动机和眼跳线索均呈现在优势反应刺激之前, 这种自上而下的内源性线索能够为被试的注意控制加工提供一定的心理准备, 可较为充分地优化和调节随后的抑制控制行为, 并表现出分离。但是, 奖励和惩罚的这种调节和分离在动机性线索独立出现, 自下而上的任务线索引导外源性注意目标时是否还能保持优化且出现分离呢?本实验所发现的惩罚促进优势反应抑制行为成绩的特异性在无充分心理准备的刺激呈现时能否依然保持恒定?实验二将通过记录被试完成金钱奖励和惩罚的Go/No-go任务时的眼动轨迹来探讨这一问题。

3 实验2:奖惩与Go/No-go任务中的注意控制

3.1 被试

为控制被试个体差异对实验结果的影响, 进一步探索实验1尚未厘清的问题, 实验2采用了参与过实验1的22名有效被试。考虑到两个眼动实验都是考察注意加工过程, 连续进行会使被试疲劳影响到实验结果, 因此实验2是在实验1完成一周后进行的。

3.2 实验设计

本实验采用单因素(奖惩条件:奖励、惩罚、无奖惩)的被试内设计。

3.3 实验程序

实验中每个试次分为三个阶段, 流程(如图3)如下:(1)线索阶段, 首先在屏幕中心随机呈现三个线索中的一个(白色的“+”、“–”、“O”, 1.5°×1.5°视角), 线索提示奖惩类型(“+”代表奖励、“–”代表惩罚、“O”代表无奖惩), 呈现时间随机(在1250 ms至1750 ms之间)。(2)反应阶段, 线索消失后, 目标刺激(黄色或者蓝色的小方块, 0.7°×0.7°视角) 随机出现在两个可能的位置之一(左侧5.7°, 右侧5.7°), 呈现1000 ms。颜色指示反应类型(如黄色代表朝向眼跳的Go任务, 蓝色代表No-go任务的注视)。在Go任务中, 要求被试在发觉目标出现后, 先用眼睛的余光观察目标的颜色, 判断出目标是黄色后尽快注视目标所在位置。而在No-go任务中, 则要求被试在判断出目标是蓝色后, 继续注视中间, 直到目标消失。为保证不同颜色的刺激不会对认知控制产生影响, 在实验中不同颜色所对应的指示反应类型在被试间进行了平衡。(3)反馈阶段, 刺激消失后会在正确位置呈现反馈信息(绿色的“+5”、“−0”、“+0”代表反应正确, 红色的“+0”、“−5”、“−0”代表反应错误, 都为1.5°×1.5°视角), 呈现1000 ms。

每个被试需要进行24次练习和144次正式试验。被试成功完成一次眼跳需要在刺激呈现之后将注视点落在以正确点为圆心, 95像素为半径的圆范围之内。实验结束后, 根据被试所得分数给予被试相应的金钱奖励, 最低5元, 最高20元。

3.4 实验仪器

同实验1。

3.5 结果与分析

删除标准同实验1, 总共删除的数据占全部数据的7.17%。

根据地表监测资料,滑坡体在产生地表裂缝之后仍处于变形发展中,在对隧道进行有效加固及对山体开始卸载后,变形速度开始下降至蠕动,各测点每天的位移一般在10 mm左右,沉降一般在5~10 mm,仍处于蠕动的不稳定状态。场区处于雨季,降雨量大且集中,坡体上缺少完善的排水系统,降雨极易沿裂缝下渗,形成动水压力,还使滑体饱和而自重增加,并降低滑带土体抗剪强度,导致下滑力增大而抗滑力减小。一旦下滑力大于抗滑力,滑体将会有进一步滑动的倾向。

3.5.1 首次反应正确率

对被试的首次Go反应和No-go反应正确率进行单因素重复测量方差分析, 结果显示(见图4A):

(1) Go眼跳正确率:奖惩条件主效应不显著, F(1, 42) = 0.72, ηp2 = 0.03, p = 0.495。

(2) No-go反应正确率(反映抑制优势反应的能力, 正确率越高, 抑制能力越强):效价主效应显著, F(2, 42) = 3.55, ηp2 = 0.15, p = 0.038。事后检验发现, 惩罚条件下的正确率显著高于无奖惩条件下的正确率, p = 0.035, 而惩罚与奖励(p = 0.266)、奖励与无奖惩条件下的正确率差异均不显著(p = 0.072)。

3.5.2 首次正确眼跳潜伏期和峰速度

由于No-go任务要求被试抑制住优势反应的眼跳, 而正确反应下不会发生眼跳, 因此只对被试首次正确Go反应的眼跳潜伏期、峰速度进行单因素方差分析, 结果显示:

旅游属于服务行业,主要是让游客享受高品质观光体验,从而得到精神上的满足。建立旅游者反馈系统可以实现交流,收集他们反馈上来的意见和建议,便于进一步改进,是不断完善的一个过程。根据游客需求增加信息内容,会变得更加丰富,满足不同人的需求,有利于提高服务质量。企业本身是很难察觉到自身不足之处,通过反馈可以了解真实情况,起到优化的作用。要增加和游客之间互动,形成一种紧密的联系,能够留住大量客户资源,创收经济效益。认真分析问题出现的原因,制定出有效解决策略,会起到事半功倍的效果,在不断改进中走向完善,提升旅游业整体水平。

(1) Go反应的眼跳潜伏期:效价主效应显著, F(2, 42) = 5.87, ηp2 = 0.22, p = 0.006。事后检验发现, 奖励条件下的潜伏期显著小于惩罚条件下的, p = 0.008, 而惩罚与无奖惩(p = 0.299)、奖励与无奖惩条件下(p = 0.298)的潜伏期差异均不显著。见图4(B)。

(2) Go反应的眼跳峰速度:效价主效应显著, F(2, 42) = 8.46, ηp2 = 0.29, p = 0.001。事后检验发现, 奖励和惩罚条件下的峰速度均显著高于无奖惩条件下的, p = 0.004, p = 0.013; 而奖励和惩罚条件下的峰速度无显著差异, p = 0.995。结果与实验1中朝向眼跳任务的峰速度表现一致。

3.6 小结

实验2的结果与预期一致, 相对于奖励和无奖惩条件, 惩罚显著促进了被试No-go反应的正确率; 同时, Go任务的眼跳潜伏期在奖励条件下比惩罚条件下显著较短, 眼跳峰速度则在奖惩条件下均显著高于无奖惩条件。另外, Go反应的正确率没有出现效价的主效应, 这是由于与反射性眼跳一致的Go反应非常简单, 被试在有、无奖惩条件下的正确率都很高, 因此没有表现出差异; 但Go反应的眼跳潜伏期上, 则发现奖励减少了眼跳所需要的时间, 也正说明在被试不需要花费更多注意资源的外源性注意所引导的眼跳行为中, 奖励促进了行为的执行, 这与我们的预期是一致的。总之, 在No-go反应的正确率上, 本实验得到了与实验1中反眼跳任务相似的结果, 反映出惩罚对抑制优势反应行为的促进作用, 而Go任务的眼跳峰速度也表现出与实验1中朝向眼跳任务相同的模式。以上结果说明金钱奖励和惩罚促进了被试在Go和No-go任务中的表现, 且二者对外源性线索引导的注意控制的调节作用也出现了加工上的分离, 表现为惩罚对抑制控制加工的优化更为明显。

图3 实验流程(以奖励线索为例)

注:每个试次开始时, 被试在线索阶段可以看到“+”、“−”和“O”三种线索中的任意一个(分别表示奖励、惩罚和无奖惩)。流程图左侧呈现的是奖励条件下Go任务的正确反应示例; 右侧呈现的是奖励条件下No-go任务的错误反应示例。

图4 Go/No-go任务实验结果(A区为反应正确率, B区为正确Go反应的眼跳潜伏期)

4 总讨论

Engelmann, J. B., & Pessoa, L. (2007). Motivation sharpens exogenous spatial attention. Emotion, 7(3), 668–674.

4.1 奖励和惩罚对注意的优化和分离

朝向眼跳是外在的、以视觉为导向的反射性行为, 是趋向性的; 反向眼跳则是内源性的, 需要个体主动抑制反射性行为, 属于回避性行为。本研究中, 被试的朝向眼跳正确率在奖励条件下显著高于无奖惩条件, 表明奖励促进了被试的趋向性行为, 这一结果与我们的预期及以往的研究是一致的(Jazbec et al., 2006)。例如, Geier和Luna (2012)在奖励反向眼跳(Reward AS Task)任务中发现, 奖励条件下的成绩显著高于无奖励条件, 且奖励激活了支持注意控制的动眼神经通路(Oculomotor Circuitry)。同时, 当前研究还发现被试在惩罚条件下的反向眼跳正确率显著高于无奖惩条件, 说明惩罚促进了抑制控制行为。以上结果符合强化敏感性理论, 即行为抑制系统受到惩罚动机的激活, 会促进抑制行为; 行为趋近系统受到奖励动机的激活, 有利于趋近行为。另外, 本研究进一步发现, 反映眼跳执行的眼跳峰速度在奖励和惩罚条件下都得到了显著的提升, 即奖励和惩罚均促进了选择性注意的执行。这一结果也符合基于强化敏感理论提出的“三唤醒系统模型” (Three-Arousal Model) (Arnett & Newman, 2000), 该模型增加了一个非特异性唤醒系统(Non-Specific Arousal System, NAS), 进一步提出行为抑制和趋近系统的激活都会引发非特异性系统的唤醒, 使得当前行为的速度和强度得到提升。本研究的结果也支持该模型, 说明奖惩动机调节着注意控制过程, 奖励促进了趋向行为, 惩罚则改善了回避性行为。

Heym, N., Kantini, E., Checkley, H. L. R., & Cassaday, H. J. (2015). Gray’s revised reinforcement sensitivity theory in relation to attention-deficit/hyperactivity and tourette-like behaviors in the general population. Personality and Individual Differences, 78, 24–28.

4.2 奖励和惩罚对注意控制的交互影响

[纪丽燕, 陈宁轩, 丁锦红, 魏萍. (2015). 奖赏预期调节局部注意干扰效应. 心理学报, 47(6), 721–733.]

实验1发现, 被试在惩罚条件下的反向眼跳正确率显著提高, 朝向眼跳在奖励条件下显著改善, 即惩罚从总体上显著促进了抑制控制行为, 奖励则促进了趋近行为的产生。实验2中, No-go的正确率在惩罚条件下显著提高, Go反应的潜伏期在奖励条件下相比于惩罚条件显著较短, 但与无奖惩条件下不存在显著差异。以上结果表明, 抑制控制的两个阶段——对优势反应的抑制和行为的产生所受到奖惩的影响是不同的, 惩罚有利于优势反应抑制, 而行为产生则只受到奖励的促进作用, 惩罚的作用在此阶段消失。在Hardin等进行的一项研究中, 同样将奖励和惩罚作为被试内因素考察了个体抑制控制行为的变化, 采用的是反眼跳任务, 但要求被试只做抑制优势反应的反眼跳, 忽略反射性朝向眼跳, 结果发现, 奖励和惩罚条件下被试的反向眼跳正确率均显著高于无奖惩条件(Hardin, Schroth, & Ernst, 2007)。另有研究者从发展的角度研究了青少年在反向眼跳任务中奖励和惩罚动机对认知控制过程的调节作用, 结果也发现两种动机呈现不同的加工模式和内在机制(Padmala & Pessoa, 2010; Geier & Luna 2012)。本研究则扩展了这些研究的结果, 进一步发现奖励和惩罚在调节注意控制的过程中具有不同的作用模式, 在行为抑制和执行过程中会发生交互影响。

(1) 软式排水管。软式排水管是一种能侧向集水的软管,其管体由承力的螺旋钢丝及其管壁组成,管壁由内外两层纤维交叉的编织布和中间的无纺土工布组成。管壁的这种特殊结构使其具有侧向透水反滤和纵向排水的双重功能(如图2所示)。本试验采用的软式透水管单位面积质量400 g/m2,厚1.5 mm,等效孔径O95为0.226 mm。试验前将软式排水管管壁按照《土工织物材料测试规程》[42](SL 235—2012)裁剪成相应的试样,即直径为100 mm和直径为150 mm的圆形试样。

4.3 奖励促进注意控制的早期加工

[谷莉, 白学军, 王芹. (2015). 奖惩对行为抑制及程序阶段中自主生理反应的影响. 心理学报, 47(1), 39–49.]

财政信息、财政透明度和地方政府债务限额管理..................................................................................................................................周金飞 金洪飞(28)

4.4 惩罚促进抑制控制的加工

本研究的两个实验都发现, 虽然奖励和惩罚都提高了注意控制行为的执行, 表现为眼跳峰速度在朝向眼跳、反向眼跳和Go反应中都较无奖惩显著提高, 但是, 相比奖励对趋向行为的有利影响, 惩罚对抑制控制行为的促进则更加明显, 表现为相比奖励和无奖惩条件, 实验1中反向眼跳正确率和实验2中No-go反应中正确率均显著提高。如前所述, 行为经济学研究领域早已有关于损失比获益更敏感的著名理论提出(Tversky & Kahneman, 1992), 相关研究也得出一致结论, 认为不愉快的、负性的事件和结果相比愉快、正性的事件和结果具有更大程度的主观价值(Baumeister, Bratslavsky, Finkenauer, & Vohs, 2001)。Kubanek等人(2015)在研究中发现, 奖励和惩罚在调节行为上存在显著差异, 且惩罚作用更强。本研究中使用的惩罚线索作为一种金钱损失, 在反向眼跳和No-go反应任务中反应正确率都显著提高, 所得结果与以往研究是一致的。

人也许并不是从猴子进化而来,而是从鱼进化而来的。关于地球上的物种进化,我们还有太多的不解需要去探知。"

近来有研究者提出, 损失的这种特异性效应可能基于对注意唤醒水平的暂时提高, 这种高唤醒水平接下来又会影响到目标选择和行为判断结果的敏感性(Yechiam & Hochman, 2013)。另有研究者以不同价值的金钱代币为奖惩线索, 使用听觉注意任务考察了这两种动机线索如何引导行为发生的过程, 结果发现, 奖励引发了更多的重复选择行为, 而惩罚引发了更多的回避重复选择行为, 而且选择行为显著受到奖励级数的调节, 相反, 惩罚级数却没有影响到被试做出选择任务的成绩(Kubanek et al., 2015)。本研究中使用了随机呈现的混合奖惩线索范式, 结果发现在有准备的内源性(实验1)和无准备的外源性奖惩线索(实验2)引发注意控制行为的过程中, 惩罚条件都显著促进了抑制控制, 这与以上两项研究的发现是基本一致的, 并在此基础上进一步扩展了以往研究的结果, 即惩罚在抑制控制的过程中并不受来自内源性或外源性注意线索的影响, 在抑制优势反应的过程中显示出明显的促进作用。这与Yechiam等的损失注意唤醒假说也相符, 即惩罚对个体而言作为一种损失使唤醒水平瞬间提高, 从而引发行为的快速转变。由于损失能够对机体产生伤害, 因此注意控制中有可能存在一种针对损失而产生交替行为的特定机制, 使个体在同时伴有奖励和惩罚两种预期的双选择任务中, 针对惩罚能够保持快速的觉醒和行为的转换(Yechiam & Hochman, 2013)。另外值得注意的是, 通过文献检索发现, 当前国外虽然已有尝试使用脑电技术来研究奖惩动机对个体决策过程中不同作用模式的研究, 但至今仅观察到这两种动机对不同的行为反应阶段(如延迟阶段或反馈阶段)出现的分离。不同动机对注意过程影响的脑机制研究仍然多集中在奖赏层面, 仅有的极少数针对惩罚动机加工的研究则刚刚开始。眼动技术作为行为数据采集的高级工具, 能够弥补脑电数据采集过程中动眼及自主控制眼跳从而产生过多噪音的不足, 可以自然灵活地对考察选择性注意过程中抑制加工任务的数据进行记录和采集, 且能够针对兴趣区中最早发生的首次眼跳潜伏期进行精准计算和分析。鉴于此, 未来的研究可进一步采用眼动及脑电或fMRI技术相结合来深入考察奖惩动机影响个体注意控制过程所依赖的神经机制。

综上, 我们通过朝向/反向眼跳范式和Go/No-go任务两个眼动实验考察了奖励和惩罚两种动机对个体的注意控制过程的调节作用。结果发现, 虽然奖励和惩罚相比无奖惩都促进了行为的执行, 但两者对注意控制的优化过程具有不同的作用模式, 出现了加工上的分离, 奖励促进了个体趋向性行为, 而惩罚则优化了抑制控制行为; 奖惩对抑制控制的过程也会产生不同的影响, 惩罚主要作用于优势反应抑制阶段, 而奖励主要作用于行为执行阶段。其中, 在对优势反应进行抑制的过程中, 惩罚对任务成绩的有利影响突出且一直保持稳定。这些发现支持并拓展了动机的强化敏感理论和“双竞争”模型, 以及关于获益和损失的注意唤醒模型, 并凸显了惩罚对个体抑制行为的重要影响。当然, 这种影响也可能会受到文化、年龄差异等因素的影响, 因此, 未来研究除了可以进一步使用认知神经科学的技术来考察惩罚影响注意控制的脑机制外, 还可以从文化差异以及年龄发展等角度出发对惩罚动机和个体行为的关系进行探索。

参 考 文 献

Aarts, E., van Holstein, M., Hoogman, M., Onnink, M., Kan, C., Franke, B., … Cools, R. (2015). Reward modulation of cognitive function in adult attention-deficit/hyperactivity disorder: A pilot study on the role of striatal dopamine. Behavioural Pharmacology, 26(1&2), 227–240.

Anderson, B. A., Laurent, P. A., & Yantis, S. (2011). Value-driven attentional capture. Proceedings of the National Academy of Sciences of the United States of America, 108(25), 10367–10371.

Arnett, P. A., & Newman, J. P. (2000). Gray's three-arousal model: An empirical investigation. Personality and Individual Differences, 28(6), 1171–1189.

Baumeister, R. F., Bratslavsky, E., Finkenauer, C., & Vohs, K. D. (2001). Bad is stronger than good. Review of General Psychology, 5(4), 323–370.

桑烟围着塔体高速地旋转,光影变幻中,他隐约看到塔内是一团荧白的光芒。那团白芒似乎是由白玉骸骨发出的,由内而外,神圣不可侵犯。骸骨头部的位置有节奏地缓动着,那种“嘎嘎咔咔”的声音,就是随着骸骨的动作传出来的。

Becker, S. P., Fite, P. J., Garner, A. A., Greening, L., Stoppelbein, L., & Luebbe, A. M. (2013). Reward and punishment sensitivity are differentially associated with ADHD and sluggish cognitive tempo symptoms in children. Journal of Research in Personality, 47(6), 719–727.

Berridge, K. C., Robinson, T. E., & Aldridge, J. W. (2009). Dissecting components of reward: ‘liking’, ‘wanting’, and learning. Current opinion in Pharmacology,9(1), 65–73.

Braem, S., Hickey, C., Duthoo, W., & Notebaert, W. (2014). Reward determines the context-sensitivity of cognitive control. Journal of Experimental Psychology:Human Perception & Performance, 40(5), 1769–1778.

Bucker, B., Silvis, J. D., Donk, M., & Theeuwes, J. (2015). Reward modulates oculomotor competition between differently valued stimuli. Vision Research, 108, 103–112.

Chambers, C. D., Garavan, H., & Bellgrove, M. A. (2009). Insights into the neural basis of response inhibition from cognitive and clinical neuroscience. Neuroscience & Biobehavioral Reviews, 33(5), 631–646.

Chelazzi, L., Perlato, A., Santandrea, E., & Libera, C. D. (2013). Rewards teach visual selective attention. Vision Research, 85(24), 58–72.

Herrera, P. M., Speranza, M., Hampshire, A., & Bekinschtein, T. A. (2014). Monetary rewards modulate inhibitory control. Frontiers in Human Neuroscience, 8(4), 442–449.

Dafoe, J. M., Armstrong, I. T., & Munoz, D. P. (2007). The influence of stimulus direction and eccentricity on pro- and anti-saccades in humans. Experimental Brain Research, 179(4), 563–570.

Derakshan, N., Ansari, T. L., Hansard, M., Shoker, L., & Eysenck, M. W. (2009). Anxiety, inhibition, efficiency, and effectiveness: An investigation using the antisaccade task. Experimental Psychology, 56(1), 48–55.

de Pascalis, V. (2014). Neurocognitive components of behavioral inhibition and behavioral activation systems: Relation of EEG-alpha asymmetry, BIS/BAS and optimism. Personality and Individual Differences, 60, S4.

其中,第1到第i个基分类器作为样本错误检验模型。根据公式1可以发现,集成学习准确率pensemble提升的基本条件在于:一是各基分类器的相关性低;二是各基分类器的查准率p高于0.5;三是有一定数量的基分类器。因此,提升基分类器的差异化有助于提升集成学习的预测精度(MSE,Mean Squared Error)[16]。

Diamond, A. (2013). Executive functions. Annual Review of Psychology, 64, 135–168.

Eliana, V., Massimo, S., Boehler, C. N., Eric, A., Wim, F., & Tom, V. (2014). Overlapping neural systems represent cognitive effort and reward anticipation. Plos One, 9(3), e91008.

Engelmann, J. B., Damaraju, E., Padmala, S., & Pessoa, L. (2009). Combined effects of attention and motivation on visual task performance: Transient and sustained motivational effects. Frontiers in Human Neuroscience, 3(4), 1–17.

本研究探讨了金钱奖励和惩罚所引起的动机对个体注意控制加工的影响过程。结果显示, 相比无奖惩条件, 奖惩动机均会改善行为的产生, 其中金钱惩罚能够优化被试的抑制控制表现, 奖励则对趋向性行为有更显著的促进作用。另外, 两个实验的结果都表明, 奖励和惩罚均影响到注意资源的分配, 但二者的加工过程会出现分离, 奖励在注意控制的早期阶段即被监测到从而促进行为的执行, 惩罚则对促进抑制优势反应的行为更加明显。

Freeman, S. M., & Aron, A. R. (2016). Withholding a reward-driven action: Studies of the rise and fall of motor activation and the effect of cognitive depletion. Journal of Cognitive Neuroscience, 28(2), 237–251.

Geier, C. F., & Luna, B. (2012). Developmental effects of incentives on response inhibition. Child Development, 83(4), 1262–1274.

Gray, J. A. (1987). The psychology of fear and stress. New York: Cambridge University Press.

Gu, L., Bai, X. J., & Wang, Q. (2015). Impact of reward/punishment conditions on behavioral inhibition and automatic physiological responses in the stages. Acta Psychologica Sinica,47(1), 39–49.

奖励通常引发趋近性行为, 个体常因受到奖赏信号的吸引从而做出冲动性的趋近性反应, 这是具有进化意义的(Freeman & Aron, 2016)。实验1结果发现, 奖励会提高朝向眼跳的正确率; 实验2中, 虽然Go反应的正确率没有表现出效价的主效应, 这是由于与反射性眼跳一致的Go反应非常简单, 被试在有、无奖惩的条件下的正确率都很高, 因此没有表现出差异, 但是, 在Go反应的眼跳潜伏期方面, 则发现奖励显著减少了眼跳所需要的时间, 说明被试在不需要花费更多注意资源的外源性注意所引导的眼跳行为中, 奖励促进了行为的执行, 这与我们的预期是一致的。最近, 有研究者采用线索−靶子范式下的眼跳任务, 考察了不同概率及不同程度的奖励对眼跳准备的影响, 结果发现, 当奖励结果确定时个体的眼跳准备潜伏期最短; 当奖励结果不确定而又要求被试必须对目标做出选择的情况下, 眼跳准备的潜伏期最长, 说明奖励在注意控制过程中能够更早地进行自动化加工, 自下而上和自上而下的因素共同调节着奖赏对个体眼跳行为的影响(Wolf, Heuer, Schubö, & Schütz, 2017)。以往亦有研究表明, 个体在注意控制过程中能更早地监测到奖赏信号的出现, 从而相比无奖励条件能更快地促进以目标为导向的行为(Anderson, Laurent, & Yantis, 2011)。

Hardin, M. G., Schroth, E., & Ernst, M. (2007). Incentive- related modulation of cognitive control in healthy, anxious, and depressed adolescents: Development and psychopathology related differences. Journal of Child Psychology and Psychiatry, 48(5), 446–454.

Hauser, T. U., Iannaccone, R., Walitza, S., Brandeis, D., & Brem, S. (2015). Cognitive flexibility in adolescence: Neural and behavioral mechanisms of reward prediction error processing in adaptive decision making during development. Neurolmage, 104, 347–354.

Corr, P. J. (2001). Testing problems in J. A. Gray’s personality theory: A commentary on Matthews and Gilliland (1999).Personality and Individual Differences, 30(2), 333–352.

本实验最为感兴趣的发现是, 当奖励和惩罚混合出现且存在两种冲突性的认知任务, 即在奖励条件下要求个体做出抑制行为, 惩罚条件下做出趋近行为时, 奖励和惩罚的影响出现了显著的变化。具体表现为, 相比无奖惩条件, 奖励条件下的反向眼跳正确率以及惩罚条件下的朝向眼跳正确率并没有得到显著提高。根据强化敏感性理论, 被试在奖励条件下行为趋近系统得到激活, 促进的是趋近行为, 可能会对抑制行为产生负面影响。Corr (2001)通过研究发现, 当奖励和惩罚同时存在时, 行为趋近和抑制系统之间就会出现交互作用, 一方的激活会对另一方产生抑制。双竞争模型进一步提出, 动机会重新分配执行功能所获得的注意资源, 以保证潜在奖赏的最大化, 而奖赏就会增强个体的执行控制(Pessoa, 2009)。因此, 本研究中被试可能为了能够得到最多的奖赏, 在抑制优势反应条件下受动机调节从而重新分配资源以避免趋近行为的产生, 利于抑制控制行为的发出和执行, 所以被试的抑制控制行为虽然未得到奖赏的优化调节, 但也未受到损害。同理, 惩罚引发抑制系统的激活, 促进抑制控制行为, 而且奖惩混合的情况下也会降低趋近系统的激活, 不利于个体的趋近行为, 然而为保证潜在奖赏最大化, 个体同样会克服抑制系统激活所带来的负面影响, 完成趋近行为。本研究中朝向和反向眼跳以及Go任务中都显示出眼跳峰速度在奖惩条件下比无奖惩条件显著提高, 进一步说明了奖惩动机在调节注意控制过程中的这种分离。

在主震之后的地震活跃期间,可在不同的位置几乎同时发生多个地震。在这种情况下,由地面传感器测到的地震波包含不止一个震源的混合信号。如果探测算法假设仅为一个地震,那么估计出的地震参数(比如位置和震级)就不会精确。而这些不精确的估计也会导致虚报,这种情况在大地震后经常出现。

Jazbec, S., Hardin, M. G., Schroth, E., McClure, E., Pine, D. S., & Ernst, M. (2006). Age-related influence of contingencies on a saccade task. Experimental Brain Research, 174(4), 754–762.

左归丸对免疫性卵巢早衰小鼠血清性激素及IL-6、IL-17水平的影响 …………… 江二喜(8):909

教师在设计数学活动时,把学生的课堂活动作为主线,教学设计的每一个环节要想到尽可能地让学生在动手、在实践中用自己的“生活经验”去解决数学问题。在学生主动参与、思考和探索中,通过“生活经验”这一中间环节,教师要帮助学生应用和积累数学活动经验。例如,在教学“认识长方形”对边相等的特征时我就设计了下列的动手活动:(1)拿出你的长方形,去看、去摸、去感受、去发现长方形的特征;(2)学生通过量一量、折一折……活动去思考和探究长方形的对边长度是否相等。

Ji, L. Y., Chen, N. X., Ding, J. H., & Wei, P. (2015). Monetary incentive modulates the localized attentional interference effect. Acta Psychologica Sinica, 47(6), 721-733.

注意控制的过程包括对优势反应的抑制和自主行为的产生。本研究中反向眼跳任务包含了抑制优势反应刺激的朝向眼跳和有意识地发生与优势反应刺激相反的眼跳这两个阶段, 朝向眼跳和Go任务涉及到外源性注意行为的产生, No-go任务则仅涉及到对优势反应刺激的抑制过程。因此, 利用两种任务能够将反向眼跳所涉及的过程进行有效的分离, 来分别考察奖励和惩罚对抑制控制过程各阶段产生的影响, 有利于我们深入了解奖惩如何作用于注意控制的加工过程。

Kilpeläinen, M., & Theeuwes, J. (2016). Efficient avoidance of the penalty zone in human eye movements. Plos One,11(12), 1–15.

Kubanek, J., Snyder, L. H., & Abrams, R. A. (2015). Reward and punishment act as distinct factors in guiding behavior. Cognition, 139, 154–167.

Machado, H., & Rafal, R. D. (2000). Strategic control over saccadic eye movements: Studies of the fixation offset effect. Perception & Psychophysics,62(6), 1236–1242.

Masui, K., & Nomura, M. (2011). The effects of reward and punishment on response inhibition in non-clinical psychopathy. Personality and Individual Differences, 50(1), 69–73.

Munoz, D. P., & Everling, S. (2004). Look away: The anti- saccade task and the voluntary control of eye movement. Nature Reviews Neuroscience, 5(3), 218–228.

Murty, V. P., LaBar, K. S., & Adcock, R. A. (2016). Distinct medial temporal networks encode surprise during motivation by reward versus punishment. Neurobiology of Learning and Memory, 134, 55–64.

Padmala, S., & Pessoa, L. (2010). Interactions between cognition and motivation during response inhibition. Neuropsychologia, 48(2), 558–565.

Peck, C. J., Jangraw, D. C., Suzuki, M., Efem, R., & Gottlieb, J. (2009). Reward modulates attention independently of action value in posterior parietal cortex. The Journal of Neuroscience, 29(36), 11182–11191.

Pekny, S. E., Izawa, J., & Shadmehr, R. (2015). Reward- dependent modulation of movement variability. The Journal of Neuroscience, 35(9), 4015–4024.

Pessoa, L. (2009). How do emotion and motivation direct executive control? Trends in Cognitive Sciences, 13(4), 160–166.

Ross, M., Lanyon, L. J., Viswanathan, J., Manoach, D. S., & Barton, J. J. S. (2011). Human prosaccades and antisaccades under risk: Effects of penalties and rewards on visual selection and the value of actions. Neuroscience, 196, 168–177.

Schmitt, H., Ferdinand, N. K., & Kray, J. (2015). The influence of monetary incentives on context processing in younger and older adults: An event-related potential study. Cognitive, Affective, & Behavioral Neuroscience, 15(2), 416–434

Sommer, M. A., & Wurtz, R. H. (2001). Frontal eye field sends delay activity related to movement, memory, and vision to the superior colliculus. Journal of Neurophysiology, 85(4), 1673–1685.

Spear, L. P. (2011). Rewards, aversions and affect in adolescence: Emerging convergences across laboratory animal and human data. Developmental Cognitive Neuroscience, 1(4), 390–403.

Tversky, A., & Kahneman, D. (1992). Advances in prospect theory: Cumulative representation of uncertainty. Journal of Risk and Uncertainty, 5(4), 297–323.

van Steenbergen, H., Band, G. P. H., & Hommel, B. (2012). Reward valence modulates conflict-driven attentional adaptation: Electrophysiological evidence. Biological Psychology, 90(3), 234–241.

Wang, Y. Q., Chen, A. T., Hu, X. P., & Yin, S. H. (2019). Reward improves cognitive control by enhancing signal monitoring. Acta Psychologica Sinica, 51(1), 48−57.

[王宴庆, 陈安涛, 胡学平, 尹首航. (2019). 奖赏通过增强信号监测提升认知控制. 心理学报, 51(1), 48−57.]

Wolf, C., Heuer, A., Schubö, A., & Schütz, A. C. (2017). The necessity to choose causes the effects of reward on saccade preparation. Scientific Reports, 7(1), 16966. DOI:10.1038/ s41598-017-17164-w.

Yechiam, E., & Hochman, G. (2013). Loss-aversion or loss- attention: The impact of losses on cognitive performance. Cognitive Psychology, 66(2), 212–231.

Zhang, X. W., Xuan, Y. M., & Fu, X. L. (2012). The effect of emotional valences on approach and avoidance responses. Advances in Psychological Science, 20(7), 1023–1030.

[张晓雯, 禤宇明, 傅小兰. (2012). 情绪效价对趋避反应的作用. 心理科学进展, 20(7), 1023–1030.]

Optimization and asymmetry effects of reward and punishment on control attention: Evidence from eye movements

ZHANG Kuo1; HE Liyuan2; ZHAO Ying1; WANG Jingxin2

(1Department of Social Psychology, Zhou Enlai School of Government, Nankai University, Tianjin 300071, China) (2Academy of Psychology and Behavior, Tianjin Normal University, Tianjin 300074, China)

Abstract

A wealth of research shows that positive and negative reinforcement critically influence behavior. While it is well established that rewards and penalties can strongly influence mechanisms of executive control, it is unclear whether these two factors exert symmetric or qualitatively distinct behavioral effects. In the current research, we conducted two eye-movement experiments to investigate the influence of monetary reward or punishment on attentional control. We employed these cues in Pro/Anti-saccade tasks in Experiment 1 and Go/No-go tasks in Experiment 2. Crucially, we investigated how either a reward (also referred to as “gain”) or penalty (also referred to as “loss”) influenced inhibitory control in the following trial.

In Experiment 1, participants were instructed to produce simple pro-saccades or more difficult anti-saccades, in conditions in which they received a reward for correct responses or a punishment for incorrect responses or either a reward or punishment. The results showed that, while the accuracy of the pro-saccades was facilitated by reward, the accuracy of the anti-saccades was facilitated by punishment. And the velocity of pro-saccades and anti-saccades were significantly improved by both reward and punishment. In Experiment 2, we further adopted the Go/No-go tasks to explore how reward and punishment affect attentional control via exogenous parafoveal visual cues. This showed essentially the same pattern of effects as Experiment 1. For the Go task, saccade latency significantly decreased when rewards were given relative to punishment or no motivation conditions. And for the No-go task, accuracy increased more in the punishment condition compared to the reward or no motivation conditions. An increase in saccade velocity was observed in the no motivation condition, similarly to in Experiment 1.

In sum, the overall results suggest that both reward and punishment can facilitate the oculomotor control, although the findings reveal a striking asymmetry in the effects of the reward and punishment on behavior. Specifically, positive reinforcement appears to improve approach behaviors, while punishment influences inhibitory behavior. These findings suggest that the two forms of reinforcement are distinct in their influence on behavior.

Key words control attention; reward; punishment; motivation; saccade

收稿日期:2018-06-13

* 国家自然科学基金项目(81771823)。

通信作者: 王敬欣, E-mail: wjxpsy@126.com

分类号B842

DOI:10.3724/SP.J.1041.2019.01207

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

张阔:奖励和惩罚在注意控制过程中的优化和分离:眼动研究论文
下载Doc文档

猜你喜欢