罗铁勇刘翠珍：无效预期诱发知觉偏差却提升元认知判断准确性

内容提要：人类生活在一个充满不确定性的世界中，为了能够及时响应和处理周围信息的变化，大脑会持续对周围环境产生预期。这些预期能够引导我们的感知和行动，然而，不成熟的预测也可能导致决策偏差。本研究通过5个实验探讨无效预期如何影响知觉判断及其后的信心估计。实验1、实验2和实验3分别探究了无效预期在高、中、低三种不同任务难度下对知觉判断和信心估计的影响。实验4引入无预测的基线条件以提供对照，实验5通过分离预测和知觉判断的按键设置，排除动作效应的干扰。4个实验均发现(实验3除外)，被试倾向于将知觉刺激判断为与预测一致，这表明无效预期引起了知觉偏差。在元认知效率(即信心估计的准确性)上，5个实验一致发现，被试在匹配试次(预测刺激与知觉判断一致)中的表现显著优于不匹配试次，表现出更高的元认知水平。综上，无效预期虽然影响了初级的知觉判断导致了知觉偏差，但却促进了更高级的元认知心理加工。

标题注释：国家自然科学基金青年项目(32300934)、西安市科协青年人才托举计划项目(959202313049)资助。

关键词：无效预期/ 知觉判断/ 自信心/ 元认知/

作者简介：罗铁勇，陕西师范大学心理学院；刘翠珍(通信作者)，陕西师范大学心理学院，E-mail：liucuizhen＠snnu.edu.cn(西安 710062)。

原文出处：《心理学报》(京)2026年第2期第336-349页

1 引言

人类大脑对周围环境的知觉建构是一个主动且动态的过程。预测处理模型(Predictive Processing Model)将这一过程描述为主观预期的持续更新，通过逐步缩小与感觉输入之间的误差，生成与感觉输入最相符的假设，从而促进知觉判断(Keller & Mrsic-Flogel，2018)。想象你在超市看到一个人推着购物车，最初你认为他是一位顾客。随后你注意到他在货架上整理商品，并佩戴着工作证，这时你意识到他其实是一名超市员工。在这一过程中，你的判断依赖于对所观察线索与既有角色预期之间的匹配和调整。因此，在充满不确定性的客观世界中，大脑就像一台“预测机器”(Prediction Machine)，通过先验经验和环境线索形成有效预期，以提高感知的速度和准确性，从而应对复杂多变的环境(Clark，2013)。

在知觉判断领域，大量研究表明，有效预期能够促进知觉判断。例如，Stein和Peelen(2015)发现，在刺激呈现之前提供有关物体类别的信息，会促进对物体的感知，具体表现在与无信息基线条件和无效先验信息条件相比，有效信息条件下个体对刺激的定位判断的表现更好。在视觉检测任务中，提供关于目标对象类型的视觉或语义提示可以激活注意力模板，形成视觉注意期望，从而加快对该对象的检测速度(Hertz et al.，2020)。脑成像研究进一步表明，先验信念与刺激信息的整合不仅发生在初级视知觉皮层(Kok et al.，2014)，还涉及更高级的决策相关脑区，特别是前额皮层。与无预测事件相比，在有预测事件中，被试的背外侧前额皮层更加活跃，并且当被试对即将到来的刺激做出预测时，感觉区域间的有效联结显著增强(Rahnev et al.，2011；Summerfield & de Lange，2014)。这些证据表明，通过提供有效线索诱导被试产生预期，可以加快知觉反应速度并减少知觉错误。

预期通过自上而下的调控机制，对知觉判断发挥了重要作用。经典预测编码框架强调“预测误差最小化”原则，认为大脑通过不断更新先验模型以匹配感觉输入(Clark，2013)。然而，这一理论主要解释有效预期情景的认知促进作用，即预期基于可靠的先验信息，如线索提示范式下的概率学习，这样的情境中被试能够不断获得线索更新信念。然而，在现实生活中，许多物理刺激往往模糊且高度不可预测，这些刺激通常伴随微妙且动态的变化，导致人们的预期更新往往滞后于刺激的变化(Thomas et al.，2023；Yon et al.，2019)。在这种情况下，人们不能基于外在线索形成有效预期，只能通过片面的经验或局限的内在推理自发地生成预期以指导行为。

以往的研究主要聚焦于探讨有效预期(valid/informative prediction)，即预期线索本身包含有效的信息，如经典的波斯纳线索效应(Posner cueing effect)，具有信息价值的空间线索可以显著提升知觉判断的准确性和速度(Posner，1980)。然而，关于这种无效预期(invalid/non-informative prediction)，即预期信息与随后刺激的呈现没有实质关联、并未包含任何有用线索的预期，是否仍然对知觉判断产生影响，目前尚缺乏系统研究。从理性人假设的角度来看(von Neumann & Morgenstern，1944)，无效预期不应对随后的判断产生影响，但是在实际决策过程中，个体往往表现出非理性的决策倾向，比如手热效应(Oskarsson et al.，2009)或赌徒谬论(Croson & Sundali，2005)。有研究证据表明，一些无助于证据积累的认知因素也会影响个体对刺激的识别和决策准确性的评估，例如，Jazayeri和Movshon(2007)的研究发现，在序列方向辨别任务中，当被试完成方向判断后，他们对刺激运动方向的感知会系统性地偏离决策边界，这种偏差是由于大脑的主动优化解码策略，即优先整合调谐方向偏离边界的神经元信号导致。此外，确认偏误(Confirmation bias)现象也提示，个体做出分类选择后，其选择本身会引发后续决策的知觉偏差(Talluri et al.，2018)。事实上，知觉选择不仅依赖于当前的感觉输入，还受个体既往选择历史的影响(Urai et al.，2019)。所有这些知觉偏差可能是个体维持内部一致性的策略(Festinger，1957；Luu & Stocker，2018)。因此，即便个体所作的预期对即将呈现的刺激没有实际预测价值，这种无效预期也可能对随后的决策行为产生影响。

前人研究集中于证实预期对知觉判断的影响，但关于预期对元认知的影响的探究却相对较少。元认知即“对认知的认知”，反映了个体对自身认知表现进行监控、协调和评估的能力(Flavell，1979)。在知觉判断任务范式中，元认知通常用信心评分与知觉判断表现之间的匹配程度来衡量。元认知双阶段模型将元认知过程分为独立的两个阶段，第一阶段是“对象阶段”即个体具体的知觉、记忆等任务活动，第二阶段是“元”阶段，指对第一阶段的监控、评估(Nelson & Narens，1990)。因此典型的实验流程包括两个阶段：被试在第一阶段先进行知觉判断，然后在第二阶段对其知觉判断的正确性进行信心评分。知觉判断的正确性具有客观的评价标准，将被试的主观信心评分与其知觉判断表现进行匹配，若知觉判断正确时伴随高信心，知觉判断错误时伴随低信心，则表明主观评估与客观表现的匹配程度较高，元认知表现较好，反之则说明元认知较差。被试的信心评分对知觉判断正误的区分程度被称作元认知敏感性，即元认知判断准确性(Fleming & Lau，2014)。

根据贝叶斯模型，信心估计和知觉判断相似，都是基于对期望(先验概率)和输入信息(似然)的加权整合(Constant et al.，2023；Hu et al.，2021)。个体可能会根据预期通过自上而下的调节来调整他们对决策的信心，甚至修正最初的决策(Fleming et al.，2018)。Sherman等人(2016)的研究就发现被试在预期与决策一致的情况下有更高的信心水平。目前为止，仅有一项研究直接探讨了预期与元认知敏感性(meta-d’)的关系。Sherman等人(2015)发现，在刺激出现概率较高的组块中，被试在判断刺激存在的试次中表现出更高的元认知敏感性，而在刺激出现概率较低的组块中，被试在判断刺激不存在的试次中表现出更高的元认知敏感性。预测即将到来的刺激，即使是随意做出的，也是一个自愿且自主的行为。当预测与知觉判断一致时，个体的大脑奖赏回路会被激活，产生更强的自我控制感(Hampton et al.，2007)，而不一致情况可能引发认知冲突(Botvinick et al.，2001)。因此，在一致试次中，被试可能拥有更多的认知资源用于信心评估，从而提升信心判断的准确性。基于此，本研究假设：即使预期信息本身是无效的，当个体的预期与其知觉判断一致时，仍会提升后续信心判断的准确性，表现为更高的元认知效率。

综上，本研究通过5个行为实验系统探究了无效预期对知觉判断和元认知的影响。5个实验采用相同的知觉任务，即对模糊的面孔/房屋图片进行知觉判断。要求被试在知觉判断之前对即将出现的刺激类型(面孔/房屋)做出预测，并告知被试仅凭直觉来做出预测，预测与刺激呈现是两个独立的过程。通过阶梯滴定程序，实验1、实验2和实验3分别设置了高、中、低不同的3种任务难度，以探究在不同任务难度下无效预期的效应是否存在。实验4增设了基线水平(无预测条件)，在预测与知觉判断一致、预测与知觉判断不一致和无预测3种条件下进行比较。由于前面4个实验中，被试在预测阶段和知觉判断阶段使用相同的按键，均用左箭头键代表面孔，右箭头键代表房屋，预期阶段的动作效应可能对知觉判断产生干扰。因此，实验5通过分离预测按键与知觉判断按键，以排除动作效应的干扰，进一步验证实验结果的稳健性。

2 实验1：高难度条件下无效预期对知觉判断和元认知的影响

2.1 实验设计和被试

本实验采用单因素被试内设计，旨在比较预测与知觉判断一致和不一致条件下，被试的知觉表现和元认知表现。根据以往相似研究中Liu和Yu(2024)报告的效应量大小(d=0.57)，采用G*Power 3.1，设置显著性水平α=0.05，统计检验量(1-β)=0.90，计算出本研究的计划样本量为35人(Faul et al.，2007)。本实验随机招募了43名被试。数据排除标准包括：(1)被试在匹配试次、不匹配试次或总体试次的知觉正确率低于55％；(2)被试在匹配试次、不匹配试次或总体试次的元认知效率在平均数上下3个标准差之外；(3)被试的按键反应率低于80％；(4)被试在预测或知觉判断过程中始终按同一个键。余下实验均采用同一数据筛选标准。两名被试因总体知觉判断正确率低于55％被排除，一名被试因在匹配试次中的正确率低于55％而被排除，一名被试因在不匹配试次中的正确率低于55％而被排除，一名被试因在不匹配试次中的元认知效率(meta-d’/d’=-10.55)低于平均值减去3个标准差(M-3SD=-4.97)被排除。总共排除5名被试，对剩下38名被试做进一步的统计分析(M=20.92岁，SD=1.98岁；19名男性)。所有被试的视力均为正常或矫正正常。该研究已通过伦理委员会审查，被试在实验开始前均签署了知情同意书，实验结束后给予一定的报酬。

2.2 实验材料

本研究中选用的图片材料来自Fleming等人(2012，2010)，其中10张中性面孔图片(5张男性)来自Karolinska Directed Emotional Faces图片集(Lundqvist et al.，1988)，10张房屋图片的建筑类型十分相似，避免了建筑风格差异的潜在干扰。这些刺激材料被裁剪为相同尺寸并转换为灰度图像。对每张图像进行傅里叶变换，生成20个幅度矩阵和20个相位矩阵，并保存所有刺激材料的平均幅度矩阵。将单个面孔或房屋图像的相位矩阵与不同比例的白噪声[P(noise)]重新组合，并与平均幅度矩阵结合，满足P(image)=1-P(noise)。其中，P(noise)以0.01的步长进行调整，从而为每张图片生成99张具有不同噪声水平的图片，从最清晰、噪声最小的图片P(image)=0.99到最模糊、噪声最多的图片P(image)=0.01。

2.3 实验流程

实验采用面孔/房屋判断任务。被试需要判断呈现的模糊图像是面孔还是房屋，然后评估其对该知觉判断的信心程度。在模糊图片呈现之前，被试需要预测即将呈现的图像类别(面孔或房屋)。要求被试仅凭直觉对即将出现的刺激做出预测，并告知被试每个试次中刺激的呈现类型是随机的，既不受之前试次的影响，也与预测阶段无关。

正式实验前包含50个练习试次。练习阶段的阶梯程序从P(image)=0.50开始，房屋和面孔试次各25次，两类刺激随机呈现，并采用彼此独立的阶梯程序。正式实验以练习阶段最后达到的P(image)作为起始刺激强度，继续进行阶梯程序。实验包括4个block，每个block包含40个试次，共160个试次。

每个试次的流程如图1所示。首先呈现注视符，为防止被试产生预期，注视符的呈现时间在500～1500ms间随机取样。随后呈现预测屏，被试需要对下一屏将要出现的刺激图像类别进行预测，键盘左箭头键表示面孔，右箭头键表示房屋。被试需在2s内做出预测，反应会以白框高亮显示，持续时间为2s减去其反应时间。预测后呈现刺激图像，呈现时间为200ms。随后被试需要在2s内对刺激图像进行判断，被试的反应会以白框高亮显示，持续时间为2s减去其反应时间。最后，被试需要评估其对知觉判断准确性的信心程度(1=“非常不自信”，2=“不自信”，3=“自信”，4=“非常自信”)。

图1 实验流程图

实验采用“一升两降”的阶梯程序进行难度控制。在连续两次正确反应后，图像噪声增加一个步长，即P(noise)增加0.01，使图片变得更模糊；在一次错误反应后，图片噪声减少一个步长，使图片变得更清晰。面孔和房屋刺激采用独立的阶梯程序进行调整。在该实验中，阶梯程序的步长调整不会重置计数。具体来说，在连续两次正确反应后，如果被试下一试次仍然做出了正确反应，P(noise)将继续增加一个步长，而无需重新累计两次正确反应。直到被试做出错误的反应，计数才会重置。预实验结果表明，被试的平均正确率为63％。使用阶梯程序能够平衡个体之间的表现差异，有效控制任务难度。为了检验正确率的稳定性，我们还分析了正确率在不同block中的变化趋势(见附录)。

2.4 数据分析

根据预测与知觉判断的一致性，可将试次分为匹配试次组和不匹配试次组。匹配试次指预测和知觉判断一致的试次，即预测和知觉判断均为房屋或均为面孔的试次。不匹配试次则指预测为面孔而知觉判断为房屋，或者预测为房屋而知觉判断为面孔的试次。

首先，采用配对样本t检验比较匹配试次和不匹配试次的占比是否存在差异。如果匹配试次的占比显著高于不匹配试次，则证明存在知觉偏差。然后比较匹配试次组和不匹配试次组在正确率上是否存在差异，以检验预测一致性对知觉判断任务表现的影响。利用信号检测论(Signal Detection Theory)，本实验将房屋刺激视为信号，当刺激图片为房屋且被试判断为房屋时，定义为击中(hit)；当刺激图片为面孔，但被试判断为房屋时，定义为虚报(false-alarm)，以此来计算被试在匹配试次和不匹配试次中的知觉敏感性(d’)。

本研究采用Maniscalco和Lau(2012)开发的元认知敏感性(meta-d’)测量方法来评估元认知判断准确性。该方法将信心评分纳入信号检测论框架，将被试的信心评分视为二阶决策。若被试在正确的知觉判断后做出了高信心评分，则称作二类击中；若在错误的知觉判断后做出了高信心评分，则称作二类虚报，进而可以计算出二阶决策敏感性，即元认知敏感性(meta-d’)。需要注意的是，meta-d’的值受到知觉敏感性(d’)的制约。由于不同被试的d’存在差异，这会造成二阶敏感性的差异，但这种差异并不是由被试元认知能力差异造成的。因此，为了排除个体知觉敏感性差异的影响，本研究使用比率(meta-d’/d’)进行组间比较。该比率反映了一种控制了知觉表现差异后的元认知水平，被称为元认知效率。

本研究使用JASP(版本0.16.2.0)进行数据分析，除了使用频数统计方法外，还进行了贝叶斯分析，报告了支持原假设相对于备择假设的贝叶斯因子(BF01)，或支持备择假设相对于原假设的贝叶斯因子(BF10)，在两种情况下，更高的贝叶斯因子值都表示更强的统计证据(Masson，2011)。所有贝叶斯分析均使用JASP中的默认先验分布。

2.5 实验结果

配对样本t检验结果显示，匹配试次的比例显著高于不匹配试次的比例(M±SD=55％±8％ vs.45％±8％)，t(37)=4.35，p＜0.001，Cohen’s d=0.71，95％ CI=[0.06，0.16]，BF10=242.32(下页图2a)。这一结果表明，无效预期会引起知觉偏差，被试更倾向于将刺激判断为与预测一致。被试在匹配试次与不匹配试次中的平均正确率没有显著差异(63％±6％ vs.65％ ±6％)，t(37)=1.29，p=0.204，Cohen’s d=0.21，95％ CI=[-0.04，0.01]，BF01=2.66(图2b)。

图2 实验1中被试在匹配试次和不匹配试次中的行为表现对比。(a)匹配试次占比显著高于不匹配试次占比。(b)被试在不匹配试次和匹配试次中的正确率没有显著差异。(c)被试在匹配试次上的信心水平显著高于不匹配试次。(d)被试在匹配试次上的元认知效率显著高于不匹配试次。每对点代表每个被试的值，箱型中的上横杠线、中线、下横杠线分别代表上四分位数、中位数和下四分位数。彩图见电子版，下同。

在信心水平上，相比于不匹配试次(2.19±0.48)，被试在匹配试次中有更高的信心评分(2.32±0.48)，t(37)=3.20，p=0.003，Cohen’s d=0.52，95％ CI=[0.05，0.21]，BF10=12.31(图2c)。在元认知效率上，相比于不匹配试次(0.83±0.77)，被试在匹配试次中表现出更好的元认知能力(1.30±1.51)，t(37)=2.11，p=0.042，Cohen’s d=0.34，95％ CI=[0.02，0.92]，BF10=1.26(图2d)。该结果说明预测与知觉判断的一致性能够有效提升被试的元认知表现。除此之外，我们还分析了正确率与信心水平、元认知效率之间的相关关系(见附录)。

3 实验2：中等难度条件下无效预期对知觉判断和元认知的影响

实验1结果显示，无效预期可以引起知觉偏差，即被试倾向于将知觉刺激判断为与预测类别一致。并且，这种预期与知觉的一致性会促进随后的信心评分表现。被试不仅在匹配试次中表现出更高的信心评分，而且信心评估的准确性(元认知效率)也显著优于不匹配试次。因此，尽管无效预测会影响初级的知觉判断导致知觉偏差，但同时也促进了更高级的元认知心理加工。

实验1通过连续的“一升两降”的阶梯程序，将知觉任务正确率控制在63％左右，任务难度整体较高。当刺激模糊程度较高时，被试在进行知觉判断时能够利用的证据较少，因此可能容易受到预测的影响，依据预测的类别做出反应(姜英杰等，2023)。那么，当知觉任务降低时，被试是否仍然会受到无效预期的影响，并进一步影响元认知判断呢?为了探讨这一问题，研究二采用了非连续的“一升两降”的阶梯程序，将知觉任务正确率控制在71％左右，以降低任务难度，继续探讨无效预期对知觉判断和元认知的影响。

3.1 实验设计和被试

实验2与实验1设计相同，因此计划样本量与实验1相同。共招募了46名被试，其中一名被试因在全部试次中只做出一种类型预测而被排除，一名被试在匹配试次中的元认知效率(3.231)大于平均数加3个标准差(3.111)而被排除，剩下44名被试进入数据分析(M=21.02岁，SD=2.05岁)，其中16名男性。

3.2 实验流程

实验2与实验1流程的唯一区别体现在阶梯程序的设置上，实验2仍然使用“一升两降”阶梯程序，但与实验1不同的是，每次步长调整后都会重新计数。具体来说，在P(noise)增加一个步长后，被试需要再次完成两次正确反应，P(noise)才会继续增大。而在实验1中，当P(noise)增加一个步长后，如果被试在下一个试次中再次做出正确反应，P(noise)会继续增加一个步长，无需重新累计。实验2的阶梯程序降低了任务难度，依据前人对阶梯程序的统计分析，实验2的正确率将收敛至71％左右(Leek，2001)。

3.3 数据分析

数据分析同实验1。

3.4 实验结果

配对样本t检验结果显示，匹配试次占比显著高于不匹配试次(53％±7％ vs.47％±7％)，t(43)=2.96，p=0.005，Cohen’s d=0.45，95％ CI=[0.02，0.10]，BF10=7.16。这表明即使任务难度降低，被试仍然更倾向于做出与预测一致的反应，无效预期的知觉偏差效应依然存在(图3a)。被试在匹配试次与不匹配试次中的平均正确率没有显著差异(74％±8％ vs.76％±6％)，t(43)=1.41，p=0.166，Cohen’s d=0.21，95％ CI=[-0.05，0.01]，BF01=2.44(图3b)。

图3 实验2中被试在匹配试次和不匹配试次中的行为表现对比。(a)匹配试次占比显著高于不匹配试次占比。(b)被试在不匹配试次和匹配试次中的正确率没有显著差异。(c)被试在匹配试次上的信心水平显著高于不匹配试次。(d)被试在匹配试次上的元认知效率高于不匹配试次。

在信心水平上，相比于不匹配试次(2.41±0.44)，被试在匹配试次中有更高的信心评分(2.55±0.49)，t(43)=3.64，p＜0.001，Cohen’s d=0.55，95％ CI=[0.06，0.22]，BF10=39.56(图3c)。在元认知效率上，相比于不匹配试次(0.77±0.47)，被试在匹配试次(1.04±0.60)中表现出更好的元认知能力，t(43)=2.68，p=0.010，Cohen’s d=0.40，95％ CI=[0.07，0.48]，BF10=3.80(图3d)。无效预测与知觉判断的一致性仍然能增强被试的元认知能力。

4 实验3：低等难度条件下无效预期对知觉判断和元认知的影响

实验1、实验2分别在高任务难度(63％)和中等任务难度(74％)下发现了无效预期可以引起知觉偏差，并且预期与知觉的一致性促进了随后的信心评分表现，被试在匹配试次中表现出更高的信心水平和更高的信心评分准确性。实验3旨在继续探讨在更低的任务难度下，即当知觉信号更强的时候，无效预期对知觉判断和元认知的影响是否仍然存在。

4.1 实验设计和被试

实验3与实验1、实验2设计相同，因此计划样本量与实验1、实验2相同。共招募了48名被试，其中一名被试在不匹配试次中的元认知效率(3.412)大于平均数加3个标准差(2.933)被排除，剩下47名被试进入数据分析(M=19.92岁，SD=1.61岁)，其中10名男性。

4.2 实验流程

实验3与实验1、实验2流程的唯一区别体现在阶梯程序的设置上，实验3使用“一升四降”的阶梯程序。具体来说，在P(noise)增加一个步长后，被试需要再次完成4次正确反应，P(noise)才会继续增大，而只要做错一次，P(noise)就会下降。实验3的阶梯程序降低了任务难度，依据前人对阶梯程序的统计分析，实验3的正确率将在84％上下波动(Leek，2001)。

4.3 数据分析

数据分析同实验1、实验2。

4.4 实验结果

配对样本t检验结果显示，匹配试次占比与不匹配试次占比无显著差异(51％±5％ vs.50％±5％)，t(46)=1.03，p=0.307，Cohen’s d=0.15，95％ CI=[-0.01，0.04]，BF01=3.82。这表明任务难度低时，被试没有表现出做出与预测一致的反应的倾向(图4a)。被试在匹配试次与不匹配试次中的平均正确率没有显著差异(85％±5％ vs.86％±6％)，t(46)=1.16，p=0.253，Cohen’s d=0.17，95％ CI=[-0.03，0.01]，BF01=3.38(图4b)。

在信心水平上，相比于不匹配试次(2.86±0.54)，被试在匹配试次中有更高的信心评分(3.10±0.45)，t(46)=4.65，p＜0.001，Cohen’s d=0.68，95％ CI=[0.14，0.35]，BF10=752.16(图4c)。在元认知效率上，匹配试次与不匹配试次差异显著，相比于不匹配试次(0.74±0.60)，被试在匹配试次(0.96±0.42)中表现出更好的元认知能力，t(46)=2.27，p=0.028，Cohen’s d=0.33，95％ CI=[0.03，0.42]，BF10=1.62(图4d)。

图4 实验3中被试在匹配试次和不匹配试次中的行为表现对比。(a)匹配试次占比与不匹配试次占比无显著差异。(b)被试在匹配试次和不匹配试次中的正确率没有显著差异。(c)被试在匹配试次上的信心水平显著高于不匹配试次。(d)被试在匹配试次上的元认知效率显著高于不匹配试次。

与实验1(高任务难度)和实验2(中等任务难度)不同的是，我们在实验3低任务难度中没有发现无效预期诱发知觉偏差，这可能是因为任务难度降低，被试能利用更多的刺激信息去进行知觉判断，进而减少了对无效预期的依赖，因此没有发生无效预期诱发的知觉偏差。这与Yanagisawa(2016)的实验结果一致，预期权重与外部刺激信号强度呈负相关关系，随着外部刺激信号强度的增强，预期对于知觉判断的效应会越来越弱。在元认知表现上，我们依旧发现了预期一致性会提高被试的元认知判断准确性。

5 实验4：参照于无预测基线对无效预期的效应作比较验证

实验1和实验2分别在高、中两种不同任务难度下(正确率：63％ vs.74％)发现了无效预期可以引起知觉偏差，即被试更倾向于做出与预测一致的知觉判断。在实验3低任务难度(85％)中，没有发现无效预期的知觉偏差效应。而在信心估计上，3个实验都发现了预期与知觉的一致性能够提高信心水平，并对元认知判断准确性起促进作用。

实验1、实验2和实验3都只设定了预测条件，缺少对预测效果的基线参照，因此实验4增设了无预测的基线条件，在中等任务难度下比较被试在3种条件(匹配试次/不匹配试次/无预测试次)下的知觉表现和元认知是否存在差异。

5.1 实验设计和被试

实验4采用单因素被试内设计，旨在比较预测与知觉判断一致、不一致以及无预测情况下，被试的知觉表现和元认知表现。根据以往相似研究Liu和Yu(2024)报告的效应量大小(d=0.57)，采用G*Power 3.1，设置显著性水平α=0.05，统计检验力1-β=0.90，计算出实验4至少需要样本量为28人(Faul et al.，2007)。实验4共招募42名被试。一名被试在匹配试次中的元认知效率(meta-d’/d’=7.30)大于平均数加3个标准差(M+3SD=4.72)而被排除，最后共41名被试进入后续统计分析(M=20.59岁，SD=1.78岁，14名男性)。

5.2 实验流程

与前3个实验不同，在实验4中增加了无预测条件，作为基线水平进行比较。正式实验前有两个练习block，预测试次block和无预测试次block，每个block各30个试次，共60个练习试次。正式实验包括8个block，其中4个预测试次block，每个block有50个试次，共200个试次；4个无预测block，每个block有25个试次，共100个试次。预测试次流程如实验1所示；无预测试次除了没有预测屏外，其他流程与有预测试次相同。预测试次的block和无预测试次的block做了被试间的平衡。实验过程中预测block和无预测block交替呈现，一半的被试先呈现有预测block，另一半被试先呈现无预测block。实验4采用与实验2相同的阶梯程序进行难度控制。

5.3 数据分析

首先根据有无预测以及预测与知觉判断的一致性，可以将试次分为匹配试次、不匹配试次和无预测试次。分别计算匹配试次和不匹配试次占总预测试次的比例，用配对样本t检验比较被试的匹配试次占比和不匹配试次占比是否存在差异以验证知觉偏差是否存在。随后比较被试在匹配试次、不匹配试次和无预测3种条件下的知觉行为表现和元认知表现是否存在差异，进行单因素三水平重复测量方差分析。

5.4 实验结果

预期的知觉偏差仍然存在，被试的匹配试次占比要显著高于不匹配试次占比(54％±7％ vs.46％±7％)，t(40)=3.90，p＜0.001，Cohen’s d=0.61，95％ CI=[0.04，0.12]，BF10=7***6(图5a)。除此之外，结果还发现预期的一致性会影响被试知觉判断的正确率。重复测量方差分析结果显示，预测一致性在正确率中的主效应显著，F(2，80)=10.53，p＜0.001，η2=0.21，BF10=405.26；事后比较(Holm)发现，被试在匹配试次中的正确率(73％±6％)显著低于不匹配试次(78％±6％)，p＜0.001；在匹配试次与无预测试次(75％±6％)中的正确率没有显著差异，p=0.107；在不匹配试次中的正确率显著高于无预测试次，p=0.010(图5b)。

图5 实验4中被试在匹配试次、不匹配试次以及无预测试次中的行为表现对比。(a)匹配试次占比显著高于不匹配试次占比。(b)被试在不匹配试次中的正确率显著高于匹配试次和无预测试次，匹配试次的正确率与无预测试次没有显著差异。(c)被试在匹配试次中的信心水平显著高于不匹配试次，但两者都与无预测试次的信心水平没有显著差异。(d)被试在匹配试次中的元认知效率显著高于不匹配试次，但与无预测试次没有显著差异，不匹配试次的元认知效率显著低于无预测试次。

在信心水平上，重复测量方差分析表明，预测一致性在信心评分上的主效应显著，F(2，80)=3.55，p=0.033，η2=0.05，BF10=1.35；事后比较(Holm)发现，被试在匹配试次中的信心水平(2.79±0.60)显著高于不匹配试次(2.62±0.70)，p=0.030；在匹配试次与无预测试次中的信心水平(2.73±0.64)没有显著差异，p=0.335；在不匹配试次与无预测试次中的信心水平也没有显著差异，p=0.200(图5c)。

在元认知判断准确性上，预测一致性在元认知效率上的主效应显著，F(2，80)=8.20，p＜0.001，η2=0.17，BF10=110.90；相比于不匹配试次(0.61±0.50)，被试在匹配试次(1.08±0.67)中表现出了更好的元认知能力，p＜0.001；被试在匹配试次中的元认知效率与无预测试次(0.95±0.52)没有显著差异，p=0.290；被试在无预测试次中的元认知效率显著高于不匹配试次，p=0.011(图5d)。

6 实验5：排除动作效应后再验证无效预期的效应

实验4中，无效预期引起的知觉偏差效应稳定存在；跟预期不一致条件相比，预期一致性对元认知判断准确性的促进作用依然存在，这些发现与实验1和实验2结果一致。在前面4个实验中，预测和知觉判断的按键设置是相同的，均用左箭头键代表面孔，右箭头键代表房屋，预期阶段可能会对随后的知觉判断产生动作效应的干扰。因此，在实验5中对预测和知觉判断的按键进行分离，旨在探讨排除可能的动作效应后，无效预期是否仍能对知觉判断和元认知表现产生影响。

6.1 实验设计和被试

实验设计与实验4相同。实验5共招募44名被试，其中一名被试因试次反应率低于80％(75.33％)被排除，一名被试因在匹配试次中的正确率小于55％而被排除，一名被试因在匹配试次中的元认知效率(0.7653)在平均数上下3个标准差之外(0.7492)而被排除，一名被试因总体元认知效率(-0.5886)在平均数上下3个标准差之外(-0.384)而被排除，最后剩40名被试进入后续分析(M=20.85岁，SD=1.96岁，14名男性)。

6.2 实验流程

在实验5中，预测和知觉判断分别设置了不同的按键。在预测反应中，“Q”键和“W”键分别代表“面孔”和“房屋”；在知觉判断中，用左箭头键和右箭头键分别代表“面孔”和“房屋”。其余实验流程与实验4相同。

6.3 数据分析

与实验4相同。

*** 结果

无效预测的知觉偏差效应依然存在，匹配试次占比显著高于不匹配试次占比(53％±7％ vs.47％±7％)，t(39)=2.87，p=0.017，Cohen’s d=0.40，95％ CI=[0.01，0.09]，BF10=2.66(图6a)。对知觉判断正确率做重复测量方差分析，结果显示预测一致性的主效应显著，F(2，78)=3.09，p=0.051，η2=0.01，BF10=1.13；不匹配试次(78％±6％)的正确率显著高于匹配试次(75％±7％)，p=0.046；匹配试次和无预测试次(77％±5％)在正确率上差异不显著，p=0.322；不匹配试次和无预测试次之间也没有显著差异，p=0.322(图6b)。因此，尽管被试在匹配试次中的知觉表现优于不匹配试次，但无论是在匹配试次还是不匹配试次中，被试的知觉表现都与无预测试次没有显著差异。

图6 实验5中被试在匹配试次、不匹配试次以及无预测试次中的行为表现对比。(a)匹配试次占比显著大于不匹配试次占比。(b)被试在不匹配试次中的正确率显著高于匹配试次，但两者都与无预测试次的正确率没有显著差异。(c)被试在匹配试次中的信心水平显著高于不匹配试次，但与无预测试次的信心水平没有显著差异，不匹配试次中的信心水平显著低于无预测试次。(d)被试在匹配试次中的元认知效率显著高于不匹配试次和无预测试次，不匹配试次中的元认知效率显著低于无预测试次。

在信心水平上，预测与反应一致性的主效应显著，F(2，78)=7.20，p=0.004，η2=0.16，BF10=22.14；被试在匹配试次中的信心水平(2.56±0.64)显著高于不匹配试次(2.31±0.65)，p=0.001；匹配试次与无预测试次(2.47±0.65)之间无显著差异，p=0.247；不匹配试次信心水平显著低于无预测试次，p=0.026(图6c)。

对于元认知效率，预测与反应一致性的主效应显著，F(2，78)=12.93，p＜0.001，η2=0.25，BF10＞1000；被试在匹配试次中的元认知效率(1.12±0.69)显著高于不匹配试次(0.52±0.41)，p＜0.001；被试在匹配试次中的元认知效率显著高于无预测试次中的元认知效率(0.81±0.49)，p=0.023；被试在不匹配试次的元认知效率显著低于无预测试次中的元认知效率，p=0.023(图6d)。

7 讨论

本研究旨在探讨无效预期对知觉判断和元认知的影响。实验1采用经典的心理物理法滴定程序，将知觉任务控制在相对较难的水平(平均正确率63％)。结果显示，无效预期能够引起知觉偏差，被试更倾向于做出与预期一致的知觉判断；且更重要的是，无效预期能够提升元认知判断的准确性，在做出与预期一致的知觉判断时，被试表现出更高的元认知水平。实验2将知觉任务控制在中等难度水平(74％)后，进一步验证了实验1的结果；实验3将知觉任务控制在低等难度水平后(85％)，无效预期诱导的知觉偏差效应消失，但是被试在与预期一致的试次中仍然表现出更高的元认知水平；实验4在中等任务难度引入了基线水平(无预测条件)，结果发现预期诱导的知觉偏差效应仍然存在。跟预期不一致条件相比，预期一致性能够提升元认知能力。然而，预期一致条件下的元认知水平与无预测条件相比没有显著差异，但预期不一致条件下的元认知能力却低于无预测试次。这表明，与预期不一致可能会损害被试的元认知判断。在实验5中，排除了预期阶段动作效应的潜在干扰后，预期一致条件下的元认知能力高于预期不一致条件和无预测基线，这进一步验证了预期一致性对元认知水平的促进作用。综上，在刺激信号较弱时(中高任务难度)，无效预期会引发知觉偏差，而在更高级的元认知决策中，无论刺激信号强弱，无效预期始终能够提高元认知判断准确性。

本研究的第一个发现是，无效预期会影响知觉判断，在刺激信号较弱时(中高任务难度)，被试更倾向于做出与无效预期一致的知觉判断，表现为匹配试次的占比显著高于不匹配试次，这一结果与以往关于有效预期的研究一致(Stein & Peelen，2015)。虽然，有效预期对知觉判断起促进作用，而无效预期对知觉判断是促进还是阻碍作用尚不清晰。从理论上讲，无效预期会使知觉判断表现变差，因为刺激本身是独立于预期的，对刺激的判断不应受到预期的影响，预期带来的影响属于额外的噪音干扰。本研究结果在一定程度上支持了这一观点。在实验4和实验5中，被试在不匹配试次中的正确率显著高于匹配试次。虽然实验1(高任务难度)、实验2(中等任务难度)和实验3(低任务难度)中的匹配试次正确率和不匹配试次的正确率差异并不显著，但是匹配试次正确率低于不匹配试次正确率的趋势始终存在(实验1：63％±6％ vs.65％±6％，p=0.204；实验2：74％±8％ vs.76％±6％，p=0.166；实验3：85％±5％ vs.86％±6％，p=0.253)。一个可能原因是本研究采用了动态滴定程序对被试正确率进行了控制，被试在整体正确率上的波动并不大(实验1：SD=4.6％，实验2：5.3％，实验3：4.1％)，使得匹配试次与不匹配试次的正确率差异也较小(实验1：1.6％，实验2：2.0％，实验3：1.2％)。对于实验3，随着任务难度的降低，个体有足够多的刺激证据去做出知觉判断，因此无效预期的作用减弱，这可能也是实验3中匹配试次与不匹配试次正确率差异没有达到显著的原因。值得注意的是，近期研究也表明，预期的促进效应并不总是稳定存在。例如，Thomas等人(2023)发现，预期的作用与预期本身的有效性密切相关。在预期有效性较高(75％)时，预期对知觉判断表现出显著的促进作用；当预期有效性降低至67％时，这种促进效应减弱；而在预期有效性为50％(即无效预期)时，预期效应消失。然而，Thomas等人的研究采用的知觉任务过于简单，被试的平均正确率超过90％，且未使用滴定程度控制任务难度，这可能是该研究未发现无效预期影响知觉判断的原因。综上，本研究的结果表明，无效预期会引发知觉偏差，并可能对知觉判断产生阻碍作用。

本研究的第二个发现是，无效预期会影响信心评分，当被试将刺激判断为与预期一致时，其主观感受的信心水平更高。这一结果与Sherman等人(2016)的研究一致，该研究表明，预期与决策的一致性程度越高，信心水平越高；右侧额叶下回(rIFG)表征了对预期与决策的不匹配，预期信息在rIFG脑区被整合到信心评分中。Liu和Yu(2024)的研究也发现了预期和知觉判断之间的不一致会改变主观信心的神经表征，相比于与预期一致的试次，在与预期不一致的试次中，信心评分相关的核壳活动明显减少，导致不一致试次中的低信心。除此之外，还有研究提出信心评分反映的是当前知觉判断与被试在过去可能做过的其他决策之间自我一致性的程度(Caziot & Mamassian，2021)，因此，当被试做出与之前预期一致的知觉判断时，往往会有更高的自我一致性水平，进而产生了更高的信心评分。

本研究最重要的发现是，无效预期会提升元认知判断的准确性，被试在匹配试次上的元认知效率显著高于不匹配试次。这一结果与Sherman等人(2015)的发现一致，表明预期能够提高元认知水平。但是，Sherman等人的研究中，被试并未实际进行预测，而是通过操纵刺激出现的频率来影响被试的主观期望；此外，他们使用了二分信心判断(即“有信心”或“猜测”)，而本研究采用了四分的信心评分，能够更精确地拟合元认知参数。尽管无效预期并不包含对决策有用的信息，但仍然也是个体的一个自愿且自主的行为，当预测与知觉判断一致时，个体的大脑奖赏回路会被激活，产生更强的自我控制感(Hampton et al.，2007)。相比于不一致情况可能对被试造成认知冲突(Botvinick et al.，2001)，在一致试次中，被试能够有更多的认知资源进行信心判断，因此一致试次中的信心判断准确性会高于不一致试次。除此之外，预期与自我效能感关系密切，预期的满足往往能够增强个体的自我效能感(Abaszadeh et al.，2024)，提升决策的动机水平(Walkey et al.，2013)，因此可能促进被试信心评估的准确性。然而，这一机制的解释有待进一步实验验证。

本研究发现先验预期会阻碍知觉判断，但促进元认知决策，这一发现与最近的一项研究中发现的预期对于知觉决策和元认知决策影响模式相同(Constant et al.，2023)。在该研究中，Constant等人(2023)设置了两个连续的知觉判断任务，第一个知觉判断的结果(正确/错误)与第二个知觉刺激(向左/向右)存在特定关联，因此第一个知觉判断能够提供关于第二个知觉刺激的先验信息，引发对第二个知觉刺激的预期。随后，被试需要对第二个知觉判断做出信心评分。结果发现，知觉判断和信心评分对先验信息有着不同的加工过程：知觉加工过程无法充分利用先验信息，先验信息反而作为噪音阻碍了知觉判断，而在更高级的元认知加工过程中，先验信息能够被更大程度地整合，元认知效率得到提高。Balsdon等人(2021)在神经层面上也发现了知觉判断与信心评分信息加工过程的不对称性，在元认知判断过程中，上顶叶和眶额皮层存在独立于知觉判断的神经环路激活，相比于知觉决策过程，信心评分过程中证据累积的来源也更加多样，更易受到自上而下的调控影响。总之，这些结果表明，尽管知觉判断和信心评分是密切相关的认知加工过程，但其内在机制存在差异。研究结果为进一步探索信心评分和知觉判断的分离提供了重要启示。

本研究首次发现无效预期仍然能够影响知觉判断，进一步拓展了预测编码理论。经典预测编码框架强调“预测误差最小化”原则，认为大脑通过不断更新先验模型以匹配感觉输入(Clark，2013；Hu et al.，2021)。然而，这一理论主要解释有效预期(即与刺激统计关联的预期)的认知促进作用(Kok et al.，2014)。实验1和实验2的结果发现，在中高任务难度下(平均正确率75％和63％)，无效预期会诱导被试产生知觉判断偏差，即更倾向于做出与无效预期一致的知觉判断，并且无效预期会作为噪音干扰感觉证据累计过程，表现为匹配试次正确率的下降。这与Yon等人(2019)提出的“顽固科学家”假说也形成了实证呼应，即大脑在感觉证据不足时，会顽固地维持错误预期。然而，无效预期对知觉判断的影响存在一定的边界条件。实验3结果表明，在知觉任务较为容易时(平均正确率85％)，无效预期并未影响随后的知觉判断。这可能是因为任务难度降低，被试能利用更多的刺激信息去进行知觉判断，进而减少了对无效预期的依赖，从而无效预期没有诱发知觉偏差的发生。这与Yanagisawa(2016)的实验结果一致，预期权重与外部刺激信号强度呈负相关关系，随着外部刺激信号强度的增强，预期对于知觉判断的效应会越来越弱。

本研究为知觉判断和信心估计的双阶段分离模型提供了新的行为学证据。在传统的心理物理学模型中(Charles et al.，2014；Macmillan & Creelman，2005)，研究者假设个体对自身信心的估计是基于与感知决策相同的内部感官证据。这一理论观点已在动物研究中得到验证(Kepecs et al.，2008)，Kiani和Shadlen(2009)也发现了单个神经元的放电率既能反映信心水平，又能反映感知决策。但是，近年来，越来越多的研究开始发现信心评分和知觉判断过程中利用的内部感官证据并不相同。有研究发现信心评分几乎完全取决于与反应一致的证据(即支持已选类别的证据)，而知觉判断依赖于支持与反对所选刺激类别的证据之间的平衡(Maniscalco et al.，2016；Sun et al.，2025)。Peters等人(2017)使用颅内电生理记录和机器学习技术证明了在面孔/房屋辨别任务中，知觉决策和信心估计依赖于时空可分离的神经表征。与我们的研究结果类似的是，Vlassova等人(2014)发现无意识信息改变知觉判断准确性，但不影响信心水平。在元认知敏感性上，我们的研究表明，无效预期虽然阻碍了知觉判断，却提升了信心判断的准确性。无效预期对知觉决策过程和信心判断准确性的不同作用支持了Fleming和Dolan(2012)提出的知觉判断和信心判断双阶段分离模型。

8 结论

本研究旨在探讨完全自发的、直觉性的无效预期对知觉判断和元认知的影响。结果表明：(1)当刺激信号强度较弱时(中高等任务难度)，无效预期导致知觉偏差，个体倾向于将刺激知觉为与预期一致；(2)无效预期影响主观信心，当个体的知觉判断与预期一致时，其对判断的信心水平更高；(3)无效预期提升元认知判断的准确性，个体在匹配试次中的元认知效率显著高于不匹配试次。尽管无效预期引发知觉偏差，但它促进了个体在元认知层面的加工。这些结果首次揭示了无效预期对于低级知觉判断和高级元认知功能的不同作用，为理解预期、知觉与元认知三者之间的关系提供了重要理论支撑，同时也为优化认知决策、提升元认知能力提供了实践启示。

参考文献

[1]Fleming,S.M.,& Lau,H.C.(2014).How to measure metacognition.Frontiers in Human Neuroscience,8,443.

[2]García-Pérez MA.(1998).Forced-choice staircases with fixed step sizes:asymptotic and small-sample properties.Vision Research,38(12),1861-81.

[3]Hu,X.,Yang,C.,& Luo,L.(2023).Are the contributions of processing experience and prior beliefs to confidence ratings domain-general or domain-specific? Journal of Experimental Psychology:General,152(1),28.

[4]Luo,T.,& Liu,C.(2023).The impact of feedback on metacognition:Enhancing in easy tasks,impeding in difficult ones.Consciousness and Cognition,116,103601.

[5]Maniscalco,B.,Peters,M.A.,& Lau,H.(2016).Heuristic use of perceptual evidence leads to dissociation between performance and metacognitive sensitivity.Attention,Perception & Psychophysics,78(3),923-937.

[6]Peters,M.A.K.,Thesen,T.,Ko,Y.D.,Maniscalco,B.,Carlson,C.,Davidson,M.,Doyle,W.,Kuzniecky,R.,Devinsky,O.,Halgren,E.,and Lau,H.(2017).Perceptual confidence neglects decision-incongruent evidence in the brain.Nature Human Behavior.1,0139.

[7]Rahnev,D.,Maniscalco,B.,Luber,B.,Lau,H.,& Lisanby,S.H.(2012).Direct injection of noise to the visual cortex decreases accuracy but increases decision confidence.Journal of Neurophysiology,107(6),1556-1563.

[8]Sun,F.,Ni,Y.,Lu,W.,Su,J.,Wang,S.,& Wan,X.(2025).Confidence bias prescribes the neurocomputational mechanism of decision-making.Cell Reports,44(5),115563.Advance online publication.

[9]Vlassova,A.,Donkin,C.,& Pearson,J.(2014).Unconscious information changes decision accuracy but not confidence.Proceedings of the National Academy of Sciences of the United States of America,111(45),16214-16218.

罗铁勇刘翠珍：无效预期诱发知觉偏差却提升元认知判断准确性

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏

罗铁勇 刘翠珍：无效预期诱发知觉偏差却提升元认知判断准确性

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏

罗铁勇刘翠珍：无效预期诱发知觉偏差却提升元认知判断准确性