内容提要:田野实验日渐成为政府与政治研究的一个重要的方法选择。田野实验的具身真实感合理平衡了研究的内外部有效性,这种平衡的潜力使得田野实验在海外政府与政治研究中具有广阔的应用场景,在投票选举、精英行为、公共服务与集体行为、透明性问题等真实情境中均可见到巧妙嵌入的田野实验。然而,无限模拟真实情境的田野实验同时面临研究者与公众及研究对象之间的信任等伦理挑战,需要对选择的实验设计进行审慎的道德伦理考察。虽然田野实验在应用上具有较高准入门槛,但在中国的政府与政治研究中具有天然优势,未来应重点关注田野实验在中国应用的可能场景及其与中国治理情境的契合性,并探讨如何将田野实验深度适配于当前的政府行动和政策实践。
关键词:政府研究/ 田野实验/ 应用性/ 适用性/
标题注释:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目“中国社会治理的自主知识体系建构与实践路径研究”(23XNL012)。
作者简介:陈那波(1975- ),广东茂名人,中国人民大学社会学理论与方法研究中心、社会学院教授、博士生导师,国家治理工程学院社会工作与社会治理研究所所长,国家治理大数据和人工智能创新平台研究员,主要研究方向:国家治理与地方政府行为(北京 100872);卓佳钰(1995- ),女,福建南靖人,中山大学政治与公共事务管理学院博士生,本文通讯作者,主要研究方向:政府治理(广州 510275)。
原文出处:《江淮论坛》(合肥)2025年第5期 第125-134页
一、政治“场域”中的田野实验
关于社会科学研究者如何观察、理解和解释真实世界中的社会过程,目前主流的方法主要有三个路径:一是基于“大样本”数据收集进行的统计分析定量研究,这种研究方法主要揭示了变量的相关性。二是基于“小样本”的定性案例研究,这种研究方法聚焦于变量的影响过程机制。三是使用混合研究方法,例如先通过大量数据收集和统计分析,并结合田野观察对变量关系进行解释。但是这三种常见的研究方法路径均无法有效地直接对变量的因果关系做出观察和推断。于是,社会科学家从自然科学的随机对照实验(RCT)中受到启发,使用实验法对变量因果关系进行考察。但社会科学研究者更需要关心行动发生的背景,也即布迪厄称之为“场域”的那些要素[1],要从宏观的社会结构性特征理解制度背景对行动的影响。施特劳斯和科宾也强调特定情景中行动与环境互动的动态过程。[2]因此,随着新的实验技术与工具的出现和对研究问题的深入探索,实验方法不断完善,数据收集方式不断改进,越来越多的研究者呼吁在真实情境中采用实验方法进行研究。
政治学中田野实验的复兴始于一系列关于投票活动的实验研究。[3-4]一开始,田野实验集中应用在选举投票的政治过程中[3]。后续研究人员逐渐拓展田野实验的应用领域,通过巧妙的设计,将实验嵌入到真实世界的社会背景中,观察揭示各种社会现象的因果机制,例如研究精英行为[5]、透明性问题[6]、暴力冲突问题与和平问题[7]。在《美国政治科学评论》中,运用田野实验方法的研究的论文数量及其影响都在增长。[8]2019年,班纳吉、迪弗洛和克雷默利用田野实验减少全球贫困的研究获得了诺贝尔经济学奖[9],更是极大地提升了研究人员对田野实验方法的使用热情。整体而言,田野实验有助于改进过于强调技术、规范和样本量的量化研究,通过发挥米尔斯所说的社会学的想象力[10]和格拉泽的理论触觉[11],把实验干预行动放入实景“场域”中以更好地观察、分析和解释真实社会世界的运作逻辑并进行因果推断。同时,田野实验还能为实务界提供增进政策有效性的切实依据。这两方面的价值相辅相成,共同推动了田野实验方法的持续应用和不断发展。
二、平衡的潜力:田野实验的定位
(一)田野实验方法的发展
统计学家费舍尔提出用随机对照实验(RCT)回答因果问题。在随机对照实验中,实验组和对照组随机产生,因此实验结果的任何差异都反映了干预的影响。政府和政治研究者受到启发,尝试借此克服传统研究方法的局限性。[4]
田野实验方法的定义时常通过和实验室实验方法(Laboratory Studies)对比为人们所认识。麦克德尔莫将实验室实验定义为研究人员应确保实验过程中除了对自变量的干预之外没有任何其他变化,且其中研究人员拥有对实验对象的招募、随机分配、干预和测量的控制权,实验设计还应该包括标准化的流程,以确保任何观察到的因变量变化都来自实验干预,以及确保实验室实验因果推断的内部有效性。与之相比,田野实验对于实验外部环境的控制没有实验室实验那么严格。麦克德尔莫认为实验方法还应包括田野研究(Field Studies)、田野实验(Field Experiments)和模拟研究(Simulation Studies)。[12]
研究人员常常依据控制程度对实验方法进行具体的分类。海森恩等人以“是否有实验组和对照组、干预是否外生、是否随机分配、研究人员是否能控制干预、研究人员是否能控制环境”五个维度区分实验室实验、问卷调查实验、田野实验、自然实验、准实验、传统大样本观察性研究和传统单案例这七种研究方法。[13]在海森恩等人所介绍的实验研究方法中,田野实验、自然实验和准实验在概念上最容易混淆。这三种实验方法均没有对环境维度进行控制,而是发生在真实自然的情景中。在此基础上,准实验与自然实验均不对实验干预进行控制,而是依赖自然事件或者社会事件进行实验分组。虽然在准实验中,研究人员也依赖政策事件的发生,但是研究人员可以选择或设计对照组,因此适合政策评估使用。以评估交通限行对交通缓解情况的影响研究为例,交通限行政策是政府或城市决定实施的,因此,自然实验的研究人员不能选择哪些地区实施限行,哪些地区不实施限行,因此研究人员只能根据已经发生的事件进行比较,如限行地区和未限行地区的交通拥堵变化。而准实验设计中,研究者则可以主动选择一组未实施限行政策但是其他特征与已经实施“限行”政策相似的城市进行对比,并使用统计技术来校正实验组和对照组之间的初始差异,评估“有无限行”对“特定特征”城市拥堵程度的影响。相比而言,准实验的使用更为灵活,但非(类)随机分配和统计校正不当则可能引入偏差。
进一步的田野实验分类基于与真实世界的相似程度,把田野实验分类为人为田野实验(Artefactual Field Experiment)、框架式田野实验(Framed Field Experiment)与自然式田野实验(Natural Field Experiment)[14],这三种田野实验的“真实”程度依次递增。人为田野实验是对传统实验室实验的延伸,其实验场景在现实生活中并不会以完全相同的形式出现,例如实验在乌干达进行独裁者游戏模拟,通过被试对象表现出的利他程度探索种族合作议题。[15]框架式田野实验相对人为田野实验更加贴近真实世界情景。例如勤恩等人通过邀请美国议员雇用的助理进行情景演练,模拟他们平时对议员日程安排的决策过程,探究助理在得知会面请求是由政治行动委员会(PAC)代表还是选民提出后,做出日程安排的决定差异。[16]自然式田野实验最贴近真实世界情景,实验对象是在真实环境中自然地执行任务,被试群体很可能不知道他们正在进行实验。因此田野实验是通过尽可能的增加真实感以在内部和外部有效性之间提供合理的权衡,这种平衡的潜力使田野实验成为许多研究领域的“黄金标准”。
(二)田野实验的伦理考量与规范
一般而言,实验存在四个方面的伦理问题:实验前的实验对象知情同意权受损、实验可能带来的风险/收益不合理、对被试者的欺骗行为以及实验后对实验对象的部分汇报。[12]菲利普斯增加了“可能存在与合作部门的利益问题”和“可能削弱公众或合作部门对学界专业的信任”两个方面问题。[17]田野实验中若违反伦理规范,可能损害研究人员与公众及合作部门之间的互信,尤其是在把具有较低可接触性、样本数量有限的政治精英群体作为研究对象时。
常见的田野实验伦理问题规范性指导有伦理审查委员会(IRB)、贝尔蒙特原则(Belmont Principles)和一些国际会议网络。大学或研究机构里的伦理审查委员会(IRB)规范和保障了被试人员权益和研究的“合法性”。但即使是精通本研究领域的委员会专家,他们也不可能是全方面的通才,不可能完全了解田野实验开展的各个地区的政治、宗教和道德文化规范,更无法掌握实验实施全过程的具体细节,因此已有的伦理审查是偏一般的、程序合规的。贝尔蒙特原则主要侧重于对研究个体的保护,但公共管理的实验主要侧重于机构或群体的行为,因此它们为公共管理田野实验提供的伦理指导有限。其他的一些国际学术网络,例如2011年治理和政治证据网络(Evidence in Governance and Politics Network,EGAP)通过了五项原则,但是该原则较为宽泛,缺乏具体的操作细则和指引。美国政治学会批准了对其道德规范《政治学专业伦理指南》(A Guide to Professional Ethics in Political Science)的修订,阐明了12条原则和指南,其承认了政治科学研究的复杂性及可能存在例外情况,但指出研究人员使用欺骗策略时应该审慎考虑。
三、田野实验在海外政府与政治研究中的常见应用场景
(一)选举投票中的田野实验
1.投票动机的考察
在政治竞选过程中,比较具有代表性的研究是关于投票动机的议题。凯恩德对1988年美国全国选举数据进行研究,试图评估选民接触到特定种族信息如何影响他们的投票选择。[18]他们利用受访者的选举前访谈日期来标定接触水平。发现接触时间越长,偏见对投票选择的影响越大。但这个研究无法排除同期其他信息干预,例如种族信息干预程度的影响。
由于美国社会对影响选举投票因素的密切关注,研究人员对影响投票的种族因素进行了一系列的研究,该领域的研究也呈现延续性,许多研究能够对前序研究进行验证。例如孟德尔伯格采用了田野实验的方法进一步推进了凯恩德的研究。[19]他通过对竞选期间政治事件曝光的确切内容和环境的比较,选择了1988年美国选举期间三个不同的真实新闻片段(其中包括“霍顿案”)作为研究变量,来测量种族信息对白人选民种族平等观念的影响。从这项研究的结果来看,该田野实验证实了种族信息会增强白人选民种族偏见的发现。
也有学者使用田野实验探究性别因素在选举投票中的作用。[20]奇马等人致力于缩小政治参与中的性别差距。他们在巴基斯坦进行了一项田野实验,发现当男性家庭成员被游说支持女性参与投票时,女性的投票率会大幅增加。[21]在男女都被拉票的家庭中,女性投票率增幅最大。卡坡威兹等人设计了一个田野实验探究来自政党领导人传递的信息是否会影响女性在选举中的成功。他们通过与一个共和党占主导且女性代表占比较低的州共和党合作,研究政党如何通过外部干预影响女性代表的占比,证实了政党领导人的简单干预可以影响候选人和选民的行为。该田野实验还在后续开展的一项调查实验中复制并验证了这一发现。
2.投票方法与技术
在马里兰州,赫恩森等人测试在传统的选举投票日之外为选民提供便捷投票方式对投票行为的影响,他们提供三种新投票方式,一是允许选民在选举日之前到指定地点提前投票;二是无需任何理由即可申请邮寄选票;三是通过安全的在线平台申请投票。研究发现选民在缺席传统选举投票日时,最有可能使用邮寄或者在线平台进行投票,而非提前去指定地点投票。[22]测试结果启发竞选管理人员能通过提供更多便捷投票方式增加选民投票意愿。[23]霍普金斯等人也通过田野实验证实提供邮寄投票的方式可以提高公民投票率。[24]阿森诺等人的田野实验表明,竞选活动不仅要考虑投票的时间和方式的便利性,还需要考虑背景性因素。
还有学者使用田野实验方法探究使用投票技术工具对于投票行为的影响。投票建议程序(Voting Advice Applications,VAAs)是世界各地最近几次选举中常使用的应用程序,然而,人们对它如何影响政治行为知之甚少。[25]皮安左拉等人通过在瑞士的一项田野实验的结果发现VAAs可以影响投票行为。[26]沐恩塞特等人在德国开展了一项田野实验,探究VAAs如何影响政治行为、态度、媒体消费甚至社交媒体活动。[27]研究结果表明,在复杂的网络信息环境中,VAAs的实际价值在于增加选民对政党议题立场的了解。佩瑞拉等人通过田野实验探究在葡萄牙自动取款机(ATM)投放广告对动员选民投票的影响。
(二)精英行为的田野实验
精英行为议题的田野实验主要以政治精英群体作为研究对象,测试种族、党派、媒体曝光和选民意见因素是否影响政治精英对选民的响应、政策的偏好和政治活动参与的积极性。[28]布鲁克曼等人研究了种族差异是否会影响州议员对选民登记投票请求的反应。他们采取了一些措施,以确保实验干预对实验对象的风险最小,包括谨慎并且减少使用欺骗手段,不损害任何议员的声誉和减少议员的时间负担。实验团队随机选择了虚构的黑人或白人特征的名字向议员共发送了4859封电子邮件,同时还干预了文本,以表明发送者的党派偏好,询问需要发送者做何种事情才能在未来的初选中进行登记。实验团队随机发送询问关于民主党初选、共和党初选或者没有指定政党的初选情况,并将种族干预与党派干预信息混合交叉,总共给出6种干预方案,测试议员对不同党派选民问询的响应情况。
其后,布鲁克曼等人又进一步通过田野实验测试黑人议员是否比他们的竞争对手更有内在动机推动黑人选民利益。[5]布鲁克曼等人向州议员提供了一个改善黑人福利的机会,通过50个州的州立法网站收集议员信息,然后向6928位州议员分别发送了一封电子邮件,请求他们帮助申请登记失业救济金。所有的电子邮件都来自具有黑人特征的名字(例如Tyrone Washington)。实验中一组的发件人表示居住在议员选区内的城市,另一组是发件人表示居住在远离其选区的城市。结果表明,黑人议员明显更有内在动机促进黑人利益。
(三)公共服务与集体行动中的田野实验
集体行动的议题主要关注公共物品的生产和维持。欧尔肯通过印度尼西亚的田野实验,探索了直接民主与地方公共产品的关系。[29]政治决策过程是复杂的,一般而言对于政策决策过程的研究大部分采用观察的方式进行,因此,使用田野实验随机分配和评估政治过程具有挑战性。在欧尔肯的研究中,他设计了两种不同的政治决策过程,包括村民直接投票和村民代表会议方式进行决策,这是田野实验的一次开创性应用。
研究发现,对于“一般项目”而言,公民直接投票的项目产生方式使得村民对项目的满意度提高,更愿意为项目的实施作贡献,但对于项目选择(例如项目类型、位置)影响不大。对于“女性项目”而言,结果显示公民直接投票的方式导致项目更多的落地在较贫困的村庄,但是这种项目的选择也更符合村庄中精英的偏好,这说明虽然公投赋予了贫困女性投票权,改变了项目的选择,但是改变的方向和过程较为复杂。欧尔肯的研究为探究直接和间接民主对公共服务项目的选择提供了一个实验框架,展示了如何通过实验随机分配政治决策过程,拓宽田野实验的应用范围。
在社会角色与社会参与方面,有研究通过对阿富汗的500个村庄要求女性参与发展的项目进行田野实验,探究强制要求女性参与发展项目对其权利提升的影响。[30]研究表明这种强制性措施增加了女性参与社区活动,提升了男性对女性在公共事务中角色的接受度,女性开始参与更多的社区活动,但没有改变她们在家庭和社会中的传统角色,即干预的效果仅在社区层面显著,在家庭和社会层面没有显著的变化。
在公民行为与公共服务提升方面,贝克曼和斯文森的田野实验发现公民监督对乌干达当地医疗保健服务质量的巨大影响。[31]在当地自上而下的监督方法没有发挥作用的情况下,基层社区监测可以在改善服务提供方面发挥重要作用。菲尔文等人的田野实验发现,在冲突后的利比里亚,参与“社区驱动的发展”计划可以提高社区采取集体行动的能力。[32]本顿等人在乌干达坎帕拉市的100个社区组织了公民报告员,要求他们通过短信平台每周向市政府报告垃圾堆积的情况。在为期9个月的研究期间共收集了23856份报告。[33]研究发现,公民报告信息质量参差不齐,有的报告信息存在矛盾点,这不仅加剧了工作人员信息验证的工作负担,其报告内容也与管理者的关注点存在偏离,而且公民报告也并未如预期那样改善垃圾堆积与清理状况。该研究启示,在使用田野实验方法时需要对数据收集过程进行更加规范化的控制。参与人员的理解差异、观察差异、信息收集技术手段的限制、报告动机差异等均可能导致采用田野实验方法的研究问题得不到有解释力的回答。因此,研究者应当明确报告的框架与标准,改进数据收集和验证机制,以避免资源浪费并提高研究结论的有效性。
(四)透明性问题的田野应用
田野实验方法能够通过巧妙的设计研究透明性相关的话题。已有对透明性问题的研究,聚焦于探究不同审计方式对减少项目腐败的影响、违规举报的宣传对减少违规行为的影响和增加官员信息披露与提高公民素质对提升公民问责能力的影响。在腐败行为监督方面,欧尔肯在2003年9月至2004年8月对印度尼西亚的608个村庄开展的科勘曼顿发展计划(KDP)项目进行了田野实验。[34]如果村庄得到项目资助,就需要召开会议计划施工,然后由所选出的团队采购材料、雇佣劳工并进行项目建设。分配给该村的款项是一次性的,经村民会议批准后剩余资金可用于其他开发项目,不必返还。
为了测量外部监管的影响,在获得资金后且在项目建设之前,欧尔肯随机选择了一些村庄并告诉他们,他们的项目随后将由中央政府审计机构进行审计,把这些村庄被外部政府审计的可能性从之前的4%提高到100%。该项实验对比了三种不同的监督措施:增加外部审计的可能性、增加村民参加问责会议的机会以及允许村民匿名提交意见或举报问题。最后通过比较在这三种不同的监督措施下村庄公布的项目花费和村庄实际花费之间的差距,来考察不同的监督问责方式对腐败程度的影响。
为核算出项目的实际支出,欧尔肯召集了一个工程测量团队,在项目完成后估算所用材料的数量,调查当地供应商,并采访村民以确定项目实际开销。实验结果发现基层的监督可能存在“搭便车问题”,而自上而下的监督可以有效减少腐败问题。还有探究增加举报不法行为的广告投放是否影响公民监督选举能力的田野实验。他们利用脸书(Facebook)平台的广告进行干预,鼓励公民检举违规行为。[6]研究发现投放广告干预后,公民报告违规行为的数量显著增加,候选人选举的违规行为有所减少,这种效果在候选人被告知有脸书投放广告鼓励公民检举的地区效果更加显著,提高了选举的公正性。
向公民披露政府与官员的信息同样影响公民的行为。阿尔伯特等人通过田野实验,探究向选民提供更多现任官员表现的信息是否可以加强选举问责。[35]研究表明此类信息不仅减少了墨西哥地方选举中对政党的支持,还降低了选民的投票率。戈特利博[32]在马里95个地方开展了田野实验,他们随机选择了一些村庄接受公民课程,该课程向村民提供了地方政府职能和责任的信息,因此接受课程的村民提高了对政府官员表现的期待。[36]实验结果表明,上过公民课程的村民投票时更多地基于官员的表现进行投票。
四、中国政府与政治研究领域中的田野实验:选择与适用
对田野实验在海外政府与政治领域的应用及发展的回顾可见,田野实验在最近三十年开始复兴并展现了蓬勃的生命力,海外研究人员应用田野实验方法开展了一系列研究,从探究选举投票过程逐步拓宽应用到精英行为、公共服务与集体行动以及透明性问题的议题上。同时,与田野实验研究设计的标准化、规范化相比,同样重要的是研究人员需要对选择的干预方法进行审慎充分的道德伦理考察。虽然田野实验在应用上存在较高的准入门槛,但其能够中和我国在政府与政治研究中长期存在的研究方法上的二元对立争论,推动实现因果推断,并对现有理论进行证实或证伪。而我国治理情境的多样性也为田野实验方法提供了一个天然的应用场所,并且能够在多个政治过程中进行田野实验研究。因此,田野实验方法也可进一步转变为推动国家治理科学化、精准化、现代化的重要工具。
(一)对当前中国政府与政治研究的方法争论的弥合
田野实验方法对中国政府与政治研究的适用性,着重体现在它对当前的研究方法争论的中和以及超越。在过去相当长一段时间内,对研究方法的反思和审视一直是我国政府与政治研究领域中的一条主线。一方面,定性研究取向主要以个案研究为主,扎根理论和民族志研究等取向偶有出现[37]。这种方法取向虽然能提供细腻的情景洞见,但若仅依赖一时一地的个案研究,所得出的结论往往零散而有限,难以实现真正的因果识别与理论推广。并且在案例研究方法使用过程中,案例的诠释很大程度上依赖研究者的问题意识和理论敏感性,不同研究者面对同一案例可能得出完全不同的结论或形成质量差异很大的研究作品。另一个容易出现的问题是循环论证,这种情况下质性材料容易成为理论的举例和注解,无法做出理论贡献,例如有学者指出“先分析框架后论证”的写作模式导致案例的结构化和裁剪,因而丧失了很多帮助理解案例发生机制的细节,容易导致公共管理学科理论的碎片化[38]。
另一方面,对定量研究而言,许多的统计研究往往基于官方统计、社会调查数据或其他研究的二手数据,而这些数据的收集过程不一定完全符合研究问题的需要。并且,定量统计研究往往将复杂的社会现象抽象为变量,数据来源通常是截面的、抽象的、概念的,在提炼过程中往往导致一些细节和动态的缺失,难以反映真实的过程。有些“实证研究”实质上是在用统计检验来取代理论建构,或者出于统计数据可得性来选择研究问题,而不是根据研究问题去选择最合适的研究方法[39]。在这种情况下,对数据可得性的考量往往被置于研究选题意义之上。
田野实验方法有助于弥合当前中国政府与政治研究的方法争论及相应缺失。首先,田野实验能够在研究过程中直接获取一手资料,这不仅有效舒缓了传统研究中数据不可得的困境,还使得研究者有机会通过长期追踪积累面板数据,为观察社会现象的演变轨迹提供可靠的经验基础。相比依赖二手数据的研究,这种直接采集的数据更加贴近现实,研究人员对数据生成过程有更高的掌控力,数据具有更高的真实性和完整性。其次,田野实验在理论检验与推进方面具有突出的优势。它能够在真实社会情境下对理论假设进行直接的证实或证伪,并在实验过程中对因果机制进行全过程的跟踪和拆解。与依赖统计相关性的分析相比,田野实验能够在较大程度上减少循环论证的风险,使因果推理的逻辑链条更加清晰,从而为理论的发展和完善提供更为有力的实证支持。最后,田野实验的设计和实施要求研究人员必须对研究对象及其所处环境具有充分的理解和把握。在田野实验的设计下,这种对当下情景的真实认知使得研究者往往能够捕捉到传统方法难以揭示的机制性细节,进而形成更加精细、生动的洞见,丰富理论解释的力度。
(二)田野实验方法与我国治理情境的契合性
第一,中国有多层级多样化的行政单位(例如县区、乡镇、街道、村庄),并且随着基层治理不断迈向创新化和精细化,发展出以网格作为最小的管理和服务单位[40],这种“天然”和多层级的行政划分与设置可以为田野实验的开展提供研究设计及操作上的广阔空间。丰富且差异化的研究对象有助于研究人员使用田野实验方法在不同的行政层级里开展、复制、检验和推进实证研究。在此之上,研究人员还可以进一步探究同一层级政策由不同权威部门提出实施对政策效果的影响。此外,在我国现行的社会治理体系下,大量基层工作人员承担着将政府公共服务延伸至“最后一公里”的职责。基层工作人员(如网格员、社区工作人员等)对研究人员而言具有较强的可接触性,他们的工作几乎覆盖公民生活的各个方面。在提升公众对政府服务满意度的同时,他们既有的与公众的良好互动关系和对公共服务落实细节的深入理解,也为田野实验的情境设计与可行性提供了重要支撑,并能在田野实验的协调与动员中有效促进公众参与,提升涉及公众参与的田野实验的响应程度。
第二,中国国家治理面临着大国治理固有的复杂性与挑战,田野实验方法有助于实践者与研究者对此作出回应。我国社会治理既要保证政令统一,也要允许区域差异化的治理创新。我国东部沿海与西部内陆、城市与农村在发展程度上的客观差异导致了治理任务需求上的差异化(例如是侧重公共服务精细化供给还是基本公共服务供给),使得社会治理政策的适用性在空间层面呈现复杂多元的形态。并且区域内人口职业构成、教育水平、文化背景等也存在差异,这种多维且多元的社会情境为田野实验提供了丰富的展开场所。田野实验方法的应用能够帮助研究者在真实的治理情景中,通过对照和干预识别政策效应,并且通过多地的干预结果更好地捕捉政策绩效的因果链条,提高政策的适配性,真正与中国具体实际相结合,运用科学的世界观和方法论解决中国的问题。
第三,数字平台建设和数据收集技术在我国的蓬勃发展为田野实验的开展和数据采集提供了诸多便利。大数据与智能化时代的来临推动国家治理或政府治理现代化。[41]翁茜和李栋介绍了在中国使用在线田野实验的前景[42],目前许多田野实验是通过在线田野实验的方式开展的。研究人员能够依托已有的数据平台开展田野实验[43],进行多渠道数据交叉验证和组合,充分发挥获取大规模样本、降低研究成本和提高外部效度等优势。同时,一手信息收集工具的便捷应用也为田野实验的开展提供了便利条件。研究人员可以利用普及率高的公开网站和微信小程序(如问卷星)等工具收集一手数据,跨越田野实验数据收集的空间限制,提升数据收集的效率,为田野实验的应用发展提供有利条件。
(三)田野实验方法的情境化应用
党的二十大报告指出:“我国社会主要矛盾是人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。”[44]中国作为幅员辽阔、人口众多的大国,面临着复杂快速的经济和社会变迁,我们需要回答国家治理现代化与社会善治的实现路径。因此,国家治理在实现全国统一政令与制度安排的同时,必须回应区域发展不均衡、不充分所带来的治理差异。这种基于空间的治理情景和治理能力上的分化,使得“统一政策”在不同空间情境下呈现出不同的适用性与执行效果。在此背景下,田野实验方法为研究如何破解“一统体制与有效治理”的基本矛盾提供了一条可行的探索路径,通过在真实治理情境中引入干预和进行比较,能对政策决策、政策执行和政策评价全过程进行优化提升,成为有效的“政策求解”工具[45]。
在政策决策过程的研究中,既往研究探讨了“注意力分配”[46]“激励设置”[47]“非正式制度”[48]“循规行为”[49]等因素对决策过程的影响。田野实验方法可以对已有的政策决策过程研究做进一步的推进,探究决策者和决策部门的注意力分配,为什么重视这个而不重视另一个?什么情境或条件会促使一个决策的出台?不同的政策工具如何进行选择?这些因素都可以通过田野实验的手段来寻求答案。例如,通过媒体干预的田野实验设计,可以考察地方政府决策在多大程度上受到舆论的影响,也可以探索舆论议题的类别差异、合法性承载程度差异等要素的影响机制;又例如,通过田野实验的相应设计,可以了解正面激励和负面激励对地方政府决策者的激励机制及效果差异。如省级组织部门可在省内随机选取一个县,分两个阶段展开实验,在第一阶段发布某一项政策,配之以晋升机会、财政奖励、公开表彰等正面激励手段。在第二阶段发布性质相同的另一项政策,配之以包括通报批评、一票否决及财政惩罚等负面激励手段,然后,通过考察该实验县在两个不同阶段回应政策时的注意力、资源投入及其他的态度和行为情况,以进一步了解两种相反的激励手段的作用机制、效果及适用条件。此外,在更基层的治理实践中,在社会不稳定情境(如城乡资源分配矛盾、征地拆迁纠纷等)中,基层治理行动者,如村/居干部、辅警、网格员等,往往是影响冲突升级还是缓和的关键角色。为了探究不同管理策略对基层行动者决策行为的影响,也可以通过设计田野实验,探究基层行动者在不稳定情景中的行动策略偏好。
在政策落地和执行的研究中,已有的研究探讨了“共谋”[50]“任务、资源及其匹配性”[51]“自由裁量权”[52]“多目标竞争”[53]等因素对基层政府有效治理的影响。政府部门的政策目标实现过程往往受到多重因素、多元主体和多层过程的交织作用。为了更好地推动政策的有效执行,有必要对执行环节中具体的影响因素进行更精准的识别。例如,不同层级政府对同一政策的态度差异,不同区域情境下政策的权威性,以及政策本身的性质特征,都会在不同程度上影响执行者的态度与行为。例如,通过与交通部门合作,在进行城市交通管理议题的政策制定时,探究内外动机对减少电动自行车的违法行为的差异,从而为城市交通管理政策制定提供依据。由于我国不同城市的发展定位各异,其管理制度现状与城市特征也存在差异,因此还能进一步与城市管理制度、城市发展定位与电动车管理改进方式进行匹配和田野实验,以便各地能够结合自身治理特点,出台更具针对性和适用性的管理政策。
在政策评价研究中,已有的研究探讨了政策有效性与作用机制、典型治理[54]、“试点成功与失败”[55]、组织学习以及政策扩散[56]等议题。通过把田野实验方法引入“试点”政策评估中,可以推进“何种情景有效,对谁有效,为什么有效”的政策评估。并通过先在小范围开展,在评估政策成功之后逐步扩大应用范围,从而减少行政和组织资源的浪费,提升公共政策质量,实现知识和影响的双重跨越[57]。田野实验方法不仅能用于如何使“试点”政策更具科学性和普适性,也能够应用于评估和探索导致“试点”失败的关键因素,为组织学习和政策迭代升级提供基于因果关系的洞见。“试点”政策的实施过程中,失败并非单纯的偶然现象,而往往是由于多种内生性因素的交织作用。[58]田野实验方法能够帮助我们识别特定情境下导致“试点”失效或失败的系统性因素,捕捉到不同干预措施的反馈机制并对其效用进行更精准的评估。当我们追求更大的实验的外部效度时,可以通过预实验识别差异过大的内生性因素对“试点”效果的影响[59],在田野实验设计和统计过程中减少内生性因素对“试点”政策评估的影响,从而确保实现“试点”政策评估到优化扩散的目的。
五、结语
田野实验方法凭借其在真实情境下识别因果关系的独特优势,已经在国际公共管理与政治学研究中成为重要工具。然而,在我国的政府与政治研究领域,田野实验的应用仍处于起步阶段,其潜力尚未被充分挖掘。田野实验虽然对研究人员的方法驾驭能力提出了较高要求,需要在实验设计、数据收集和干预操作中保持严格的科学性和规范性,还要求研究者具备对理论问题的敏锐洞察以及对研究对象的深刻理解,但这一“高门槛”并非遥不可及。通过系统化的学术训练和方法论积累,研究者完全有可能通过巧妙应用田野实验,超越传统研究方法的边界限制,在保证实验内部效度的同时,有效提升研究结果的信度与可重复性,推动中国政府与政治领域研究的方法论建设,也有助于构建更为科学、透明、可验证的知识体系。
此外,破解我国区域发展不均衡与社会治理不充分的深层矛盾,既需要立足国情,又必须运用科学的方法论。[60]田野实验方法的独特价值正在于它能够以规范化的实验设计深度嵌入中国治理实践,贯穿政策的决策制定、政策执行与评估全过程,从而生成既扎根中国经验、又具备普遍解释力的理论成果,更好地为中国治理实践提供科学依据,推动国家治理体系和治理能力现代化。
参考文献
[1]Bourdieu P,Wacquant L J D.An Invitation to Reflexive Sociology[M].Chicago:The University of Chicago Press,1992:94-114.
[2]Strauss A L,Corbin J M.Basics of Qualitative Research:Techniques and Procedures for Developing Grounded Theory[M].2nd ed.Thousand Oaks:Sage Publications,1998:3-25.
[3]Gerber A S,Green D P.The Effects of Canvassing,Telephone Calls,and Direct Mail on Voter Turnout:A Field Experiment[J].American Political Science Review,2000(3):653-663.
[4]Gerber A S,Gimpel J G,Green D P,et al.How Large and Long-lasting Are the Persuasive Effects of Televised Campaign Ads? Results from a Randomized Field Experiment[J].American Political Science Review,2011(1):135-150.
[5]Broockman D E.Black Politicians Are More Intrinsically Motivated to Advance Blacks' Interests:A Field Experiment Manipulating Political Incentives:Black Politicians' Intrinsic Motivation to Advance Blacks' Interests[J].American Journal of Political Science,2013(3):521-536.
[6]Garbiras-Díaz N,Montenegro M.All Eyes on Them:A Field Experiment on Citizen Oversight and Electoral Integrity[J].American Economic Review,2022(8):2631-2668.
[7]Pruett L,Dyzenhaus A,Karim S,et al.Election Violence Prevention During Democratic Transitions:A Field Experiment with Youth and Police in Liberia[J].Journal of Peace Research,2025(2)262-277.
[8]Druckman J N,Green D P,Kuklinski J H,et al.The Growth and Development of Experimental Research in Political Science[J].American Political Science Review,2006(4):9.
[9]Banerjee A V,Duflo E.An Introduction to the “Handbook of Field Experiments”[M].Handbook of Economic Field Experiments Vol.1.Amsterdam:Elsevier,2017:1-24.
[10]Mills C W.The Sociological Imagination[M].New York:Oxford University Press,1959:6.
[11]Glaser B G.Theoretical Sensitivity:Advances in the Methodology of Grounded Theory[M].Mill Valley,Calif.:Sociology Press,1978:1-17.
[12]McDermott R.Experimental Methods in Political Science[J].Annual Review of Political Science,2002(1):31-61.
[13]Blom-Hansen J,Morton R,Serritzlew S.Experiments in Public Management Research[J].International Public Management Journal,2015(2):151-170.
[14]Harrison G W,List J A.Field Experiments[J].Journal of Economic Literature,2004(4):1009-1055.
[15]Habyarimana J,Humphreys M,Posner D N,et al.Why Does Ethnic Diversity Undermine Public Goods Provision?[J].The American Political Science Review,2007(4):709-725.
[16]Chin M L,Bond J R,Geva N.A Foot in the Door:An Experimental Study of PAC and Constituency Effects on Access[J].The Journal of Politics,2000(2):534-549.
[17]Phillips T.Ethics of Field Experiments[J].Annual Review of Political Science,2021(1):277-300.
[18]Kinder D,Mendelberg T,Dawson M,et al.‘Benign Neglect and Racial Codewords in the 1988 Presidential Campaign[C].Annual Meeting of the American Political Science Association,Atlanta:.1989.
[19]Mendelberg T.Executing Hortons:Racial Crime in the 1988 Presidential Campaign[J].Public Opinion Quarterly,1997(1):134-157.
[20]Cheema A,Khan S,Liaqat A,et al.Canvassing the Gatekeepers:A Field Experiment to Increase Women Voters' Turnout in Pakistan[J].American Political Science Review,2023(1):1-21.
[21]Karpowitz C F,Monson J Q,Preece J R.How to Elect More Women:Gender and Candidate Success in a Field Experiment[J].American Journal of Political Science,2017(4):927-943.
[22]Herrnson P S,Hanmer M J,Koh H Y.Mobilization Around New Convenience Voting Methods:A Field Experiment to Encourage Voting by Mail with a Downloadable Ballot and Early Voting[J].Political Behavior,2019(4):871-895.
[23]Hopkins D J,Meredith M,Chainani A,et al.Results From A 2020 Field Experiment Encouraging Voting by Mail[J].Proceedings of the National Academy of Sciences,2021(4):1-3.
[24]Arceneaux K,Kousser T,Mullin M.Get Out the Vote-by-Mail? A Randomized Field Experiment Testing the Effect of Mobilization in Traditional and Vote-by-Mail Precincts[J].Political Research Quarterly,2012(4):882-894.
[25]Pianzola J,Trechsel A H,Vassil K,et al.The Impact of Personalized Information on Vote Intention:Evidence from a Randomized Field Experiment[J].The Journal of Politics,2019(3):833-847.
[26]Munzert S,Barberá P,Guess A,et al.Do Online Voter Guides Empower Citizens?[J].Public Opinion Quarterly,2021(3):675-698.
[27]Pereira Dos Santos J,Tavares J,Vicente P C.Can ATMs Get Out the Vote? Evidence from a Nationwide Field Experiment[J].European Economic Review,2021(134):103691.
[28]Butler D M,Broockman D E.Do Politicians Racially Discriminate Against Constituents? A Field Experiment on State Legislators:Do Politicians Racially Discriminate?[J].American Journal of Political Science,2011(3):463-477.
[29]Olken B A.Direct Democracy and Local Public Goods:Evidence from a Field Experiment in Indonesia[J].American Political Science Review,2010(2):243-267.
[30]Beath A,Christia F,Enikolopov R.Empowering Women through Development Aid:Evidence from a Field Experiment in Afghanistan[J].American Political Science Review,2013(3):540-557.
[31]Björkman M,Svensson J.Power to the People:Evidence from a Randomized Field Experiment on Community-Based Monitoring in Uganda[J].Quarterly Journal of Economics,2009(2):735-769.
[32]Fearon J D,Humphreys M,Weinstein J M.How Does Development Assistance Affect Collective Action Capacity? Results from a Field Experiment in Post-Conflict Liberia[J].The American Political Science Review,2015(3):450-469.
[33]Buntaine M T,Hunnicutt P,Komakech P.The Challenges of Using Citizen Reporting to Improve Public Services:A Field Experiment on Solid Waste Services in Uganda[J].Journal of Public Administration Research and Theory,2021(1):108-127.
[34]Olken B A.Monitoring Corruption:Evidence from a Field Experiment in Indonesia[J].Journal of Political Economy,2007(2):200-249.
[35]Chong A,De La O A L,Karlan D,et al.Does Corruption Information Inspire the Fight or Quash the Hope? A Field Experiment in Mexico on Voter Turnout,Choice,and Party Identification[J].The Journal of Politics,2015(1):55-71.
[36]Gottlieb J.Greater Expectations:A Field Experiment to Improve Accountability in Mali[J].American Journal of Political Science,2016(1):143-157.
[37]陈那波.公共行政学研究方法应用前沿及其中国借鉴[J].公共行政评论,2015(4):69-77.
[38]蒙克,李朔严.公共管理研究中的案例方法:一个误区和两种传承[J].中国行政管理,2019(9):89-94.
[39]马骏.公共行政学的想象力[J].中国社会科学评价,2015(1):17-35.
[40]徐明,陈斯洁.基层社区治理的精细化向度——基于7省市68个社区的实地调查[J].江西社会科学,2024(11):120-130,208.
[41]陈振明.政府治理变革的技术基础——大数据与智能化时代的政府改革述评[J].行政论坛,2015(6):1-9.
[42]翁茜,李栋.在线实地实验研究进展[J].经济学动态,2020(5):132-145.
[43]Chen J,Pan J,Xu Y.Sources of Authoritarian Responsiveness:A Field Experiment in China:Sources of Authorian Responsiveness[J].American Journal of Political Science,2016(2):383-400.
[44]习近平.高举中国特色社会主义伟大旗帜 为全面建设社会主义现代化国家而团结奋斗——在中国共产党第二十次全国代表大会上的报告(2022年10月16日)[N].人民日报,2022-10-26(1).
[45]梅赐琪,汪笑男,廖露,等.政策试点的特征:基于《人民日报》1992-2003年试点报道的研究[J].公共行政评论,2015(3):8-24.
[46]练宏.注意力分配——基于跨学科视角的理论述评[J].社会学研究,2015(4):215-241.
[47]周黎安.中国地方官员的晋升锦标赛模式研究[J].经济研究,2007(7):36-50.
[48]周雪光.论中国官僚体制中的非正式制度[J].清华社会科学,2019(1):7-42.
[49]周雪光,李贞.组织规章制度与组织决策[J].北京大学教育评论,2010(3):2-23.
[50]周雪光.基层政府间的“共谋现象”——一个政府行为的制度逻辑[J].开放时代,2009(12):40-55.
[51]陈那波,李伟.把“管理”带回政治——任务、资源与街道办网格化政策推行的案例比较[J].社会学研究,2020(4):194-217.
[52]陈那波,卢施羽.场域转换中的默契互动——中国“城管”的自由裁量行为及其逻辑[J].管理世界,2013(10):62-80.
[53]练宏.游走在程序与效率之间:地方政府的多重规则运作研究[J].社会,2023(6):181-208.
[54]许中波.典型治理:一种政府治理机制的结构与逻辑[J].甘肃行政学院学报,2019(5):61-73.
[55]杨宏山,高涵.政策试验的两种逻辑与组织模式[J].中国行政管理,2022(9):60-66.
[56]马亮.公共服务创新的扩散:中国城市公共自行车计划的实证分析[J].公共行政评论,2015(3):51-78.
[57]李文钊,徐文.基于因果推理的政策评估:一个实验与准实验设计的统一框架[J].管理世界,2022(12)104-123.
[58]陈那波,蔡荣.“试点”何以失败?——A市生活垃圾“计量收费”政策试行过程研究[J].社会学研究,2017(2):174-198.
[59]刘军强,胡国鹏,李振.试点与实验:社会实验法及其对试点机制的启示[J].政治学研究,2018(4):103-116.
[60]贺雪峰.论城乡差异[J].文化与传播.2024(1):74-80.