吴小安:辛普森悖论——逻辑径路和因果径路之争

选择字号:   本文共阅读 180 次 更新时间:2021-10-28 15:15:45

进入专题: 后门准则   可交换性   可坍塌性   因果性   辛普森悖论  

吴小安 (进入专栏)  

  

摘要:  有两种关于辛普森悖论的解释,逻辑-基础的解释和因果的解释。前一个解释为哲学家普拉桑塔·班德亚帕德耶(Prasanta S. Bandyopadhyay)所坚持,后一种解释为计算机科学家朱迪亚·珀尔(Judea  Pearl)所主张。班德亚帕德耶在他近几年的文章([1], [[2], [3] )中,强调有三个关于于辛普森悖论的问题需要得到充分的分析才能够说明这个悖论得到了解决:1. 辛普森悖论为什么是悖论;2. 辛普森悖论是在什么条件下产生的;3. 遇到辛普森悖论该如何做?第三个问题他服膺珀尔的方法,认为因果性只会在第三个问题有作用,但是前两个问题他认为珀尔的解释都错了,应该给予逻辑-基础的解释。在这一篇文章中,我试图证明哲学家班德亚帕德耶对珀尔前两个问题及相关因果解释的批评都是不正确的,且他自己的逻辑-基础的解释也可商榷。

  

   关键词: do-演算;后门准则;可交换性;可坍塌性;因果性

  

   Abstract: There are two kinds of accounts (logic-based and causal) of Simpson’s paradox. one from philosopher Bandyoapdhyay, the other from computer scientist Judea Pearl. In [1], [2], [3], Bandyoapdhyay tried to show that there are three questions associated with Simpson’s paradox that need adequate analysis: (i) Why is SP paradoxical? (ii) What conditions generate SP? (iii) How to proceed when confronted with SP? Developing a logic-based account of SP, he tried to argue that there are no causal factors at play in answering questions (i) and (ii). Causality enters only in the third question. Comparing with these two accounts, I prove that Bandyoapdhyay’s criticism of Pearl is not correct, his account of SP also faces many problems.

  

   Key Words: Do-calculus; Back-door criterion; Exchangeability; Collapsibility; Causality

  

   一、导论

   当我们做关于因果推断的时候会面临很多困难,辛普森悖论[2]是我们所面临困难的一个典型。什么是辛普森悖论呢?它指的是存在那样一种数据,在总体中所存在的统计关系在子总体中会发生反转。我们可以通过下面一个简单的玩具例子来说明[3]:我们假定一个大学只有历史系和地理系,这两个系招聘办公室工作作人员,五个男性申请历史系的职位,只有一个被录取,而八个女性申请,两个被录取,所以对于男性的成功率是 20%,而女性的成功率是 25%,所以历史性更偏爱女性; 而在地理系,8 个男性申请,6 个被录 取,五个女性申请,4 个被录取,男性的成功率是 75%,而女性的成功率是 80%,地理系的招聘也更加偏爱女性。但是从总体上来讲,一共有 13个男性,和 13 个女性申请职位,其中 7 个男性和 6 个女性录取,男性的录取率要高于女性的录取率

  

  

我们可以把上述的问题,用概率的语言表达如下:

  

   P (Y |X) > P (Y | ~X)

  

   P (Y |X, Z) < P (Y | ~X, Z)

  

   P (Y |X, ~Z) < P (Y | ~X, ~Z)

  

  

其中 Y 表示的是招聘结果: 录取,~Y 表示不被录取; X 表示男性,~X 女性; Z 表示的是院系: 历史 系,~Z 表示地理系。原本我们得到的结果是 P (Y |X) > P (Y | ~X),当然得出的结论就是在招聘过程中有歧视女性的现象,但是如果我们院系的因素考虑进来,P (Y |X, Z) < P (Y | ~X, Z) ,P (Y |X, ~Z) <P (Y | ~X, ~Z) ,则得到的结果恰恰相反:从每一个系的数据来看,在招聘过程中有歧视男性的现象。乍一看之下,似乎这只是一个算术的问题,只是因为应聘历史系的女性稍多,然后又职位太少不容易被录取,所以才导致了这样的一个反转。但是这样一种反转一旦裹上生活情境的外衣,就不再只是一个表面的算术问题,就变成了一个现实需要处理的问题:那些因素我们应该考虑,哪些不应该?举一个很现实紧迫的例子,我们测试某一种药物,总体上我们发现这种药物有助于某种疾病的康复,但是如果我们把样本的男性和女性分开来考察的时候却发现,这两个分开的子样本却说明这种药物无助于疾病的康复,于是如何是好?总体上测试说明药物有效,但是分开来,男性服用无效,女性服用也无效,那我们如果得了这种疾病到底是服用还是不服用这种药物呢?[4]所以辛普森悖论需要被解决的现实意义在于,它的出现造成了我们在实际决策的时候的困扰,使得我们无所适从。

  

   二、辛普森悖论的简介

   爱德华·辛普森(Edward H. Simpson)第一次在 1951 年的一篇技术的文章提到了这种现象([4]),尽管类似的现象早在 1899 年就已经被提及([5])。科林·布莱斯(Colin R. Blyth)([6])首次把这种反转现象冠以 “悖论” 的头衔。在珀尔之前,统计学家都认为辛普森悖论是一种统计学现象,可以在统计学的框架内得到解决。但是珀尔独持异议,认为辛普森悖论之所以产生是因为我们的因果考虑,而我们如果要解决这个悖论,需要理解数据背后的故事,即导致产生这样结果的因果机制。但是统计学家则认为因果性是一个没有得到好的定义的心灵构建,所以不可以从因果的角度来理解,辛普森悖论是一种能够被侦测,理解的统计现象,而且也可以通过统计分析的工具来规避这种悖论的出现([7])。但是却一直没有一个统计学的标准来警告研究者不要得出错误的言论,或者说明到底是聚合的数据还是分离的数据代表着正确的答案。

  

   但是在处理辛普森悖论问题所形成的共识是,统计的数据并不足以判定到底是聚合还是分离的数据更合理,真正遭遇到辛普森悖论需要做决策的时候,我们要考量的是 “数据背后的故事”。如何对这样一种额外的统计信息进行科学的刻画呢?丹尼斯·林德利(Dennis V. Lindley)和梅尔文·诺维卡(Melvin R. Novick)([9])倾向于通过 “可交换性”(exchangeability)来刻画这些信息,而珀尔则倾向于通过 “因果性” 来刻画。

  

   三、对珀尔解决路径的批评与回应

   这篇文章并不打算详细地探讨统计路径和因果路径的分歧和长短。而是聚焦在哲学家是如何理解和处理辛普森悖论的问题上。对于珀尔所提出来解决辛普森悖论的路径,哲学家没有提出任何不同的意见和方法,真正的分歧在于对于辛普森悖论本身的理解上:辛普森悖论何以为悖论?辛普森悖论是如何产生的?

  

  

1. 班德亚帕德耶的三个问题

   班德亚帕德耶的文章([1], [2], [3])主要就是针对这两个问题提出来的,而且批评在 2011年的文章班德亚帕德耶([1])中已经提出来了,很遗憾我们没有在珀尔([10])文章中对这篇文章有任何的提及和回应。但是两篇文章比较起来有很多针锋相对的地方,甚至在论证径路上都是出奇的一致(比如,都是试图回答班德亚帕德耶所提出的那三个问题)。我们来看看他们两个人对这三个问题的回答:

  

   1.1 辛普森悖论何以为悖论?

   探讨这个问题之前,我们需要弄明白的一个问题就是,一个悖论之为悖论的标准是什么?我们只有给出了一个标准,然后证明这个情况符合这个标准,所以我们才可以认为它是悖论。班德亚帕德耶([3], p.68)中所引述的蒯因的标准:“任何一个结论乍看之下荒诞无稽,但是细究起来居然还有论证可倚靠”。我自己觉得这个标准还是有些模糊,不足以作为我们倚靠来做判断的基础,我认为更可接受的说法是:“悖论是一个论述,尽管是从真前提出发且明显合理地推导出来的,却导致了自我矛盾或者逻辑上不可以接受的结论”。([11])

  

   1.1.1   班德亚帕德耶

   在班德亚帕德耶看来,辛普森悖论的产生是不经过反思而错误地使用可坍塌原则所致。

  

   定理1  (可坍塌原则(Collapsibility  Principle)(CP)).  我们称一个数据集是可坍塌的当且仅当

  

  

  

  

•  简单地说,可坍塌原则来就是在子总体中成立的变元关系在总体中也必然成立。

  

   •  CP 是非因果的数值推理原则,与任何的因果直觉无关。

  

(点击此处阅读下一页)

进入 吴小安 的专栏     进入专题: 后门准则   可交换性   可坍塌性   因果性   辛普森悖论  

本文责编:陈冬冬
发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 哲学 > 逻辑学
本文链接:http://www.aisixiang.com/data/129307.html

1 推荐

在方框中输入电子邮件地址,多个邮件之间用半角逗号(,)分隔。

爱思想(aisixiang.com)网站为公益纯学术网站,旨在推动学术繁荣、塑造社会精神。
凡本网首发及经作者授权但非首发的所有作品,版权归作者本人所有。网络转载请注明作者、出处并保持完整,纸媒转载请经本网或作者本人书面授权。
凡本网注明“来源:XXX(非爱思想网)”的作品,均转载自其它媒体,转载目的在于分享信息、助推思想传播,并不代表本网赞同其观点和对其真实性负责。若作者或版权人不愿被使用,请来函指出,本网即予改正。
Powered by aisixiang.com Copyright © 2022 by aisixiang.com All Rights Reserved 爱思想 京ICP备12007865号-1 京公网安备11010602120014号.
工业和信息化部备案管理系统