摆脱偏见,识破不合逻辑的统计学

郑渝川 | 2024-04-15
收藏

一个家庭连续死亡两个婴儿的概率应该是多大?1998年,英国律师萨莉·克拉克与丈夫双双被捕。

萨莉在1996年9月生下一个看上去非常健康的男婴,但孩子不到三个月就突然死了。当时萨莉与孩子在一起,声称孩子被放在床上不久后就失去了意识。

1997年,萨莉再次生下了一个早产数周的孩子。孩子在不到8周也去世了,情况与她的第一个孩子相似。而第二个婴儿在事后尸检中被发现有一些创伤的迹象。

在之后的法庭庭审中,儿科医生、利兹大学教授罗伊·梅多作为专家证人出席。梅多强调,出生于一个富裕的英国家庭的两个孩子,都死于婴儿猝死综合征的概率是大概7300万分之一。梅多有过一段流传很广的名言,“一个家庭中一个婴儿突然死亡是悲剧,两个婴儿死亡是可疑的,如果没有其他证据,三个婴儿死亡就是谋杀”。

所以,当时的英国媒体在法庭宣判之前,就已经给萨莉“定罪”,辱骂她是杀害亲生儿子的凶手。

在数年以后,对萨莉的指控和宣判都被推翻了。萨莉的丈夫在梳理控方记录时,发现给第二个孩子的医学检查结果作证的病理学家对陪审团隐瞒了关键证据,即孩子脑脊液细菌感染的检测结果是阳性。

而英国很多统计学家也指出,该案专家证人梅多错误地应用了概率。任何一个与萨莉一家相似的家庭中,一个孩子死于婴儿猝死综合征的概率是1/8543;所以,梅多将一个家庭两次发生婴儿猝死综合征死亡概率计算为1/8543的平方,也就是1/72982849。梅多显然缺乏统计学的基本素养,因为一个家庭中第二个孩子的死亡概率,不受第一个孩子死亡的条件假设的影响。

在萨莉讨回公道后,英国政府又组织了一次对所有类似案件的复审,结果查证有三个家庭的母亲也面临类似处境。而这些案件中,梅多都是专家证人。

梅多在这些案件中提出的观点“假设嫌疑人是无辜的,那么案件的事实就不太可能发生,因此,在案件已经发生的情况下,嫌疑人不太可能是无辜的”,被称为“检察官谬误”。

1968年,美国审理一起案件,涉及两个嫌疑人,被控抢劫。依据是他们与犯罪目击者给出的某些特征描绘相吻合:

凶手是一个留胡子的男人,依照美国人口中符合这一特征的人员占到总人口的1/4;

以下特征的概率分别是:金色头发女人,1/3;马尾辫女人,1/10;有胡子的非裔男人,1/10;车中的跨种族夫妇,1/1000;半黄的汽车,1/10。

在当时,美国的一位大学数学教师在庭审中作证认为,上述概率相乘,可以得出随机选择的一对夫妇符合所有给定特征的概率是1200万分之一。

伯努利谬误,是因为什么产生了谬误?    格致出版社近日引进出版了美国数学家、统计学家奥布里·克莱顿所著的《伯努利谬误:不合逻辑的统计学与现代科学的危机》一书。这本书提及的伯努利,是在数学发展历史上有过杰出贡献的17世纪数学家伯努利。伯努利引入了概率推算的思想,并设计了很多具有思辨性、开拓性的例题。

伯努利推断问题的策略,概括起来就是,如果样本足够大,样本中各要素的比例应当与总数中各要素的比例相符。比如,一堆白色鹅卵石和黑色鹅卵石相混杂,要评估其真实数量比例,按照伯努利的观点,我们只需要从中随机挑选一些,记录其颜色,然后按照记录得出大致的比重。

这里涉及到一个重大区别,我们可以认为,“样本比率以很高的概率接近真实比率”,这就是抽样概率的思想(经常被数学高手用在拉斯维加斯的赌场中),而伯努利的观点则是反过来的:“真实比率以很高的概率接近给定的样本比率”。

也就是说,伯努利窄化了人们用来估算、计算、判断真实数据的方法,认为仅用抽样概率就可以解决问题。

不幸的是,如《伯努利谬误:不合逻辑的统计学与现代科学的危机》书作者指出的那样,伯努利谬误深深地影响了近代以来的科学,构成了频率主义统计学的基础,使得很多人自觉或不自觉应用概率思维、统计思维来研判问题时,如前面两个案例所揭示的那样,导致非常离谱的推断。

事实上,哪怕到了当代,因为没有经过严格的逻辑学和统计学训练,很多学者都不自觉地受到伯努利谬误的影响,不小心“翻车”了:

——1988年,斯特拉克、马丁和斯特普进行的研究显示,强迫人们在牙齿间夹一支笔微笑,可以提高幸福感。这之后,全球各地的心理学家等学科的专家进行过反复验证,都未得出这一结论。

——1996年“社会启动”研究指出,参与者如果无意接触到与衰老、老年人有关的词汇时,离开实验室时走得更慢。这意味着,人们会不经意间接受对老年人行为的刻板印象。但科学家此后也未能验证这一结论。

——2010年发表的哈佛商学院教授艾米·卡迪推出的一项研究认为,如果我们保持一种强有力的姿势几分钟,就可以影响荷尔蒙水平和风险承受力。此后几年里,其他科学家、研究者经过比照验证,推翻了这一结论。

《伯努利谬误:不合逻辑的统计学与现代科学的危机》书中指出,一些重复的实验,比如抛硬币或掷骰子,确实会导致稳定的频率,因为这些频率实际上只是物理系统的属性,而且更重要的是,这类实验的前提是因为参与到人们对于硬币、骰子以及纸牌等有了大量详细了解的基础上,但是如果将这样的方法用于缺乏足够多先验假设的实验,就会出现频率主义者尴尬不已的误操作,从而使得概率超出预期。

伯努利谬误推导出的频率主义,在19世纪和20世纪初期曾被应用到社会政策领域,助推优生学及其相关的种族主义科学思想的出现。现实世界从来就不像抛硬币、掷骰子等游戏那样苍白,有着大量没有被研究者纳入考量的先验假设,从而使得相关的概率、统计分析走向了非常危险的地步,即为了社会秩序和人种健康,应当剥夺穷人和残疾人、少数族裔的生育资格。

所评图书:

图片14.png

书名:《伯努利谬误:不合逻辑的统计学与现代科学的危机》

作者:(美)奥布里·克莱顿

译者:陈代云

出版社:格致出版社

出版日期:2024年2月

(初审:戴佳运,复审:陈麟,终审:张维特)

所有评论({{total}}
查看更多评论
热点快讯
+86
{{btntext}}
我已阅读并同意《用户注册协议》
+86
{{btntext}}