这本书也可以命名为“这才是科学”。讲述了科学分析的一些原理和方法,搭配生动的例子,读来毫不枯燥。 本年度最值得读的书之一。

书摘:

心理学和世俗智慧:“常识”的误区

人们爱用一些民间谚语来解释行为事件,即使之前在解释同一类型的事件时曾用过与之完全矛盾的谚语。例如,我们中的大多数人都听到或说过“三思而后 行”一一若不是我依稀记得之前有人告诚说“该出手时就出手”,我还会觉得这是个有用的、直接的行为建议呢! “小别胜新婚”明确预测了一种对于事件的情绪反应,但“眼不见,心不烦”不也同样如此吗? 如果“欲速则不达”,那为什么有时我们又听到“时不我待”? 既然“三个臭皮匠,顶个诸葛亮”,为什么又说“三个和尚没水吃”? 如果我认为“行走江湖,安全第一”,为什么也相信“不入虎穴焉得虎子”? 如果“异性相吸”,为什么又“物以类聚”? 我劝许多学生“今日事今日毕”,但我希望没跟我刚刚指导过的那个学生说过这番话,因为我刚还跟他说“要顺其自然”。这类谚语和俗话构成了对行为的固有“解释”,人们爱用它们就是因为它们难以驳倒。不管发生什么事,可以拿一条出来解释一番。难怪我们都认为自己是判断他人行为和人格的高手。天底下发生的事我们都能解释。世俗智慧的可鄙之处就在于,它们压根不承担被驳倒的风险。

考虑另一个常见的世俗观念 一一 “孩子会给父母带来幸福”。如果我们考虑退休后孩子会带来的好处,这个陈述在一定程度上可能是对的。人们回首往昔时,的确会发现孩子带来的幸福。问题在于,人们常常混淆回忆的观点和对真实事件的体验。从有孩子的例子看,两个观点是十分不同的。在年老时,觉得有个孩子确实令人开心。但是,就连续性、继时性的快乐(与追潮性的回忆相反)来说,孩子实际上让人的快乐减少。现在有一系列文献采用所谓“经验取样法”( experience-sample)观察人们在不同时刻的幸福程度研究发现了一系列的趋势,例如结婚会增加幸福感。同时还发现,父母的幸福感会随着第一个孩子的降生降低。当第一个孩子成年时,幸福程度回弹一些,但随后又降低得更多。只有当最小的孩子离家自立后,婚姻幸福感才回归到没有孩子时的水平。

简言之,当世俗观念“孩子给父母带来幸福”接受科学检验时,情况就变得复杂起来。只有从回溯性的角度看,当孩子终于离开家时,我们可以品味将孩子抚养成人的成就感时,“孩子带来幸福”才是正确的。但这与这个世俗观念通常所表述的意思大相径庭。它通常指抚养孩子会让你立刻或在近期感到幸福。这就是世俗观念的惊人谬误之处。

为什么见证叙述毫无价值:安慰剂效应

几乎每种产生于医学和心理学的疗法都有一定数量的支持者,并且总能催生出一些发自内心认可其疗效的人。医学文献记载了猪牙齿、鳄鱼粪便、埃及木乃伊的粉末,以及很多更富想象力的东西都曾经具有疗效。事实上,人们早已熟知,仅仅暗示正在接受某种治疗,就足以使许多人感觉病情好转。

无论治疗是否有效,人们都会报告某种疗法曾对他们有所帮助,这种倾向被称为安慰剂效应。

康奈尔大学的心理学家托马斯·吉洛维奇(Thomas Gilovich, 1991)指出:“人类拥有如此容易自愈的身体,即使医生不做任何事情,很多寻求医学帮助的人也将体验到积极的疗效。如此一来,当自然康复的比率很高的时候,即使是毫无价值的治疗手段也能显得有效。” 简而言之,无论干预的效果如何,只要运用治疗干预,潜在的安慰剂效应就会显现。问题在于,安慰剂效应是如此强大,以至于无论某个人使用的疗法多么荒唐,只要是被应用于一大群人的话,总有一些人会乐于为它的效果作出见证(清晨头部击打疗法,每天使用让你神清气爽!给我寄10.95美元,你就可以得到这个特制的、经过医学测试的橡胶锤)。

“鲜活性”问题

因此,人们倾向于利用更容易获得的、能够用来解决问题或做出决策的信息。对可获得性造成强烈影响的一个因素,就是信息的鲜活性。问题在于,再没有比发自内心的个人见证更鲜活、更引人注目的了,这都是一些已经发生的事或者是真实的事。个人见证的鲜活性常常令其他一些更可靠的信息黯然失色。

一个很著名的关于人们如何对鲜活的轶事信息作出不同反应的例子,来自于在20世纪60年代中后期媒体对越战的报道。随着战事的拖延,美军的死亡人数仿佛无休止地增加,媒体开始报道当周美军死亡的人数。一周接一周地过去了,这个数字在200至300之间徘徊,公众似乎已对这种报道习以为常了。

然而,某杂志用几个版面的篇幅连续刊登了前一周阵亡者的个人照片。这时,公众非常具体地看到了在这样一个有代表性的一周内逝去的大约250个鲜活的生命。结果,此举导致了大规模的、针对这场代价巨大的战争的抗议声浪。250张照片所产生的影响是每周数字报道所远不能及的。但是作为一个社会成员,我们应该克服这种不相信数字、必须眼见为实的倾向。绝大多数影响我们社会的复杂因素都只有靠数字才能捕捉。只有当公众学会像重视图像材料一样重视以数字形式表达的抽象材料时,公众自己的立场才不会像屏幕上闪过的最新图像那样变化无常。

巴纳姆效应

兰迪的生物节律和占星术小把戏,其实是一种被命名为巴纳姆效应(Barnum, 著名的嘉年华和马戏团的团主,提出了“每分钟都会有人上当受骗”的说法)现象的范例。这一效应曾被心理学家广泛地研究。研究者发现,大多数成年人都会认为泛化的个性总结都是准确的,并且都是对自己独特的描述。这里有一个来自谢尔默的例子:

你是一个非常体贴的人,总是及时地帮助别人。但是也有一些时候,你会发现你有一点点自私……有时候你太忠于自己的感受以至于会暴露过多的自己。你善于思考,并且对任何事情,在改变想法之前都希望看到证据。如果你处在一个陌生的环境下,你会非常小心,直到你看清楚发生了什么事情,然后才会充满信心地行动……你知道怎样做一个好朋友,你懂得训练自己,所以在别人看来,都在你的一切掌控之中,但其实有些时候你是缺少安全感的。你希望在人际关系中比现在更受欢迎,更加自如。你面对世界表现得很有智慧,这种智慧来源于艰难的体验而非书本学习。

大多数人都发现,这个总结是对其个性非常准确的概括,但是很少有人自发地意识到大多数其他人也同样认为它描述了他们自己!许多众所周知的语句和措辞(如这个例子)使很多人认为适用于他们自己。谁都能够将其作为一个个人化的心理“分析”提供给“顾客”,而这些顾客常常会为个人化的“性格解读”的“准确性”而感到震惊,却不知道其实每个人的解读都是一样的。

见证为伪科学打开方便之门

由于见证叙述可以为任何主张提供唾手可得的支持,以及自身所具备的冲击力,见证打开了通往伪科学的大门。对于心理学信息的消费者来说,对它们保持警惕应当是头等大事。

2007年,美国联邦交易委员会(FTC)对通过电视宣传和名人代言销售减肥药物的四个商家处于了数百万美元的罚金。在宣布罚款时,FTC女主席狄波拉·普拉特·梅杰拉斯试图教育大众道:“美国人需要明白,个人见证不能代替科学。” 下面就让我们看看由关节炎基金会出版、曾被美国众议院老龄化问题委员会所引述的一套识别不道德药品推销员的指南。

  1. 他或许会提供一种用于治疗关节炎的“特别的”或“秘密的”处方或设备。
  2. 他会做广告,用的都是“个案史”和“满意患者”的见证。
  3. 他或许会承诺(或者暗示)能够快速或轻松见效。
  4. 他也许会声称知道关节炎的成因,并且说能够“清除”你体内的“毒素”,同时促进你的健康。他或许会说外科手的。
  5. 他或许会指责“医学体制”故意阻碍了进步,或者迫害了他……但是他不允许他的方法以已有的或已获证明的方法来验证。

第三变量问题和选择性偏差

两个变量之间仅仅存在相关,并不能保证一个变量的变化就会导致另一个的变化,关键就在于相关并不意味着因果关系;在第三变量问题里,两个变量之间的相关并不意味着它们之间存在直接因果路径,因为相关的产生可能是由于这两个变量或许都与未被测量的第三变量有关。

选择性偏差”这个术语指的是特定主体和环境变量之间的关系,当不同生理、行为、心理特点的人们选择不同类型的环境时,就有可能出现选择性偏差。选择性偏差造成环境特征和行为 — 生物特征之间的虚假相关。

规则很简单:提防选择性偏差的发生;当只有相关时,应避免因果推论。

比较、控制和操纵

科学思维最重要的特点很容易掌握,那就是科学思维所基于的理念是比较、控制和操纵。 因此一个好的实验设计应该是这样的,科学家能够操纵它感兴趣的变量,并对其他可能影响实验的无关变量进行控制。

故事:聪明的汉斯 汉斯的例子很好地揭示了仔细区分“对现象的描述”和“对现象的解释”是何等重要。这匹马能够正确敲出训练员呈现给它的数学问题的答案,这是毋庸置疑的,训练员也没有撒谎,而且许多观察者也都证明了这匹马能够做到这一点。问题出现在下一步:即推论这匹马能敲出正确答案是因为它具有数学能力。推断马具有数学能力只是这一现象的一种“假设的解释”。从“马能敲出正确答案”就得出“马具有数学能力”的结论是不符合逻辑的。别忘了,马具有数学能力只是针对马的表现的诸多解释中的一种,而这种解释是可以通过实证方法来检验的。当放在这样一种实验情境下,这个解释就被证伪了。

实验方法的核心就是操纵与控制,这就是为什么实验比相关研究能够作出更强的因果推断。在相关研究中,研究者仅仅观察两个变量的自然变动是否显示某种联系,而在真实验中,研究者要对被假设为原因的变量进行操纵,通过实验控制和随机分配来保持其他所有变量不变,然后再来看这个假设变量是否会产生影响。这种方法排除了相关研究中出现的第三变量的问题。第三变量出现的原因是,在自然情境下,很多不同的事物都是相互联系的。实验方法就是用来分开考察这些自然存在的关联。它之所以能实现这一目的,是因为它以操纵一个变量(被假设是原因的变量)的方式分离出该变量,并保持其他所有变量不变。但是,为了区分这些自然的关联,科学家们经常要创设自然世界里不会出现的特殊条件。

聚合性证据的重要性

警惕这些口号:飞跃、前所未有、新理论 科学中的概念变化遵从关联性原则。就是说,一个新的科学理论,必须与先前已确立的实证事实建立关联。新的科学理论不仅仅要解释新的事实,还要兼容旧的事实,这样才会被认为是一个真正的理论进步。新的理论可以以一种迥然不同的方式来解释旧的证据,但是它必须能解释得通。这些要求保证了科学在原有的基础上持续进步。除非理论解释效力的范围被拓宽了,否则真正的进步是不会发生的。如果一个新的理论解释了一些新的现象,但是没有解释大部分旧的事实,那它将不会被认为是对于旧的理论的超越,因此不会立即取代那些旧理论。 科学工作的不确定性是大部分公众所意识不到的。科学实验很少能完全确定某个问题或支持某一理论,从而排除其他理论。新的理论也很少能够全面超越所有先前存在的相互竞争的概念体系。很多问题的确定并不像科学电影里所描绘的那样,由一个关键实验所决定,而是要等到科学界逐渐开始有了共识,认为支持某种理论的证据比支持其他任何理论的证据要有力得多。

科学共识

尤其是在社会急切关注的领域,切记,这些问题的答案只能在大量不同研究结果实现融合之后缓慢地出现。用一个简单原理来总结:在评估心理学的实证证据时,心中要想的是“科学共识”,而不是“重大突破”;是“渐进整合”,而不是“大步飞跃”。

聚合性证据原则描述了心理学上研究结果是如何被整合的:没有一个实验是可以一锤定音的,但是每一个实验至少都能帮助我们排除一些可能的解释,并让我们在接近真理的道路上向前迈进。多种不同方法的使用让心理学家更为确信,他们的研究结果是建立在稳固的实证基础上的。最后,当概念上的变化发生时,它必须遵循关联性原则:新的理论不仅要能解释新的科学数据,还必须能解释已有的数据。

打破“神奇子弹”的神话:多重原因的问题

任何一个特定行为都不是由某个单独的变量引起,而是由许多不同的变量共同决定的。认定变量A和行为B之间存在显著的因果关系,并不意味着变量A就是引起行为B的唯一因素。 但人们常常忘记行为是由多重原因决定的,他们似乎要去寻找那颗所谓的“神奇子弹”——即他们感兴趣的、造成行为的唯一原因。 和本书中谈到的许多其他原则一样,具备原因多样性的观念非常重要。一方面,它提醒我们不要过于依赖单一的原因解释。因为这个世界盘根错节,影响行为的因素也多样而复杂。虽然我们可以证明某一变量引起了某一行为,但并不代表已经发现了影响该行为的唯一原因,甚至是最重要的原因。 考察行为的原因时,要依照多样性的原则来思考。不要陷入误区,认为某一特定行为只是由某一特殊原因造成。大部分复杂的行为都是由多重原因所决定的。各种各样的因素共同起作用才导致了某种行为出现。有时多个因素联合在一起时会产生交互作用。也就是说,变量共同作用时的整体效应,会和其单独作用时获得的效应完全不同。

人类认知的阿喀琉斯之踵:概率推理

2008年夏天,广受欢迎的58岁政治播音员蒂姆·拉瑟特(Tim Russert)死于心脏病,这给美国人在医学的概率性知识方面上了悲伤的一课。拉瑟特服用胆固醇药片和阿司匹林,骑运动自行车,每年都进行压力测试,但是他仍死于心脏病(Grady, 2008)。他对健康极为关注,这让很多《纽约时报》的读者写信说一定是医生遗漏了什么。这些读者不明白医学知识也是概率性的。每个失败的预测并不是错误。事实上,他的医生没有遗漏任何事。他们最大限度地应用好自己的概率性知识,但这不意味他们能预测每例心脏病。科学作家丹尼斯·格雷迪(Denise Grady, 2008)告诉我们,根据拉瑟特先生最后一次压力测试和其他状态的诊断,医生根据一个广泛使用的公式估计拉瑟特在十年内罹患心脏病的概率为5%。这意味着和拉瑟特先生相似的人中,100人中有95人十年内都不会得心脏病。拉瑟特先生恰恰是那不幸的5个人中的一个。概率性的医学科学不能提前告诉我们谁是那不幸的5个人。

我们经常看到下面这样的场景:一个不吸烟的人引用吸烟导致肺癌的统计数据,试图说服一个瘾君子戒烟,所得到的结果仅仅是对方的反唇相讥:“嘿,走远点儿!你看那个铺子里的老乔,他从16岁开始,每天要吸三包骆驼烟!现在他已经81岁了,看上去还很硬朗!”人们对此可能作出的推断显而易见——就是这一个特例已经推翻了吸烟和肺癌之间的关系。

令人吃惊和沮丧的是,这种反驳手段屡试不爽。通常情况是,每当个别个案被用来证明概率趋势是无效的时候,很多人都常常点头表示赞同,这反映出他们没有正确理解统计规律的本质。如果人们认为一个特例就可以让一个规律失效,他们一定认为这个规律应该在任何情况下都适用。

社会越复杂,人们就越需要概率思维。如果一个普通人想要对其生活的社会有一个基本的理解,那么,他至少应具备统计思维这一最基本的能力。

有关样本量的一个非常有用的原则:样本越小,产生极端值的可能性就越大。 许多人无法理解到他们所处的情境都涉及样本量。也就是说,他们很难认识到他们处理的是样本,而不是全部实体。无法意识到这一点会导致忽略这样一个事实:样本测量受到取样误差的影响。例如,你的医师给你验血,从你身上取走的血是一个样本,并且对它而不是你整个血液系统进行检验。假设这个样本代表了你的整个血液系统,但是假设是概率性的,并且只是或多或少是真实的。这其中会产生一些误差,由于测试不能测试全部的血液系统,因此样本中的细胞以及成分性质必定会和绝对真实有所偏离。简言之,你的医师是基于你很小的血液样本而作出了有关你血液全部成分的推断。 在不同领域中进行证据评估时需要遵守的一条基本原则,就是认识到样本规模对信息可信度的影响,这对于理解行为科学的研究结果尤为重要。

偶然性事件

这个关于财经预测的例子的延伸,证明了原本纯粹随机的事件会因怎样的逻辑而看起来像是由可以预测的因素造成的。假想你收到一封信,信中告诉你有这样一份关于股票市场预测的信息。这个信息并不收费,只是要求你试试照着他们的建议去买股票,然后看看它的预测灵不灵。它告诉你IBM股票会在下个月攀升。你把这份资料随手一扔,但是你确实注意到在下一个月里IBM股票果真涨了。如果你曾读过一本与本书的内容类似的书,你会觉得这是稀松平常的事情,仅会将其视为一次侥幸的猜中。后来,你又收到另一份来自同一家投资咨询公司的信息,该信息说IBM股票会在下个月下跌,当股票确实跌了的时候,你仍将其视为侥幸,但是这一次你可能就有点儿好奇了。当这家公司寄来第三份资料,预测IBM下个月会再次下跌时,你发现自己对这几页财经内容的关注度提高了。继而你发现该信息又一次作出了准确预测,IBM这个月确实又下跌了。当来自这家公司的第四份资料说IBM下月会涨,而且也确实涨了时,你难免会觉得这个信息真还挺神,从而情不自禁地想花29.95美元去订一年这本如此有价值的资料。这种诱惑难以抵挡,除非你能想象这样的场景:此时在一个简陋的地下室里,某人正在准备下周要寄出的1600份资料,这些资料会按电话黄页上的1600个地址发出,其中800份预测IBM下月上涨,800份预测下跌。当IBM在下个月真的涨了,公司就继续把资料只发给上月接收到正确预测的800位“客户”(当然,其中还是400份预测涨,另外400份预测跌)。然后,你可以想象,这个“锅炉房”——可能还包括在背后煽风点火、辅助造势的电话营销骗子,正在向第二周接收到正确预测的400位客户发送第三个月的预测信息(还是200份预测涨,200份预测跌)。是的,你就是连续四次收到正确的随机预测信息的100个幸运儿之一!这100个“幸运儿”中的大多数会为了能继续收到信息而支付29.95美元。

现在看来,这就像是一个玩弄众人于股掌之上的可怕骗局。实际也是如此。而当那些“受人尊敬”的财经杂志或电视节目给你推荐“连续四年击败一半以上对手的股票经纪人”时,情况也好不到哪儿去。请回想一下猴子掷飞镖的场景,设想这些猴子是年年选股的股票经纪人。很明显,第一年他们之中有50%会击败他们的对手;第二年,这50%的人中又有一半——按随机水平来说——会击败其对手,即25%的经纪人能连续两年击败他们的对手。之后,第三年又有一半——随机水平——能击败对手,即总人数的12.5%连续三年击败对手。最终,到第四年,又会有这些人的一半(总人数的6.25%)能击败自己的对手。因此,100只猴子中大概有6只能取得像财经节目和报纸所说的“连续四年击败了其他的经纪人”骄人成绩的猴子。那么,这6只击败了一起掷飞镖的同伴的猴子(正如你所见,也击败了大多数现实生活中的华尔街经纪人)的确有资格在电视节目“华尔街一周”中亮相,你觉得呢?

试图去解释偶然事件的倾向可能源于我们深切地渴望相信自己是可以控制这些事件的。心理学家已经对所谓“控制错觉”(illusion of control)现象进行了研究,这一现象指的是人们有一种倾向,愿意相信个人能力可以影响偶然事件的结果。这一错觉广泛存在的证据来自于美国各州彩票发行的经验。这些州充斥着教人们如何“征服”彩票的伪科学书籍。这类书之所以畅销,是因为人们不懂得随机性的含义。

书籍信息: 作者:(加)基思·斯坦诺维奇 出版社:中国人民大学出版社 出版日期:2015-8-1 ISBN:978-7-300-21872-4