升维思考的四种方式
用统计思维、互动思维、混沌思维、复杂思维帮你做对工作、生活和学习决策
献给洛维萨
这本书里包含的所有有意义的东西都是你的功劳,
剩下的一切都由我负责。
序言 升维思考的四种方式
我们都会情不自禁地做一件事情——思考。
每时每刻,我们的大脑总是思绪不断。它有时指导我们,有时鼓励我们,有时告诉我们还可以做得更好。它分析我们过去的行为,告诉我们未来该做什么。它不断尝试着理解我们周围的世界。
但我们很少思考我们的思维方式。我们不会分析哪些思维过程是正确的,而哪些会误导我们。很多时候,我们没有思考怎样才能更好地塑造我们的思维方式。
我们总是关注如何照料好自己的身体这样的问题,并且不遗余力地达到这样的目标。为此,我们会去健身房或者控制自己的饮食。我们总是想提升身体的健康水平,并且为自己找到动力。我们认为工作时需要劳逸结合,还希望能减轻生活中的压力。
但我们很少停下来花些时间审视一下周围,问问自己我们对生活的态度是否有意义。
科学和数学的本质在很大程度上就是寻找更好的推理方法。但在观看宇宙起源、自然世界奇观或人类大脑及身体结构的纪录片时,我们很容易忽略这一点。从表面上看,科学关心的是事实。但这个说法是不对的,事实并非如此。对包括我在内的许多科学家来说,我们的首要任务是塑造自己的思维方式,让它带领我们接近真理。别人揭示的事实对我们来说则是次要的。
这本书讨论了升维思考的四种方式,它们可以帮助我们接近真理。
这四种方式的起源可以追溯到天才神童、杰出的理论物理学家斯蒂芬·沃尔弗拉姆在1984年写的一篇文章。当时,24岁的沃尔弗拉姆正在研究一种被称为元胞自动机的深奥的数学模型。他在全新的Sun工作站上模拟运行了这些自动机,并对它们产生的模式进行了系统的分类。他认为每一个过程——无论是生物过程还是物理过程,个人过程还是社会过程,自然过程还是人为过程——都可以归类于他在计算机模拟中观察到的四种行为中的一种。我们的所见所闻和行为可以分为四种类型:(1)平稳行为;(2)周期行为;(3)混沌行为;(4)复杂行为。
平稳系统是指会达到并保持平衡的系统。想想一块接一块排列的多米诺骨牌。轻推一下第一块骨牌,它们就会依次倒下,在地面上排成一条线,进入稳定状态。类似的例子还有:从山上滚下来停在山谷里的球,用杵臼研磨而成的稳定的香料混合物,走了很长一段路后安静睡觉的狗。
周期系统是指会表现出重复模式的系统。走路、骑自行车和骑马分别是我们的脚、自行车轮子和马腿做的周期性运动。保持均匀间隔涌向海滩的波浪,厨师将蔬菜切成大小相等的小块时菜刀的快速上下运动,我们日常生活中不断重复的早餐、工作、午餐、工作、晚餐、看电视、睡觉等活动,都呈现出周期性的特点。
混沌系统意味着无法预测,例如,明天是否会下雨(至少在英国是无法预测的),掷色子、抛硬币的结果,轮盘赌的旋转,煮意大利面时水分子在沸腾的锅中随机振动和旋转时冒出的气泡,以及在推拉门开合之间与某人的邂逅。
复杂系统在社会上随处可见,例如,在世界各地流通的货物和服务,文明的兴衰,政府和大型跨国组织的结构。复杂系统在离家更近的地方也能看到,例如,在与亲朋好友的交往中,我们有可能同时感受到爱和痛苦。复杂系统还存在于我们的身体内部,例如,大脑中数十亿神经元的放电过程。此外,你的个人经历,你到目前为止的成长过程,同样呈现出复杂性。
有时,我们的行为会让我们在不同类型间游离不定。以分歧和讨论为例。我必须承认,我是那种凡事都要刨根问底,一门心思追求“正确”答案的人。如果我觉得我不理解某个问题,或者有人采取了与我不一致的立场,那么我通常会一探究竟,直至问题的答案水落石出。
但我对争辩的热爱有时会给我带来一些问题,比如和生活及工作中与我打交道的人发生不快,因为他们不希望浪费时间去细究每件事的来龙去脉(这是可以理解的)。
因此,为了减少无意义的争论,我利用沃尔弗拉姆的理论来证明,只有两种争论是有价值的:达成稳定解决方案的第一类争论,和讨论重要新思想但可能永远不会得出结论的第四类争论。至于在同一个争论点上纠缠不休的第二类争论,以及你一言我一语、混乱不堪的第三类争论,我们应该尽量避免。
有了这种分类,就更容易确定我参与的是哪一类争论。然后,我会考虑如何把第二类争论转换成第一类,或者把第三类争论转换成第四类。我也会考虑如何使我参与的第一类争论更快地趋于稳定,就像超级高效的杵臼那样迅速“研磨”出真相。
注意,以这种方式思考会改变你的视角,使你跳脱活动本身,自上而下俯视这些活动。沃尔弗拉姆的分类可以让我们统揽全局,思考如何应对各种各样的挑战。
2002年,沃尔弗拉姆发表了他的著作《一种新科学》,在元胞自动机模型的基础上提出了一种科学方法。这本书(重5.6磅5.6磅约合2.5千克。——译者注,厚达1 192页)涉及的理论非常广泛,它大胆地宣称,元胞自动机研究是通往深层次理解生物性生命、物理宇宙以及几乎所有其他事物的一条途径。但是,在如何利用元胞自动机真正深入地了解我们这个真实而复杂的世界的问题上,沃尔弗拉姆没有给出具体的建议。
缺乏适用的洞见导致沃尔弗拉姆的研究始终没有得到科学界的认真对待,他的思想也没有进入公众的意识和视野。我在维基百科上搜索沃尔弗拉姆的研究时,找到了一个专门讨论元胞自动机的数学特性的网页。沃尔弗拉姆的分类仍然很抽象,没有与现实联系到一起。
而我现在要做的正是沃尔弗拉姆没有做的,即展示如何利用他提出的四种方式来塑造和明确我们对世界的看法。它们一点儿也不抽象。事实上,它们在日常生活中非常有用。我的方法不像沃尔弗拉姆所说的那样是一种新科学,而更像一种说服你的朋友和你一起慢跑的新方法,一种与伙伴讨论争议问题的新方法,或者一种抑制巧克力蛋糕成瘾的新方法。它会帮助我们理解为什么我们会在聚会上受冷落,甚至会让你看清自己作为一个独特复杂的个体的本质。
为了让你了解这些更实用的新思维方式,我在本书中用四章展开讨论了沃尔弗拉姆的分类法。
在我看来,第一类思维是统计思维。你什么时候应该相信那些数字,什么时候则应该持怀疑态度?更重要的是,你应该如何解读科学研究在饮食、锻炼、幸福、成功等方面给出的建议?虽然数据和统计是理解整个人类社会的关键,但我要告诉你,对你个人来说,它们似乎都没有我们以为的那样重要。
那么,我们怎样才能在生活中找到更大的成就感呢?这个问题将引出第二类思维,即互动思维:揭开人类社会的秘密。如何使团队更有凝聚力?如何改变沟通方式以消弭分歧?我将解释如何更好地理解我们自身的行为对他人的影响,以及当别人对我们不友好时应如何处理我们的感受。改善人际关系比你想象的要容易。
不过,这里有一个陷阱需要注意。我们越是努力地控制自己的生活,生活就会越不可预测。在一个不可能掌控一切的世界里,如果无法让事情回到正轨,往往就会造成混乱无序的随机结果。第三类思维,即混沌思维,能帮助你决定什么时候应该掌控全局,而什么时候应该放手。
问题越复杂,就越难解决。但是,说某个事物很复杂意味着什么呢?我的答案是,一个系统的复杂程度取决于描述它最少需要多少文字。学会用简洁明了的语言概括我们面对的社交场合、担心的问题和头脑中的想法,就能抓住它们的本质。与主要解决日常问题的前三类思维不同,第四类思维,即复杂思维,更侧重于内省和自我反思,其主要目标是了解之前发生的事,通过它们更好地了解我们自己以及周围的人。
从第一类到第四类的演变再现了过去100年来科学思维的发展历程,能帮助我们了解在这个过程中起到了重要作用的一些科学英雄(和反英雄)的思想。它不仅能帮助我们进入自己的内心世界,还能引导我们走出去,去了解我们共同创造的外部世界。它把我们从做普通事务时遇到的平凡问题中解脱出来,转而去考虑一个深刻的问题:是什么造就了我们?
现在,让我们和一个年轻的博士生一起,踏上这趟发现之旅吧。
2002年,沃尔弗拉姆发表了他的著作《一种新科学》,在元胞自动机模型的基础上提出了一种科学方法。这本书(重5.6磅[1],厚达1 192页)涉及的理论非常广泛,它大胆地宣称,元胞自动机研究是通往深层次理解生物性生命、物理宇宙以及几乎所有其他事物的一条途径。但是,在如何利用元胞自动机真正深入地了解我们这个真实而复杂的世界的问题上,沃尔弗拉姆没有给出具体的建议。5.6磅约合2.5千克。——译者注
导言 开启一段旅程
我走下灰狗长途巴士,迎接我的是新墨西哥州的炎炎烈日。这一年是1997年,我23岁,这是我第一次来美国。入选美国圣达菲研究所的复杂系统暑期学校项目非常困难,但我的博士导师的推荐信为我争得了一席之地。我的导师曾参加过该研究所的一次研究会议,与会的都是一些知名人士,仅受邀人士才有资格参加。他告诉我,圣达菲研究所把物理学、经济学、生物学和数学等领域的精英召集到一起,目的是寻找理解复杂系统的统一方法——把他们各自领域的研究结合起来并回答基本问题。这将是一门新科学。
暑期学校的目标是将快速积累的知识传递给下一代。在接下来的4周时间里,这些博士生和年轻的研究人员会被安置在离研究所不远的一所小型文理学院的宿舍里。每天上午都要上课,下午在圣达菲研究人员的监督下联合做项目。到了晚上,来自世界各地不同学术背景的学生会在一起交流。
“你会度过一段美妙的时光,”导师告诉我,“一定要多多交流,兼收并蓄。一开始,你也许会觉得其他人都比你知道得多,但他们知道的往往没有他们表现出来的那么多。所以,不要担心自己会问出愚蠢的问题。你永远不知道你会得到什么答案。”
去研究所的路不太好找,等我赶到那儿时已经迟到了,科研协调人埃里卡·珍正在滔滔不绝地说着什么。我走到阶梯教室的后面,找了个座位坐下来。
“我们的目标是教你一种不同的思维方式,”她对满教室睁大眼睛的学生说,“但要做到这一点,我们需要涉猎很多领域。在过去的100年里,科研方式发生了巨大的变化。我们希望你们去了解这段历史,还希望你们能学到一种在其他地方学不到的方法。”
她说,课程将从基础知识开始,我们会学习处理数据并得出可靠的统计结论的方法。然后,我们将研究一些相互作用,例如捕食者对生态系统内部平衡的影响,我们大脑中的神经元相互传递信号的原理,乃至人类社会随时间推移发生的变化。接下来,我们将了解混沌和随机性。为什么很难知道未来会发生什么?最后,她说,我们将探讨的最重要的问题是:什么是复杂性?当我们说我们生活在一个复杂的社会或文化中时,我们指的是什么?
她告诉我们,圣达菲的研究人员正在试图给大脑建立一个数学模型,以便模拟我们的社会互动。他们在努力研究生物性生命的基本变迁过程。这里的科学家都非常优秀,已经在各自的学术领域证明了自己(其中许多人获得了诺贝尔奖),现在他们聚集在一起,就是为了创造科学思维的未来。
“这4周将是一次复杂性探寻之旅,将永远改变你的思维方式。”
第1章 统计思维
一群聪明的年轻人
在珍博士做完介绍后,我们来到了宿舍。接下来的4周,我们都会住在这里。
当我来到我的房间时,我的新室友鲁珀特已经在整理物品了。他把床搬到了房间左边靠近窗户的位置,在唯一一张桌子上整整齐齐地码放了一堆科学论文和手写笔记。
鲁珀特说,他正在牛津大学攻读经济学博士学位。在发现我是英国人后,鲁珀特大胆地猜测:“我想这就是他们让我们共处一室的原因。”
“如果能和哈佛大学的那些聪明的年轻人一起住就好了,真的,可以拓宽一下自己的视野……”他笑着说,“但你也行……”
鲁珀特也是被他的导师安排来这里的,但他收到的指示不同。导师告诉他要“了解那边的研究进展”,同时注意不能让自己陷进去。这很符合他的风格,因为他对“复杂系统这类废话”的兴趣不大,显然不打算在这些问题上浪费太多时间。他的目的很简单,就是去听课和学习基本知识。到了下午,他会在房间里学习。他说,这就是他需要那张桌子的原因。如果我不介意,他希望我最好不要打扰他。
他对珍博士的介绍似乎不太感兴趣。“典型的美国式推销,天花乱坠的宣传就是他们的一贯伎俩。”
鲁珀特似乎也不太热衷与其他学生交流或向他们学习,他只会与少数人交流。他说:“这里有各个领域的研究人员,有生物学家、历史学家、社会学家等,甚至可能还有哲学家。初来乍到,谁知道呢……”
“‘复杂系统’这个概念会让他们特别兴奋。”他一边说,一边用手指给自己说的话加上了引号,“我的意思是,这对他们来说有点儿像暑假,不是吗?就是一个外出度假的机会。”
“但是,”他提醒我,“你和我都要保持头脑清醒。”
鲁珀特告诉我,他担心许多参与者可能没有像我们一样接受过严格的专业训练,他们的基础知识都有所欠缺。因此,我们的工作就是启发他们。对于鲁珀特,与其说来这里是提出问题的(就像我的导师告诉我的那样),不如说是以柔和的方式让我们接受教育的。
他说:“我们在这里代表着某种东西。我们能够理解数据,还会使用数据。但我敢打赌很多同学连基本的统计学知识都不懂。”
说完,他在书桌前坐了下来,开始翻阅他的那些文章。谈话显然结束了。
我走出宿舍,去找参加暑期学校项目的其他人。他们肯定不会都像鲁珀特那样。
我很快发现走廊里站着一位美国理论物理学家,他自我介绍说他叫马克斯。我问他是否知道最近的酒吧在哪里,希望他能带我去。
马克斯告诉我,酒吧在美国被称为“bar”,也经常被称为运动酒吧。他知道一个非常棒的酒吧,也很乐意陪我一起去。
我们在酒吧里坐下后,马克斯说,美国人需要持续的刺激,同时指了指我们周围墙上的那一排电视屏幕。他们不能一次只做一两件事(比如喝啤酒和聊天),他们还要看篮球或足球比赛,而且要在每场比赛前播放震耳欲聋的音乐,电视屏幕上还要显示球员的统计数据。我告诉马克斯,英国的酒吧里通常没有电视,即使有,通常也是关着的。
马克斯说:“这只是时间问题,最终你们也会这样。”他说,美国社会的演变可以用不断增加的熵来建模。
马克斯问道:“我想你肯定非常了解熵吧?”没等我回答,他就接着说:“这是美国研究人员在战后发明的一种处理和理解信息的方法,现在我们正在用我们的技术向大众提供信息。”他露出了洞悉一切的笑容。
我报以一个局促不安的微笑,心中暗想,我必须加深对熵的了解,越早越好。
事实证明,马克斯不只是知道运动酒吧和熵,而是什么都知道。他在普林斯顿大学获得了博士学位,现在是斯坦福大学统计物理学博士后研究员。我告诉他,鲁珀特对即将开始的课程缺乏热情。马克斯说鲁珀特才是那个需要接受教育的人。他说,牛津大学和剑桥大学还停留在过去,并不了解混沌和非线性(以及一些我不确定的术语)的重要性。他接着说道,牛津大学和剑桥大学确实做了一些有价值的基础研究,但他们太保守了。他们为现代研究确立了受理论科学界认可的地位。
他接着说,这就是圣达菲研究所的地位如此重要的原因。确切地说,并不是所有最杰出的研究都是在这里完成的(主要是在普林斯顿大学和斯坦福大学完成的),但圣达菲是一个交汇点。他罗列了一些名字:菲利普·安德森、默里·盖尔曼、肯尼斯·阿罗、布莱恩·阿瑟、克里斯·朗顿和斯蒂芬·沃尔弗拉姆。他们中有一半人获得过诺贝尔奖,另一半人则被认为是特立独行的天才。他们都来过这里,欧洲人开始注意到这一点了。“鲁珀特很快也会知道。”马克斯说。
此时,我们这张桌子边已经坐满了暑期学校项目的学生们。
坐在桌子另一端的巴西生态学家安东尼奥主导了谈话,他用很快的语速谈论着他的物种形成和生态位新理论。最后,澳大利亚生物学家玛德琳建议在座的每个人适当地做下自我介绍,她显然已经听够了安东尼奥的演讲。
我们按座位顺序一一做自我介绍。安静地坐在玛德琳旁边的是来自法国的哲学系学生扎米亚,她试图将雅克·德里达的后现代主义作品与路德维希·维特根斯坦的著作联系起来。坐在她旁边的是来自奥地利的亚历克斯,他刚刚请大家喝了杯啤酒。亚历克斯告诉我们他正在研究化学反应中的混沌。瑞典计算机科学家埃丝特说,她正在着手研究万维网的网络结构。我听不懂他们的研究,也不知道德里达或维特根斯坦是谁,但我笑着告诉他们,我是一名应用数学家,致力于用我的数学知识去解决实际问题。
在其他人介绍了各自的研究兴趣之后,玛德琳操着浓重的澳大利亚口音笑着说:“嗯,你们的研究听起来很有趣,但我研究的才是最重要的问题:蚂蚁是如何构建足迹网络(trail networks)的。这是最复杂的系统!”
听她这样说,安东尼奥再一次开腔,他对玛德琳说蚂蚁是一个非常重要的物种。啤酒与他们的话及体育比赛的解说,在我的脑海中搅作一团,我一边努力思考马克斯和其他人说的话,一边体会自己身处圣达菲的感受。
鲁珀特是对的:这群人的教育背景和从事的学科非常复杂。他们不是我在大学课堂上经常遇到的那些书呆子气的数学家,而是来自世界各地的哲学、生物学、化学、物理学、经济学和计算机科学领域中最聪明的博士生。
我想不出还有其他什么地方是我更愿意去的。
平均数还是中位数?
下面让我们作别20世纪90年代的圣达菲,来到今天的伦敦。
伦敦4月的一个阴天,气温15℃,下着小雨。伦敦上班族的平均通勤时间是42分钟,平均收入约为4万英镑。晚上回到家,他们会平均花183分钟看电视(少于2011年的242分钟)。大约51%的伦敦人每天会使用不止一次社交媒体,2%的人会根据建议每天吃5种蔬菜,64%的人每周会喝酒。他们中的异性恋夫妇通常每周做爱一次,平均时间为7.6分钟。男同性恋者的性生活频率略高,每周1.5次,而女同性恋者的相关数据很难找到。这些伦敦人的平均寿命为80岁,每个家庭生1.6个孩子。如果问及他们对生活的满意度(所有事情都考虑在内),并从1到10打分,他们给出的平均分是6.94分。
我可以轻松地罗列好几页的统计数据,提供关于伦敦人口或世界各地居民的研究结果,因为英国国家统计局、数据世界网、Gapminder网站、世界银行、各国人口普查局、皮尤社交媒体报告、盖洛普咨询公司、经合组织发布的经济透视、《全球幸福指数报告》及无数的大学研究,都会调查记录我们的健康状况、福利、幸福感和行为。从所有这些数据中发现的统计关系,不仅能为政府、企业和其他组织的决策提供信息,还会影响个人的决策。对于生活的各个方面,包括应该吃什么、多久锻炼一次、怎样从生活中获得最大的满足感、如何为考试做好充分准备,我们几乎都会遵循科学研究给出的建议。
当把统计思维应用于我们自己的生活时,我们面临的挑战不仅是需要知道我们能用数据证明什么,还要清楚我们不能证明什么。在众多的科学研究中,哪些是真正适用于我们的?我们看到的统计数据是否揭示了因果关系,还是只是偶然相关?我们应该在多大程度上允许统计数据影响我们对世界的理解?什么时候我们应该忽略数字,转而使用其他工具?
在回答这些问题之前,我们需要先快速了解一下统计学的基础知识,因为统计数据有时会被滥用,只有在了解了统计数据的使用方法之后,我们才会变得更加审慎。
在开启我们的旅程之前,考虑一下为什么我只是列出了伦敦的一些平均数,就能让大多数人感受到一个城市及其居民的基本情况,包括天气、通勤、工资、生活方式选择、性生活等。每个数字都反映了伦敦生活整体印象的一个方面。平均数是最基本、最有力的统计数据,可以告诉我们一个城市的真实情况。
统计数据还会透露小型群体的情况。在本书中,我将以10个住在伦敦的朋友的生活为例,来阐明不同的思维方式。这10个人完全是虚构的,但在介绍他们的时候,我不会描述他们的长相,也不会说他们从事何种工作,而是在下面的表格中提供了关于他们的一些统计数据(同样是虚构的)。
如果用文字介绍这些人物,我可能会这样写:“妮娅会在去伦敦市中心上班的路上买一杯燕麦奶拿铁,她的助手在10点的时候还会再给她提供一杯拿铁”,“詹妮弗一直不停地学习,为了维持学习她还从事兼职工作。在她看来,一边看网飞电视剧一边吃腌黄瓜是一种奢侈”。数字不如文字生动,但令人惊讶的是,它们也能让我们对一个人产生一种印象。我们可以想象他们的工作、他们的生活方式和他们对腌制食品口味的特殊偏好。
这些数字还透露了这个群体的很多信息。他们的平均年龄是:
理查德、约翰、妮娅和安东尼的年龄稍大,而贝琪、詹妮弗和查理的年龄稍小。但他们(基本上)都出生于20世纪90年代初,因此我们可以认为他们是千禧一代。
在比较收入时,我们通常会使用中位数,而不是平均值。计算中位数的方法是先按升序写出所有收入:
1.2万英镑,2.2万英镑,2.3万英镑,3.1万英镑,3.4万英镑,
3.6万英镑,4万英镑,5.2万英镑,6.2万英镑,10.6万英镑
可以看到排在中间的两个数字分别是3.4万英镑和3.6万英镑,取它们的平均值,得出该群体年收入的中位数是3.5万英镑。这个数字略低于整个伦敦的收入中位数,但考虑到该群体中的大多数人还处于职业生涯的早期阶段,我们认为他们还是比较富裕的。虽然他们中的一些人现在还没有能力买房,但他们都不是穷人。我们可能会想,年薪1.2万英镑的安东尼每天如何喝得起一杯拿铁?但我没有提到另一件事:安东尼娶了收入最高的妮娅。总的来说,这些朋友生活无忧,他们面前有很多机会。为便于理解这段文字及其他地方包含的数学知识,我创建了一门在线课程,更详细地介绍平均数、中位数和比例等概念,参见https://www.fourways.readthedocs.io/。
关于何时使用中位数而何时使用平均数,并没有硬性规定(统计学家说的“平均”指的是平均数,而不是中位数)。在说到朋友的年龄时,使用平均数最合理,因为年龄的变化非常小。就收入而言,中位数更有意义,因为妮娅10.6万英镑的年收入将使平均数向上偏移。据《福布斯》杂志报道,伦敦有63人的财产多达10亿英镑。如果计算收入水平时把这些超级富豪包含在内,得出的平均数就会远远大于中位数(大城市的收入平均数通常比中位数高出25%~50%),这会让其他人感觉自己更穷。因此,该使用平均数还是中位数取决于我们想要通过数据强调什么。使用中位数可以让我们忽略为数不多的亿万富翁。
每周喝的燕麦奶拿铁杯数是最能体现平均数和中位数之间差异的一个特殊例子:中位数是0(大多数人不喝这种饮料),而平均数是3.9。在总结这些人的整体特点时,我们需要同时使用平均数和中位数,说他们不喜欢喝拿铁或说他们每周喝接近4杯拿铁都是错误的!
平均数和中位数之间的区别说明,可以正确描述数据的统计方法通常不止一种。但这是否意味着在使用数字时任何方法都行得通呢?
并非如此,统计实践是有好坏之分的。但是,我们如何确定将10个朋友的年龄先加起来再除以10这种计算平均年龄的做法是一种好的统计实践呢?我使用的是我们所有人在学校里都学过的方法,但为什么它是正确的呢?针对我们衡量世界的基本方式提出这类批判性的问题,就是统计思维的关键。
让我们按照这个批判性思路,仔细观察关于这个群体是否喜欢吃腌黄瓜这个问题的数据。“是”和“否”这两个答案可以分别表示为1和0。让我们把他们的回答重新整理一下,用1表示“喜欢”,用0表示“不喜欢”。
利用这些数据估算千禧一代伦敦人喜欢吃腌黄瓜的比例,最准确的答案是什么?
直觉告诉我们,正确答案是4/10,即40%。取上表中所有1和0的平均数,就会得到这个答案:
我们怎么知道这个答案是正确的呢?假设有些朋友反对使用平均数,并且提出了一些公认的非常不可靠的理由。例如,安东尼说,我们应该给最先被问到的那些人给出的回答赋予更大的权重,因为“他们给出的是初始数据”。他将前5个数相加,2+0+2+0+2=6,再将后5个数相加,0+0+1+0+0=1,最后估算出这个比例是(6+1)/15=7/15。
听到安东尼给出的理由,阿伊莎反驳说,最好只问5个人而忽略其他人。她只看了偶数序号的人的回答,并发现在这些人中,只有一个人(约翰)喜欢吃腌黄瓜,于是她得出结论,这个比例是1/5。最后,查理说:“嘿,伙计们,让我们听听第一个人的回答,然后把它作为正确答案吧。这样我们就不用再争吵了。”
查理宣布:“安东尼喜欢吃腌黄瓜,这说明所有人都喜欢吃腌黄瓜!”
贝琪举手投降:“在是否喜欢吃腌黄瓜这个问题上,我已经糊涂了。查理说了一种意见,安东尼和阿伊莎又说了各自的意见,这让我很困惑。我们还是搁置争议吧,因为我们根本不可能知道人们是否喜欢吃腌黄瓜。”
贝琪错了。她说朋友们应该停止争吵,这是对的,但她认为根据我们收集到的数据无法判断人们是否喜欢吃腌黄瓜,这是错的。一群朋友有不同的意见,并不意味着他们的观点都有同样的价值。
但难点在于,如何让贝琪、安东尼、阿伊莎和查理接受只有一种方法可以正确测算喜欢吃腌黄瓜的人的比例——40%。我们知道朋友们的理由不可靠,但我们如何证明这个比例是最准确的估算结果呢?
要解决这个难题,我们需要回溯过去,找到第一个意识到需要确定最佳测量方法的人。
一个可能的答案
想象一个电影场景。摄影机从上向下拍摄大学校园里的一个四方院子,字幕显示“英国剑桥大学,1912年”。镜头一路向下,从一扇窗户进入烟雾弥漫的学生宿舍。罗恩独自坐在书桌前,房间里乱成一团,桌子和地板上到处是乱七八糟的纸张和书本。罗恩显然已经有一段时间没有换洗衣服了。他一边奋笔疾书,一边抽着烟斗,偶尔停下来翻翻书本。
离考试只有两个星期了。罗恩即将面对的是“三足凳”考试的最后一个部分,它不仅是英国也是全世界最难的考试之一。罗恩以第一名的成绩从中学毕业,现在在剑桥大学也是本科生中的尖子。他的名字很快就会被记录在剑桥大学的“牛仔”名单上,这是被授予一等学位、数学成绩特别优秀的学生才能享有的荣誉。
虽然罗恩乐于向别人炫耀自己的数学能力,也敢于承认自己是一个天才,但他对即将到来的考试并不太感兴趣。事实上,他甚至没有为这次考试做什么准备。他思考的是更崇高的事情。他周围的那些纸张并不是复习笔记,而是科学论文,其中有数学论文,比如卡尔·弗里德里希·高斯和托马斯·贝叶斯的论文,也有生物学论文。查尔斯·达尔文的《物种起源》摊开放在桌子上,地板上的手写笔记粗略记录了通过育种和人工选择“改良”动物(包括人类)的原理。
罗恩还没有为他正在研究的问题想出一个专有名称,它还只是一个模糊的观念。罗恩认为,他一定可以从生物学和社会中的那些错误方法里找出唯一正确的估算数量的方法。他认为所有人,包括他的教授,都搞错了。
要领会罗恩的研究方法,可以再想想上文中关于腌黄瓜的争论。
1912年,罗恩只要一睁开眼就会思考一个问题:利用数据进行测算的最佳方法是什么?(腌黄瓜问题是这个更大问题的一个特例。)一个数学家,尤其是剑桥大学的“牛仔”,一定要弄清楚为什么他们采用的计算方法是最佳方法。
罗恩是这样阐述他的理由的。先假设我们不知道人们对腌黄瓜问题回答“是”的确切比例,但我们可以确定它的值在0到100%之间。然后,他会让安东尼(认为这个比例是7/15)、阿伊莎(认为这个比例是1/5)、查理(认为100%的人都喜欢吃腌黄瓜)根据腌黄瓜偏好的数据,计算他们的观点是正确的可能性。
让我们首先考虑阿伊莎的观点,即人们喜欢吃腌黄瓜的概率是1/5,也就是20%。如果她是正确的,那么我们得到查理回答正确的可能性是1/5,因为他说他喜欢吃腌黄瓜。同样,再假设80%的人和阿伊莎一样不喜欢吃腌黄瓜,那么苏琪回答正确的可能性是4/5。现在,我们可以用如下方法表示每个人回答正确的可能性:
得到所有这些回答的组合概率,就是得到所有回答的正确可能性的乘积:
显然,这个概率非常小,因为它表示的是我们得到一组特定答案的概率。它并不能证明阿伊莎是错的,因为得到任何一组特定答案的概率肯定都非常小。这个计算的意义在于,它使我们可以比较阿伊莎回答正确的可能性与其他人回答正确的可能性。
为便于理解,我们先比较阿伊莎的估计值为正确的可能性与查理的估计值为正确的可能性。查理声称100%的人都喜欢吃腌黄瓜,他回答正确的可能性是:
1×0×1×0×0×0×0×1×0×0=0
根据他给出的比例,我们得到这组答案的可能性为零。在阿伊莎回答问题的那一刻,查理就被证明是错的。所以,阿伊莎赢得了这一局。安东尼估计的比例是7/15,他回答正确的可能性是:
安东尼回答错误的可能性低于阿伊莎,因为0.001 09大于0.000 419。但它们都比不上正确的估算结果(4/10),后者的可能性是:
比较有了结果!40%的可能性最大,因此我们应该采用这个估计值。
时间回到1912年,镜头终于停了下来,落在罗恩的肩膀上方,聚焦于他在纸上奋笔疾书的那些数学符号。他抬起头来,从烟斗里喷出一大口烟。“就是它了!”他叫道,“最大似然。”
100多年前的那个下午,那个剑桥学生看到了在他之前没有人见过的东西,就连高斯、拉普拉斯和贝叶斯这样伟大的数学家也没有见过。这个结果与他的同学们在隔壁房间里争论的数学结果大不相同。他们的计算虽然很有意思,但与现实世界的观察结果脱节了。罗恩努力寻找的目标正是现实和数学之间的联系,而他写下的方程式最终实现了这个目标。最大似然告诉我们如何正确地测量一切事物,包括政党的民意调查、植物生长的速度,以及我们对腌黄瓜和其他腌制食品的偏好程度等。
此后,罗恩(全名是罗纳德·费希尔)又花了12年的时间才完成了这个理论(统计学至今仍在使用的最大似然估计方法),并给它起了一个名字。费希尔是一个真实存在的人。虽然我不确定他是不是像我在上文中描述的那样提出这套理论的,但我们知道他的研究成果来自他在本科阶段最后一年写的一篇文章。费希尔在那篇文章中指出,计算最大似然估计是唯一正确的测量方法,不仅可以测量平均值(就像我们在上文中所做的那样),还可以测量与数据拟合的任意曲线的形状。
后来,费希尔的研究被视为统计学的基石。
统计学的力量
圣达菲暑期项目第一周的主讲教授是应用统计学家埃利娜·罗德里格斯。在周一的课上,她说她的任务是向我们展示如何在实践中最有效地利用数据。她通过实例告诉我们,如何估计人们身高的平均值和标准差,如何衡量统计关系的强度,比如吸烟和喉癌之间的关系。这和我的预期不太一样,因为埃里卡·珍的介绍强调了创新思想的重要性,而罗德里格斯则希望我们掌握基础知识。
第二天,在她的课结束后,我和那位瑞典计算机科学家埃丝特坐在一起吃午饭。
与其他人相比,埃丝特在这群人中显得有点儿超然,学术水平似乎高出其他所有人。她刚刚在帕克教授的指导下完成了她的硕士研究项目。按照暑期项目的计划,帕克教授会担任第二周的主讲教授。他在普林斯顿高等研究院工作,因为具有创造性的思想和善于运用数学模型去理解现实世界中的系统而闻名。
埃丝特说,她的硕士研究项目分析了在互联网快速发展的背景下人与人之间的关系。帕克认为,互联网的发展方式和人类大脑的结构之间可能存在着深层次的相似性,因此他试图分析这两个复杂系统各自表现出的基本相互作用。在我看来,跟我们上午从罗德里格斯教授那里听到的统计数字相比,这些东西更能激发人们的兴趣。
我们当天没来得及讨论细节,所以,为了做进一步的了解,我在第二天午餐时又去找了埃丝特。她和鲁珀特坐在一张桌子旁,离暑期项目的其他学生有点儿远。鲁珀特正在一张A4纸上做一些计算,每完成一步他都会做出解释。他说话的时候,埃丝特不时点头,偶尔还会用铅笔在纸上写些什么。
“他们在做什么?”我问马克斯和安东尼奥,他们俩坐在餐厅的另一张桌子旁。
“鲁珀特正在向埃丝特介绍他在经济学中使用的统计数据,教她如何避免最常见的错误、最大似然方法的原理、混淆相关性和因果关系的危险,诸如此类的东西……”马克斯说。
“她似乎很感兴趣。”我说。
“你是不是有点儿嫉妒你的英国老乡啊?”安东尼奥笑着说。
“没有。”我有点儿尴尬地回答道,“只不过我以为埃丝特已经掌握了那些东西。”
我告诉他们,埃丝特的硕士生导师是帕克教授,他擅长将纯粹的统计思维转向其他更深入的互动思维。所以,鲁珀特说的这些对埃丝特而言太简单了。
安东尼奥看着我。“这并不是说我们到了圣达菲就可以忘记统计学……”他说,精确测量在他自己的雨林动态研究中特别重要。就像其他人一样,他来这里是为了了解相互作用、混沌和复杂动态系统,他认为这些有助于解读生态系统的运转。但我们必须掌握基础知识,不能还没学会走路就先学跑。
“我还是觉得鲁珀特有点儿自以为是。”我说。
这不是重点,安东尼奥说。在很多情况下,衡量事物、做实验或看待问题都应该有一个正确的方法。“不管你怎么看鲁珀特,这一点都不会改变。”他说。
安东尼奥还想说些什么,但马克斯示意他闭嘴。
埃丝特站起来朝我们走来,鲁珀特紧随其后。她把他们写的那几张纸递过来,说道:“我觉得我搞明白了。”
埃丝特说,她以前也学过统计学,但她更多地把统计学看作一种检验假设的方法,比如一种药物是否有效,或者一种肥料能否帮助作物更快地生长,但现在她发现统计学可能有更大的作用。她接着说,随着收集的数据越来越多(万维网上的数据在日益增多),我们将在人类行为中发现越来越多的规律。自动处理这些统计数据将是理解人类和划分人群的关键。
鲁珀特站在她身后,面露笑容,他显然对这位新皈依者的到来感到高兴。
“课还没开始呢,你们俩似乎就已经把所有问题都解决了。”我说。
埃丝特笑着说:“我使用‘圣达菲方法’已经有一段时间了。重温一遍基础知识是件好事。”
在说到“圣达菲方法”时,埃丝特用手指打了个引号,就像鲁珀特第一天说到“复杂系统”时做的动作那样。看到她用那个手势,鲁珀特偷偷地笑了。
但我可以看出,与鲁珀特的封闭思想不同,埃丝特的思想是开放的。甚至在我们的课程正式开始之前,在发现鲁珀特这位牛津经济学专业的学生知道一些她不知道的东西后,她就准备向他学习了。现在,这些知识变成了她手里那张A4纸上的一行行字迹。她甚至已经开始思考如何运用她刚刚学到的那些知识了。
我的博士生导师一直在谈论的就是这种态度:把名头放在一边,谦虚地追求我们不知道的东西。