魔鬼统计学

[美] 伊恩·艾瑞斯
前言 超级数据分析师的崛起 奥利·阿森费尔特(Orley Ashenfelter)非常喜爱葡萄酒。“你只要把优质红酒放上一段时间,它就会发生一些非常神奇的事情。”阿森费尔特不仅对于葡萄酒的品鉴很着迷,而且希望知道优质葡萄酒和普通葡萄酒背后的推动力量。 “当你购买优质红酒时,”他说,“你是在进行一项投资,因为它未来很可能会变得愈发诱人。你希望知道的不是它现在的价值,而是它未来的价值,尽管你可能不会卖掉它或者喝掉它。你可以通过推迟品尝获得多少快乐呢?这是一个非常有趣的话题。”过去25年,这个话题占据了他的很大一部分时间。 阿森费尔特的日常工作是分析数字。他用统计量提取隐藏在大型数据集合中的信息。作为普林斯顿的经济学家,他曾考察同卵双胞胎的工资,以估计多上一年学所带来的影响。他曾考察限速差异,以估计各州对于统计寿命的重视情况。他曾在多年时间里担任美国顶级经济学期刊《美国经济评论》的编辑。 阿森费尔特个子很高,留着浓密的白色络腮胡子,他那洪亮而友好的嗓音往往会成为会场上的主旋律。他并不胆小。你可能认为数字分析师是一些懦弱而腼腆的人,但阿森费尔特会使你迅速消除这种成见。我曾见过阿森费尔特在教室里踱步,用和蔼而热情的语气阐述一篇研讨会论文背后的原理。当他以高度赞扬的语气开始他的评论时,你就要当心了。 阿森费尔特通过分析数字评价波尔多葡萄酒品质的做法使他遇上了很大的麻烦。他不是使用罗伯特·帕克(Robert Parker)等葡萄酒大师“痛饮和回味”的方法,而是用统计量寻找与拍卖价格高低相关的年份酒特征。 “这是显而易见的,”他说,“葡萄酒是农业产品,它会受到不同年份天气的极大影响。”根据法国波尔多地区数十年的天气数据,阿森费尔特发现,较少的收获期降水量和较高的平均夏季气温可以给人们带来品质最佳的葡萄酒。正如彼得·帕塞尔(Peter Passell)在《纽约时报》中所说,阿森费尔特的统计…