IBM SPSS数据分析与挖掘实战案例精粹

张文彤 钟云飞
前言 所谓艺术,就是指如果只靠系统地学习既有知识体系,但自身不具备相当的天赋,或者没有经过长期实践以积累经验和激发灵感,始终难以登堂入室成为大师的那些学科;音乐、舞蹈、绘画等就是如此。大英百科全书就把统计学定义为:一门收集数据、分析数据,并根据数据进行推断的艺术和科学。显然,作为一门应用学科,统计学非常强调实战能力。一名出色的统计师需要通过经历各种各样的实战分析项目来吸取经验、教训以便持续成长。光靠操作教科书上那些标准案例,他只能成为工匠,而不能成为大师。 近年来,随着计算机技术的飞速发展,统计工具出现了日新月异的变化,大大提高了其可用性。统计学和数据库技术、人工智能技术的融合,更是进一步催生了数据挖掘这个目前炙手可热,也更强调实战能力的领域。具体到SPSS系列产品,随着IBM的并购,原先的SPSS软件已经成为IBM SPSS Statistics,它定位于标准的统计分析需求,而更贴近企业用户的数据分析与挖掘的需求则由IBM SPSS Modeler来满足。分析工具的高度易用性和实战需求的同步发展,使得各行各业对统计分析和数据挖掘人员的需求呈现爆炸性增长,远远超过了正常培养周期能够提供的数量,而广大统计分析人员也迫切希望能够得到的是一本讲解提高实战操作技能的书,而不是单纯以介绍某一种统计软件为目的的参考书,以便帮助自己迅速提升实战能力。因此,笔者便有了编写这样一本书的打算。 笔者先后于2000年、2002年和2004年编写过三轮SPSS教程/参考书,均获得了读者的好评。作为在数据分析领域从业十余年的统计专业人员,本书的作者深知在漫长的经验积累阶段所需要付出的努力和汗水,更能体会到编写一本实战案例书的市场价值。虽然作者从业以来经手的分析案例有上千个,但很多优秀案例都因涉及相应公司的业务机密而无法和读者分享。而且案例的复杂程度和代表性也颇费思量,过于复杂会牵扯太多的具体业务细…