探寻数据背后的逻辑:R语言数据挖掘之道

宋云生 张坚洪 黎新年
作者简介 宋云生,中山大学生命科学学院硕士毕业,混迹于医药商业、汽车制造等多个行业,先后从事市场研究、Bl(商业智能)、质量控制等多个领域的数据研究和落地应用,现主攻自然语言理解领域的实际应用。 张坚洪,华南农业大学数学与应用数学本科毕业,先后从事汽车、金融等行业,主要工作方向为数据仓库、数据挖掘在互联网金融领域的应用。 黎新年,中山大学生命利学学院博士毕业,主要研究方向为基因组的进化、群体演化和系统发育。 本书另有微信公众号,搜索“大音如霜”公众号,可以留言提问。如果觉得不方便,我们另外提供两个QQ讨论群(群1:105646151,群2:528749057),帮助读者解决各类相关问题。 序言 提纲挈领式心诀:一名数据挖掘工程师的成长之路 我的学习之路 不知不觉毕业两年多了,有一些大音如霜工作室的读者总想了解一下我是怎么学习数据挖掘、数据分析的,下面就综合大家常见的问题分享一下自己的经历、经验。 我不是学数学的,也不是学计算机的,研究生的专业是植物学,而且方向是植物分类,可以说很难和数据挖掘、市场研究等领域扯上关系。唯一能扯上关系的也就是我的舍友是做生物信息学研究的。 说一句丢人的话,在读本科时上的SPSS课我都不知道在讲什么。那时没考过计算机等级考试,原因是我每分钟打汉字的速度都不过关,讲这么多,只是为了告诉读者,我的基础并不扎实。 需要说明的是,我的英语还不错,在大一和大二分别通过了英语四、六级考试(而其他科目则学得比较一般,因为我每学期只有一两个主要学习目标),在大四我读了很多英文文献。因为在读研究生期间需要查阅大量文献,我需要给这些文章建立一个数据库,于是年少无知的我就选择了Access。选择Access的原因并不是我比较熟悉它,而是我的老师用它,我至今也不会太多的操作。这应该算是我开始接触数据分析了。 使用高级语言时,记不住函数不要紧,但是你要有很强的搜索能…