R用户Python学习指南:数据科学方法

[印] A.奥利(A.Ohri)
译者序 R语言是一款统计分析语言和软件,自20世纪90年代初作为开源软件公开发行以来,吸引了越来越多的用户。借助于丰富的添加包(add-on package),R语言的统计、分析和数据可视化功能越来越强大。而Python是一款通用编程语言,也开发于90年代初。Python语言以语法简洁而著称,并且有大量基于Python的模块(module)。随着大数据分析和机器学习的发展,这两款编程语言都得到了大量的应用。 作为数据分析从业人员,仅仅掌握一门分析语言有时候是不够的。在做传统的统计分析时,可根据具体情况来选择分析工具,既可以选择商业软件SAS和SPSS,也可以选择开源软件R。而在进行深度学习时,当前大多数模型都是基于开源软件Python或R的。因此,以前进行传统统计分析的人员,在应用深度学习模型时,必须掌握新的工具软件。 R和Python本身是不同的语言,但它们能够实现的功能具有一定的重合性。本书就是为R用户介绍如何应用Python的。在介绍Python的功能时,也介绍了对应的R的实现方法。通过这种对比学习,R语言的读者可以较快掌握另外一种功能强大的语言——Python。本书适合已经了解R的用户学习Python时阅读,也适合掌握Python的用户来学习R。 本书是从实践案例的角度撰写的,旨在帮助读者在追求卓越数据科学的过程中驾驭多种开源语言。没有一种软件或语言能够一直解决各种数据问题,所以在掌握多种语言和工具之后,就可以根据具体问题和数据来灵活地选用相应的工具。 本书的翻译由李洪成和潘文捷共同完成,另外,姜越和胡超也在校订中提供了有益的建议。 译者 2018年10月 前言 我从2003年起开始了销售汽车的职业生涯。这是我在获得工商管理硕士学位2年和工程学硕士学位4年后的第一份工作。另外,我有2年的时间先后以一名军官学员(1年内退学)和物理学家(1年后退学)的身份进入军校…