对比Excel,轻松学习Python数据分析
张俊红
作者简介
图片
张俊红
某互联网公司数据分析师,擅长Python、Sql、Excel,对数据分析、机器学习领域比较熟悉。喜欢分享,致力于做一个数据科学路上的终身学习者、实践者、分享者。
个人微信公众号定期推送数据分析、及其学习、网络爬虫、Python编程相关文章。
扫码关注“张俊红”公众号,加入本书读者群。
图片 序言
有幸收到张俊红的做序邀请,我非常高兴。
从PC时代到移动互联网时代一路走来,每个人都感受到了数据爆炸性的增长,以及其中蕴含的巨大价值。
从PC时代开始,我们用键盘、扫描仪等设备使信息数据化。在移动互联网时代,智能手机通过摄像头、GPS、陀螺仪等各种传感器将我们的位置、行动轨迹、行为偏好,甚至情绪等信息数据化。截至2000年,全人类存储了大约12EB的数据,要知道1PB=1024TB,而1EB=1024PB。但是到了2011年,一年所产生的数据就高达1.82ZB (注:1ZB=1024EB),数据已经变成了一种人造的“新能源”。
在商业领域,从信息到商品,从商品到服务,越来越多我们熟悉的事物被标准的数据所度量。无论是在线广告的精准营销,还是电子商务的个性化推荐,又或者是互联网金融的人脸识别,互联网的每一次效率提升都依赖于对传统信息、物品,甚至人的数据化。
在使用数据进行效率变革及商业化的道路上,Excel和Python扮演了关键的角色,它们帮助数据分析师高效地从海量数据中发现问题,验证假设,搭建模型,预测未来。
作为一本数据分析的专业书籍,作者从数据采集、清洗、抽取,以及数据可视化等多个角度介绍了日常工作中数据分析的标准路径。通过对比Excel与Python在数据处理过程中的操作步骤,详细说明了Excel与Python间的差异,以及用Python进行数据分析的方法。
虽与作者素未谋面,但是对于Python在处理海量数据和建模上的高效性与便捷性,以及Pyt…