Python数据分析

江雪松 邹静
作者简介 江雪松2001年获工学硕士学位,曾服务于华为、诺基亚等公司,有丰富的产品团队与研发团队管理经验。先后担任项目经理、研发经理、产品研发负责人,管理多个产品全球支持与交付团队、软件维护业务。 邹静2006年获理学硕士学位,现服务于四川省人民医院,担任副主任医师。拥有十多年的临床药物实验设计、数据统计与分析经验。先后参加了多个国家自然科学基金项目及四川省卫生厅科研项目。 内容简介 本书是一本系统讨论Python数据分析基础与案例实战的教程。全书共分为上下两篇:上篇为Pandas数据分析基础(第1章~第10章),首先介绍了数据分析及其基本流程、如何构建基于Python的数据科学开发环境,然后深入讨论了如何利用Python中的Pandas库进行基本的数据操作、数据清洗、数据整理,以及如何对数据进行可视化,最后用一个电商销售数据的分析案例对上篇的知识进行了总结;下篇为Python数据分析实战(第11章~第21章),尽可能多地为读者展示各种数据分析应用,目的是让读者体会到数据分析的作用。此外,下篇也对时间序列数据和大规模数据分析等进行了讨论。 为便于读者高效学习,快速掌握Python数据分析,本书提供全部的配套源代码以及数据。此外,作者单独录制了配套视频课程,针对该课程提供答疑。本书也额外提供了如何利用Basemap库和Folium库完成地理信息数据的可视化教程,供读者单独下载。 本书适合作为高校数据分析相关专业的课程教材,也可以作为从事数据分析的广大工作者的自学参考用书。 前言 根据Cummulus Media 2018年的数据,全球每分钟向谷歌发起370万次搜索,发送1800万条短信,YouTube上有430万条视频被观看,Facebook登录超过97万次,等等。人们刷微博、聊微信、用滴滴打车、用淘宝购物、用美团点外卖,每一条信息,每一次出行,每一次消费,每一次互…