Python 数据分析基础教程

郑丹青
内容提要 本书详细讲解了Python数据分析的相关内容,共分为10章,第1~9章分别讲解了数据分析概述、Python与数据分析、Python语言基础、NumPy数组与矢量计算、用NumPy进行简单统计分析、数据可视化——Matplotlib库、pandas数据分析基础、用pandas进行数据预处理、机器学习库scikit-learn入门;第10章用一个综合案例——电影数据分析项目,带领读者灵活掌握本书所学内容。 本书适合作为高等院校本、专科计算机相关专业的教材,也可供爱好者自学使用。 前言 随着云计算与大数据技术的发展,大数据分析技术已开始应用到各行各业中,应用范围已呈现逐渐扩大的趋势。Python是一种面向对象的解释型计算机程序设计语言。由于Python具有大量的库,可为数据分析和处理提供完整的工具集,因此,Python被广泛应用于科学计算领域,并成为大数据分析中的主流技术之一。因此,掌握Python数据分析技术已成为大数据应用技术专业、软件技术专业、计算机应用技术专业、信息管理专业学生必须掌握的关键技术之一。 本书的特点 本书通过数据分析案例,介绍了数据分析的概念、数据分析的过程及Python数据分析常用库的运用。同时,为便于读者能更好地理解Python与数据分析的关系,本书先介绍了Python的基础语法,然后,运用所学的数据分析技术,完成相关的数据分析项目。 本书的各个章节中都有示例代码,这些示例代码能够帮助读者更好地理解Python数据分析中的基本概念。同时,为提高读者对数据分析技术的综合运用能力,本书在第2~9章中还设置了项目实践和思考练习等内容,第10章为综合项目案例,逐层递进式教学,并配有教学PPT、程序源代码和数据集,可方便教师教学、读者自学和练习。 本书参考学时为96~128学时,建议采用理论实践一体化教学模式,各章节的参考学时见下面的学时分配表。 …