大数据分析处理(慕课版)

郭永洪 贺萌
内容提要 本书采用理论知识与任务案例相结合的形式,系统地阐述大数据分析处理工作流程中的重要步骤,介绍大数据分析处理过程中常用的第三方库。全书共13个单元,单元1介绍大数据分析的概念等内容;单元2和单元3介绍使用numpy与pandas实现科学计算与统计分析的相关知识;单元4~单元7介绍使用pandas实现数据预处理的方法;单元8介绍使用scikit-learn构建简单的机器学习模型的方法;单元9介绍使用matplotlib、seaborn等绘制图表的方法;单元10~单元13介绍4个大数据分析处理的综合案例。单元1~单元9中,每个单元都包含相关知识部分和任务实现部分,任务实现部分一般包含多个任务的具体实现过程,每个任务后都有课堂实践,通过完成实践操作,读者可以进一步巩固所学知识。 本书既可作为高等院校大数据技术专业学生的教材,也可作为大数据技术爱好者的自学用书。 前言FOREWORD 当前,全球已经进入“数字经济”时代,数据的价值愈发凸显,大数据作为一个新兴的技术产业正逐步融入我国经济发展的各个领域。近年来,数字化趋势下的新一代信息技术与实体经济深度融合,成为推动经济发展的新引擎,数据成为驱动经济发展的重要新型生产要素,对整个社会产生显著、深刻的影响。2020年,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》将数据作为一种新型生产要素,与传统生产要素并列,明确提出加快培育数据要素市场,主要措施包括推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护。近年来,越来越多的行业决策开始从业务驱动向数据驱动转变,要促进行业的发展需要大量的掌握数据分析处理技术的人员。 为加快推进党的二十大精神进教材、进课堂、进头脑,编写本书时编者将“立德树人”有机融入其中,丰富本书内容。党的二十大报告指出:“坚持创新在我国现代化建设全局中的核心地位。”本书是…