数据分析与可视化

冯兴东 刘鑫
前言 数据可视化旨在清晰、直观地展示数据背后的信息和知识。“大数据时代”产生了大量分类汇总并以表格或文本形式体现的信息,这对信息的展示方式和展示效率提出了进一步的要求,基于统计分析和建模的可视化方式尤其重要。党的二十大报告指出:实施科教兴国战略,强化现代化建设人才支撑。然而,在当前国内统计学学科的建设中,数据分析与可视化内容鲜有被涵盖,且并未在高校中得到普及。本书可填补市场中的空白,提升统计学学科建设中数据分析与可视化的重要性。本书注重实际操作,可为学生和相关工作人员快速上手、掌握数据分析与可视化的主要知识提供强大帮助。 本书以Python框架为基础,系统地介绍数据分析与可视化的理念、工作流程、常见的可视化工具及其在统计建模方法上的应用和展示,并针对特定类型的数据、特定的应用场景展示详尽的实际案例,辅以对应章节的教学资源,让读者由浅入深地学习数据分析与可视化。各章主要内容如下。 第1章主要介绍数据、信息、知识之间的差异,如何收集、处理和组织数据,以及如何通过对数据的可视化展示来帮助决策。 第2章介绍如何生动地对数据进行可视化展示,一些较好的可视化实践方式和基本的统计学术语,Python中的可视化工具,以及交互式可视化的理念。 第3章介绍Python IDE工具,如何利用Anaconda进行可视化展示,以及常见的交互式可视化的程序库(如bokeh、VisPy)。 第4章介绍常见的Python中的数值计算和用于交互式绘图的程序库(如NumPy、SciPy),如何定义标量和切片检索,常见的数据结构(如堆栈、元组、队列),以及matplotlib可视化程序库。 第5章介绍常见的机器学习方法和预测模型(如回归方法、KNN算法、逻辑回归、支持向量机、主成分分析),并针对这些常见的机器学习方法进行可视化展示和分析。 第6章介绍常见的金融数据结构及其对应的统计模型,同时,针对这些常见的模…