大数据技术原理与应用(第2版)

林子雨
内容提要 本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。全书共15章,内容包含大数据的基本概念、大数据处理架构Hadoop,分布式文件系统HDFS,分布式数据库HBase,NoSQL数据库、云数据库、MapReduce,Spark流计算、图计算、数据可视化以及大数据在互联网、生物医学领域和其他行业的应用。本书在Hadoop,HDFS,HBase,MapReduce和Spark等重要章节安排了入门级的实践操作,以便读者更好地学习和掌握大数据关键技术。 本书可以作为高等院校计算机、信息管理等相关专业的大数据课程教材,也可供相关技术人员参考。 前言(第2版) 《大数据技术原理与应用》第1版于2015年8月出版,虽然距今仅有一年左右的时间,但是在过去一年里,大数据技术发展迅猛,诸如Spark等新技术迅速崛起,开始改变Hadoop一枝独秀的市场格局。因此,我们及时对第1版内容进行了补充和修订,以适应大数据技术的快速发展,保持本书的先进性和实用性。 本书依然沿用第1版的篇章设计,共分四大部分,包括大数据基础篇、大数据存储与管理篇、大数据处理与分析篇和大数据应用篇。在大数据基础篇中,第 1章介绍大数据的基本概念和应用领域,并阐述大数据、云计算和物联网的相互关系;第2章介绍大数据处理架构Hadoop,并补充介绍了Hadoop版本演化。在大数据存储与管理篇中,第3章介绍了分布式文件系统HDFS,在编程实践部分根据最新版本的API进行了修订;第4章介绍了分布式数据库HBase,在编程实践部分根据最新版本的API进行了修订;第5章介绍了NoSQL数据库;第6章介绍了云数据库。在大数据处理与分析篇中,首先在第 7 章介绍了分布式并行编程模型MapReduce,然后在新增的第8章中对Hadoop进行了再探讨,介绍了Hadoop的发展演化…