大数据：从基础理论到最佳实践

类别出版 / 非虚构

出版社清华大学出版社 / 2017-01

字数约 162,000 字

ISBN9787302457435

暂无评价综合评分的显示会考虑用户真实性等多项因素，每部作品出现综合评分的时间不定。

全本定价~~￥35.88~~￥21.53

特价今日特价截止至：2026-04-06 02:00:00了解详情

本书侧重于大数据的实践性技术，系统地介绍了主流大数据平台及工具的安装部署、管理维护和应用开发。平台和工具的选择均为当前业界主流的开源产品，因此，对于读者来说

本书涉及的开源技术包括：HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介绍一般性的背景知识、安装部署、管理维护和应用开发技?

本书主要内容包括以下几大部分。

大数据存储篇：以HDFS为基础，介绍分布式文件系统的原理、安装、fs命令的使用、编程，介绍如何用HDFS实现，并通过HTTP调用。

大数据计算篇：以MapReduce、YARN为基础，介绍分布式计算的原理、部署，以及编程案例。

非关系型数据库篇：以HBase为基础，重点介绍非关系型数据库的优势、原理、部署，以及命令行使用，编程案例，与Sqoop配合使用等。

大数据仓库篇：以Hive、数据仓库等为基础，重点介绍数据的抽取、原理、部署、分析与编程。

大数据实时计算篇：以Storm、Kafka为基础，介绍实时计算的架构、组成、使用与开发。

本书非常适合从事大数据技术开发与使用的初学者，以及从事大数据技术研发的企事业单位工程师学习和参考，也适合高校计算机相关专业的专科生、本科生和研究生学习使用。

祁伟主编。