大数据技术原理与应用(第2版)

大数据技术原理与应用(第2版)

概念、存储、处理、分析与应用

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
8.3122 评价豆瓣读书

作品简介

本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。全书共15章,内容包含大数据的基本概念、大数据处理架构Hadoop,分布式文件系统HDFS,分布式数据库HBase,NoSQL数据库、云数据库、MapReduce,Spark流计算、图计算、数据可视化以及大数据在互联网、生物医学领域和其他行业的应用。本书在Hadoop,HDFS,HBase,MapReduce和Spark等重要章节安排了入门级的实践操作,以便读者更好地学习和掌握大数据关键技术。

本书可以作为高等院校计算机、信息管理等相关专业的大数据课程教材,也可供相关技术人员参考。

林子雨,北大博士,厦门大学计算机科学系老师,中国高校首个"数字教师"的提出者和建设者。在数据库、数据仓库、数据挖掘、大数据、云计算和物联网等领域有着十多年的知识积累,对各个领域知识都有比较深入的了解,有比较宽泛的视野。

作品目录

  1. 内容提要
  2. 前言(第2版)
  3. 前言(第1版)
  4. 作者介绍
  5. 第一篇 大数据基础
  6. 第1章 大数据概述
  7. 1.1 大数据时代
  8. 1.2 大数据的概念
  9. 1.3 大数据的影响
  10. 1.4 大数据的应用
  11. 1.5 大数据关键技术
  12. 1.6 大数据计算模式
  13. 1.7 大数据产业
  14. 1.8 大数据与云计算、物联网
  15. 1.9 本章小结
  16. 1.10 习题
  17. 第2章 大数据处理架构Hadoop
  18. 2.1 概述
  19. 2.2 Hadoop生态系统
  20. 2.3 Hadoop的安装与使用
  21. 2.4 本章小结
  22. 2.5 习题
  23. 实验1 安装Hadoop
  24. 第二篇 大数据存储与管理
  25. 第3章 分布式文件系统HDFS
  26. 3.1 分布式文件系统
  27. 3.2 HDFS简介
  28. 3.3 HDFS的相关概念
  29. 3.4 HDFS体系结构
  30. 3.5 HDFS的存储原理
  31. 3.6 HDFS的数据读写过程
  32. 3.7 HDFS编程实践
  33. 3.8 本章小结
  34. 3.9 习题
  35. 实验2 熟悉常用的HDFS操作
  36. 第4章 分布式数据库HBase
  37. 4.1 概述
  38. 4.2 HBase访问接口
  39. 4.3 HBase数据模型
  40. 4.4 HBase的实现原理
  41. 4.5 HBase运行机制
  42. 4.6 HBase编程实践
  43. 4.7 本章小结
  44. 4.8 习题
  45. 实验3 熟悉常用的HBase操作
  46. 第5章 NoSQL数据库
  47. 5.1 NoSQL简介
  48. 5.2 NoSQL兴起的原因
  49. 5.3 NoSQL与关系数据库的比较
  50. 5.4 NoSQL的四大类型
  51. 5.5 NoSQL的三大基石
  52. 5.6 从NoSQL到NewSQL数据库
  53. 5.7 本章小结
  54. 5.8 习题
  55. 第6章 云数据库
  56. 6.1 云数据库概述
  57. 6.2 云数据库产品
  58. 6.3 云数据库系统架构
  59. 6.4 云数据库实践
  60. 6.5 本章小结
  61. 6.6 习题
  62. 实验4 熟练使用RDS for MySQL数据库
  63. 第三篇 大数据处理与分析
  64. 第7章 MapReduce
  65. 7.1 概述
  66. 7.2 MapReduce的工作流程
  67. 7.3 实例分析:WordCount
  68. 7.4 MapReduce的具体应用
  69. 7.5 MapReduce编程实践
  70. 7.6 本章小结
  71. 7.7 习题
  72. 实验5 MapReduce编程初级实践
  73. 第8章 Hadoop再探讨
  74. 8.1 Hadoop的优化与发展
  75. 8.2 HDFS2.0的新特性
  76. 8.3 新一代资源管理调度框架YARN
  77. 8.4 Hadoop生态系统中具有代表性的功能组件
  78. 8.5 本章小结
  79. 8.6 习题
  80. 第9章 Spark
  81. 9.1 概述
  82. 9.2 Spark生态系统
  83. 9.3 Spark运行架构
  84. 9.4 Spark的部署和应用方式
  85. 9.5 Spark编程实践
  86. 9.6 本章小结
  87. 9.7 习题
  88. 第10章 流计算
  89. 10.1 流计算概述
  90. 10.2 流计算的处理流程
  91. 10.3 流计算的应用
  92. 10.4 开源流计算框架Storm
  93. 10.5 Spark Streaming
  94. 10.6 本章小结
  95. 10.7 习题
  96. 第11章 图计算
  97. 11.1 图计算简介
  98. 11.2 Pregel简介
  99. 11.3 Pregel图计算模型
  100. 11.4 Pregel的C++ API
  101. 11.5 Pregel的体系结构
  102. 11.6 Pregel的应用实例
  103. 11.7 Pregel和MapReduce实现PageRank算法的对比
  104. 11.8 本章小结
  105. 11.9 习题
  106. 第12章 数据可视化
  107. 12.1 可视化概述
  108. 12.2 可视化工具
  109. 12.3 可视化典型案例
  110. 12.4 本章小结
  111. 12.5 习题
  112. 第四篇 大数据应用
  113. 第13章 大数据在互联网领域的应用
  114. 13.1 推荐系统概述
  115. 13.2 协同过滤
  116. 13.3 协同过滤实践
  117. 13.4 本章小结
  118. 13.5 习题
  119. 第14章 大数据在生物医学领域的应用
  120. 14.1 流行病预测
  121. 14.2 智慧医疗
  122. 14.3 生物信息学
  123. 14.4 案例:基于大数据的综合健康服务平台
  124. 14.5 本章小结
  125. 14.6 习题
  126. 第15章 大数据的其他应用
  127. 15.1 大数据在物流领域中的应用
  128. 15.2 大数据在城市管理中的应用
  129. 15.3 大数据在金融行业中的应用
  130. 15.4 大数据在汽车行业中的应用
  131. 15.5 大数据在零售行业中的应用
  132. 15.6 大数据在餐饮行业中的应用
  133. 15.7 大数据在电信行业中的应用
  134. 15.8 大数据在能源行业中的应用
  135. 15.9 大数据在体育和娱乐领域中的应用
  136. 15.10 大数据在安全领域中的应用
  137. 15.11 大数据在政府领域中的应用
  138. 15.12 大数据在日常生活中的应用
  139. 15.13 本章小结
  140. 15.14 习题
  141. 参考文献
载入中