Spark核心技术与高级应用

Spark核心技术与高级应用

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
¥25.00¥15.00
双11狂欢购,阅读盛宴不打烊截止至:2024-11-14 00:00:00了解详情

作品简介

本书写作过程中,Spark版本从1.0一直变化到1.5,秉承大道至简的主导思想,我们尽可能地按照1.5版本进行了统筹,希望能抛砖引玉,以个人的一些想法和见解,为读者拓展出更深入、更全面的思路。

作者:于俊等

作品目录

  1. 前言
  2. 基础篇
  3. 第1章 Spark简介
  4. 1.1 什么是Spark
  5. 1.2 Spark的重要扩展
  6. 1.3 本章小结
  7. 第2章 Spark部署和运行
  8. 2.1 部署准备
  9. 2.2 Spark部署
  10. 2.3 运行Spark应用程序
  11. 2.4 本章小结
  12. 第3章 Spark程序开发
  13. 3.1 使用Spark Shell编写程序
  14. 3.2 构建Spark的开发环境
  15. 3.3 独立应用程序编程
  16. 3.4 本章小结
  17. 第4章 编程模型
  18. 4.1 RDD介绍
  19. 4.2 创建RDD
  20. 4.3 RDD操作
  21. 4.4 共享变量
  22. 4.5 本章小结
  23. 第5章 作业执行解析
  24. 5.1 基本概念
  25. 5.2 作业执行流程
  26. 5.3 运行时环境
  27. 5.4 应用程序运行实例
  28. 5.5 本章小结
  29. 第6章 Spark SQL与DataFrame
  30. 6.1 概述
  31. 6.2 DataFrame
  32. 6.3 数据源
  33. 6.4 分布式的SQL Engine
  34. 6.5 性能调优
  35. 6.6 数据类型
  36. 6.7 本章小结
  37. 第7章 深入了解Spark Streaming
  38. 7.1 基础知识
  39. 7.2 DStream操作
  40. 7.3 性能调优
  41. 7.4 容错处理
  42. 7.5 一个例子
  43. 7.6 本章小结
  44. 第8章 Spark MLlib与机器学习
  45. 8.1 机器学习概述
  46. 8.2 Spark MLlib介绍
  47. 8.3 Spark MLlib库
  48. 8.4 ML库
  49. 8.5 本章小结
  50. 第9章 GraphX图计算框架与应用
  51. 9.1 概述
  52. 9.2 Spark GraphX架构
  53. 9.3 GraphX编程
  54. 9.4 应用场景
  55. 9.5 本章小结
  56. 第10章 SparkR(R on Spark)
  57. 10.1 概述
  58. 10.2 安装SparkR
  59. 10.3 SparkR的运行与应用示例
  60. 10.4 本章小结
  61. 实战篇
  62. 第11章 大数据分析系统
  63. 11.1 背景
  64. 11.2 数据格式
  65. 11.3 应用架构
  66. 11.4 业务实现
  67. 11.5 本章小结
  68. 第12章 系统资源分析平台
  69. 12.1 业务背景
  70. 12.2 应用架构
  71. 12.3 代码实现
  72. 12.4 结果验证
  73. 12.5 本章小结
  74. 第13章 在Spark上训练LR模型
  75. 13.1 逻辑回归简介
  76. 13.2 数据格式
  77. 13.3 MLlib中LR模型源码介绍
  78. 13.4 实现案例
  79. 13.5 本章小结
  80. 第14章 获取二级邻居关系图
  81. 14.1 理解PageRank
  82. 14.2 PageRank算法基于Spark的实现
  83. 14.3 基于PageRank的二级邻居获取
  84. 14.4 本章小结
  85. 高级篇
  86. 第15章 调度管理
  87. 15.1 调度概述
  88. 15.2 调度器
  89. 15.3 本章小结
  90. 第16章 存储管理
  91. 16.1 硬件环境
  92. 16.2 Storage模块
  93. 16.3 Shuffle数据持久化
  94. 16.4 本章小结
  95. 第17章 监控管理
  96. 17.1 Web界面
  97. 17.2 Spark UI历史监控
  98. 17.3 监控工具
  99. 17.4 本章小结
  100. 第18章 性能调优
  101. 18.1 文件的优化
  102. 18.2 序列化数据
  103. 18.3 缓存
  104. 18.4 共享变量
  105. 18.5 流水线优化
  106. 18.6 本章小结
  107. 扩展篇
  108. 第19章 Spark-jobserver实践
  109. 19.1 Spark-jobserver是什么
  110. 19.2 编译、部署及体验
  111. 19.3 Spark-jobserver程序实战
  112. 19.4 使用场景:用户属性分布计算
  113. 19.5 本章小结
  114. 第20章 Spark Tachyon实战
  115. 20.1 Tachyon文件系统
  116. 20.2 Tachyon入门
  117. 20.3 容错机制
  118. 20.4 本章小结
载入中