Apache Kafka实战

Apache Kafka实战

暂无评价综合评分的显示会考虑用户真实性等多项因素,每部作品出现综合评分的时间不定。
9.048 评价豆瓣读书
免费试读

作品简介

《Apache Kafka实战》是涵盖Apache Kafka各方面的具有实践指导意义的工具书和参考书。作者结合典型的使用场景,对Kafka整个技术体系进行了较为全面的讲解,以便读者能够举一反三,直接应用于实践。同时,本书还对Kafka的设计原理及其流式处理组件进行了较深入的探讨,并给出了翔实的案例。

《Apache Kafka实战》共分为10章:第1章全面介绍消息引擎系统以及Kafka的基本概念与特性,快速带领读者走进Kafka的世界;第2章简要回顾了Apache Kafka的发展历史;第3章详细介绍了Kafka集群环境的搭建;第4、5章深入探讨了Kafka客户端的使用方法;第6章带领读者一览Kafka内部设计原理;第7-9章以实例的方式讲解了Kafka集群的管理、监控与调优;第10章介绍了Kafka新引入的流式处理组件。

《Apache Kafka实战》适合所有对云计算、大数据处理感兴趣的技术人员阅读,尤其适合对消息引擎、流式处理技术及框架感兴趣的技术人员参考阅读。

胡夕,8年分布式系统架构和开发经验,曾负责IBM重要产品的研发和技术支持。在搜狗任职期间主导构建了大数据分布式流式处理平台,为实时提供业务决策提供了重要支撑。后在微博带领团队参与构建了微博混合云项目核心模块的设计与研发,成功应对春晚峰值流量。

作品目录

  1. 作者介绍
  2. 前言
  3. 第1章 认识Apache Kafka
  4. 1.1 Kafka快速入门
  5. 1.2 消息引擎系统
  6. 1.3 Kafka概要设计
  7. 1.4 Kafka基本概念与术语
  8. 1.5 Kafka使用场景
  9. 1.6 本章小结
  10. 第2 章 Kafka发展历史
  11. 2.1 Kafka的历史
  12. 2.2 Kafka版本变迁
  13. 2.3 如何选择Kafka版本
  14. 2.4 Kafka与Confluent
  15. 2.5 本章小结
  16. 第3章 Kafka线上环境部署
  17. 3.1 集群环境规划
  18. 3.2 伪分布式环境安装
  19. 3.3 多节点环境安装
  20. 3.4 验证部署
  21. 3.5 参数设置
  22. 3.6 本章小结
  23. 第4章 producer开发
  24. 4.1 producer概览
  25. 4.2 构造producer
  26. 4.3 消息分区机制
  27. 4.4 消息序列化
  28. 4.5 producer拦截器
  29. 4.6 无消息丢失配置
  30. 4.7 消息压缩
  31. 4.8 多线程处理
  32. 4.9 旧版本producer
  33. 第5章 consumer开发
  34. 5.1 consumer概览
  35. 5.2 构建consumer
  36. 5.3 订阅topic
  37. 5.4 消息轮询
  38. 5.5 位移管理
  39. 5.6 重平衡(rebalance)
  40. 5.7 解序列化
  41. 5.8 多线程消费实例
  42. 5.9 独立consumer
  43. 5.10 旧版本consumer
  44. 5.11 本章小结
  45. 第6章 Kafka设计原理
  46. 6.1 broker端设计架构
  47. 6.2 producer端设计
  48. 6.3 consumer端设计
  49. 6.4 实现精确一次处理语义
  50. 6.5 本章小结
  51. 第7章 管理Kafka集群
  52. 7.1 集群管理
  53. 7.2 topic管理
  54. 7.3 topic动态配置管理
  55. 7.4 consumer相关管理
  56. 7.5 topic分区管理
  57. 7.6 Kafka常见脚本工具
  58. 7.7 API方式管理集群
  59. 7.8 MirrorMaker
  60. 7.9 Kafka安全
  61. 7.10 常见问题
  62. 7.11 本章小结
  63. 第8章 监控Kafka集群
  64. 8.1 集群健康度检查
  65. 8.2 MBean监控
  66. 8.3 broker端JMX监控
  67. 8.4 clients端JMX监控
  68. 8.5 JVM监控
  69. 8.6 OS监控
  70. 8.7 主流监控框架
  71. 8.8 本章小结
  72. 第9章 调优Kafka集群
  73. 9.1 引言
  74. 9.2 确定调优目标
  75. 9.3 集群基础调优
  76. 9.4 调优吞吐量
  77. 9.5 调优延时
  78. 9.6 调优持久性
  79. 9.7 调优可用性
  80. 9.8 本章小结
  81. 第10章 KafkaConnect与KafkaStreams
  82. 10.1 引言
  83. 10.2 Kafka Connect
  84. 10.3 Kafka Streams
  85. 10.4 本章小结
载入中

热门划线

  1. 最常见的两种消息引擎范型是消息队列模型和发布/订阅模型4 人
  2. Kafka为partition动态维护一个replica集合。该集合中的所有replica保存的消息日志都与leader replica保持同步状态。只有这个集合中的 replica才能被选举为 leader,也只有该集合中所有replica都接收到了同一条消息,Kafka才会将该消息置于“已提交”状态,即认为这条消息发送成功。4 人
  3. 总结一下,Kafka就是依靠下列4点达到了高吞吐量、低延时的设计目标的。· 大量使用操作系统页缓存,内存操作速度快且命中率高。· Kafka不直接参与物理I/O操作,而是交由最擅长此事的操作系统来完成。· 采用追加写入方式,摒弃了缓慢的磁盘随机读/写操作。· 使用以sendfile为代表的零拷贝技术加强网络间的数据传输效率。3 人
  4. 使用以sendfile为代表的零拷贝技术加强网络间的数据传输效率3 人
  5. Kafka 的 partition 实际上并没有太多的业务含义,它的引入就是单纯地为了提升系统的吞吐量,因此在创建 Kafka topic 的时候可以根据集群实际配置设置具体的partition数,实现整体性能的最大化。3 人
  6. 副本分为两类:领导者副本(leader replica)和追随者副本(follower replica)。follower replica 是不能提供服务给客户端的,也就是说不负责响应客户端发来的消息写入和消息消费请求。它只是被动地向领导者副本(leader replica)获取数据,而一旦 leader replica 所在的broker宕机,Kafka会从剩余的 replica中选举出新的 leader继续提供服务。3 人
  7. · 为生产者和消费者提供一套简单API。· 降低网络传输和磁盘存储开销。· 具有高伸缩性架构。3 人
  8. 在设计一个消息引擎系统时需要考虑的两个重要因素:· 消息设计。· 传输协议设计。2 人
  9. · 消息设计。· 传输协议设计。2 人
  10. 狭义2 人

喜欢这本书的人也喜欢