文件大小:9.53 MB
文件类型:pdf
发布时间:2023-01-03 11:59:24
需资源分:2
下载次数:0
Tag:Kafka
::资源简介::
Kafka权威指南
封面
译者介绍
书名
版权
目录
序
前言
第01章 初识Kafka
1_1 发布与订阅消息系统
1_1_1 如何开始
1_1_2 独立的队列系统
1_2 Kafka登场
1_2_1 消息和批次
1_2_2 模式
1_2_3 主题和分区
1_2_4 生产者和消费者
1_2_5 broker和集群
1_2_6 多集群
1_3 为什么选择Kafka
1_3_1 多个生产者
1_3_2 多个消费者
1_3_3 基于磁盘的数据存储
1_3_4 伸缩性
1_3_5 高性能
1_4 数据生态系统
1_5 起源故事
1_5_1 LinkedIn的问题
1_5_2 Kafka的诞生
1_5_3 走向开源
1_5_4 命名
1_6 开始Kafka之旅
第02章 安装Kafka
2_1 要事先行
2_1_1 选择操作系统
2_1_2 安装Java
2_1_3 安装Zookeeper
2_2 安装Kafka Broker
2_3 broker配置
2_3_1 常规配置
2_3_2 主题的默认配置
2_4 硬件的选择
2_4_1 磁盘吞吐量
2_4_2 磁盘容量
2_4_3 内存
2_4_4 网络
2_4_5 CPU
2_5 云端的Kafka
2_6 Kafka集群
2_6_1 需要多少个broker
2_6_2 broker 配置
2_6_3 操作系统调优
2_7 生产环境的注意事项
2_7_1 垃圾回收器选项
2_7_2 数据中心布局
2_7_3 共享Zookeeper
2_8 总结
第03章 Kafka生产者——向Kafka写入数据
3_1 生产者概览
3_2 创建Kafka生产者
3_3 发送消息到Kafka
3_3_1 同步发送消息
3_3_2 异步发送消息
3_4 生产者的配置
3_5 序列化器
3_5_1 自定义序列化器
3_5_2 使用Avro序列化
3_5_3 在Kafka里使用Avro
3_6 分区
3_7 旧版的生产者API
3_8 总结
第04章 Kafka消费者——从Kafka读取数据
4_1 KafkaConsumer概念
4_1_1 消费者和消费者群组
4_1_2 消费者群组和分区再均衡
4_2 创建Kafka消费者
4_3 订阅主题
4_4 轮询
4_5 消费者的配置
4_6 提交和偏移量
4_6_1 自动提交
4_6_2 提交当前偏移量
4_6_3 异步提交
4_6_4 同步和异步组合提交
4_6_5 提交特定的偏移量
4_7 再均衡监听器
4_8 从特定偏移量处开始处理记录
4_9 如何退出
4_10 反序列化器
4_11 独立消费者——为什么以及怎样使用没有群组的消费者
4_12 旧版的消费者API
4_13 总结
第05章 深入Kafka
5_1 集群成员关系
5_2 控制器
5_3 复制
5_4 处理请求
5_4_1 生产请求
5_4_2 获取请求
5_4_3 其他请求
5_5 物理存储
5_5_1 分区分配
5_5_2 文件管理
5_5_3 文件格式
5_5_4 索引
5_5_5 清理
5_5_6 清理的工作原理
5_5_7 被删除的事件
5_5_8 何时会清理主题
5_9 总结
第06章 可靠的数据传递
6_1 可靠性保证
6_2 复制
6_3 broker配置
6_3_1 复制系数
6_3_2 不完全的首领选举
6_3_3 最少同步副本
6_4 在可靠的系统里使用生产者
6_4_1 发送确认
6_4_2 配置生产者的重试参数
6_4_3 额外的错误处理
6_5 在可靠的系统里使用消费者
6_5_1 消费者的可靠性配置
6_5_2 显式提交偏移量
6_6 验证系统可靠性
6_6_1 配置验证
6_6_2 应用程序验证
6_6_3 在生产环境监控可靠性
6_7 总结
第07章 构建数据管道
7_1 构建数据管道时需要考虑的问题
7_1_1 及时性
7_1_2 可靠性
7_1_3 高吞吐量和动态吞吐量
7_1_4 数据格式
7_1_5 转换
7_1_6 安全性
7_1_7 故障处理能力
7_1_8 耦合性和灵活性
7_2 如何在Connect API和客户端API之间作出选择
7_3 Kafka Connect
7_3_1 运行Connect
7_3_2 连接器示例——文件数据源和文件数据池
7_3_3 连接器示例——从MySQL到ElasticSearch
7_3_4 深入理解Connect
7_4 Connect之外的选择
7_4_1 用于其他数据存储的摄入框架
7_4_2 基于图形界面的ETL工具
7_4_3 流式处理框架
7_5 总结
第08章 跨集群数据镜像
8_1 跨集群镜像的使用场景
8_2 多集群架构
8_2_1 跨数据中心通信的一些现实情况
8_2_2 Hub和Spoke架构
8_2_3 双活架构
8_2_4 主备架构
8_2_5 延展集群
8_3 Kafka的MirrorMaker
8_3_1 如何配置
8_3_2 在生产环境部署MirrorMaker
8_3_3 MirrorMaker调优
8_4 其他跨集群镜像方案
8_4_1 优步的uReplicator
8_4_2 Confluent的Replicator
8_5 总结
第09章 管理Kafka
9_1 主题操作
9_1_1 创建主题
9_1_2 增加分区
9_1_3 删除主题
9_1_4 列出集群里的所有主题
9_1_5 列出主题详细信息
9_2 消费者群组
9_2_1 列出并描述群组
9_2_2 删除群组
9_2_3 偏移量管理
9_3 动态配置变更
9_3_1 覆盖主题的默认配置
9_3_2 覆盖客户端的默认配置
9_3_3 列出被覆盖的配置
9_3_4 移除被覆盖的配置
9_4 分区管理
9_4_1 首选的首领选举
9_4_2 修改分区副本
9_4_3 修改复制系数
9_4_4 转储日志片段
9_4_5 副本验证
9_5 消费和生产
9_5_1 控制台消费者
9_5_2 控制台生产者
9_6 客户端ACL
9_7 不安全的操作
9_7_1 移动集群控制器
9_7_2 取消分区重分配
9_7_3 移除待删除的主题
9_7_4 手动删除主题
9_8 总结
第10章 监控Kafka
10_1 度量指标基础
10_1_1 度量指标在哪里
10_1_2 内部或外部度量
10_1_3 应用程序健康检测
10_1_4 度量指标的覆盖面
10_2 broker的度量指标
10_2_1 非同步分区
10_2_2 broker度量指标
10_2_3 主题和分区的度量指标
10_2_4 Java虚拟机监控
10_2_5 操作系统监控
10_2_6 日志
10_3 客户端监控
10_3_1 生产者度量指标
10_3_2 消费者度量指标
10_3_3 配额
10_4 延时监控
10_5 端到端监控
10_6 总结
第11章 流式处理
11_1 什么是流式处理
11_2 流式处理的一些概念
11_2_1 时间
11_2_2 状态
11_2_3 流和表的二元性
11_2_4 时间窗口
11_3 流式处理的设计模式
11_3_1 单个事件处理
11_3_2 使用本地状态
11_3_3 多阶段处理和重分区
11_3_4 使用外部查找——流和表的连接
11_3_5 流与流的连接
11_3_6 乱序的事件
11_3_7 重新处理
11_4 Streams示例
11_4_1 字数统计
11_4_2 股票市场统计
11_4_3 填充点击事件流
11_5 Kafka Streams的架构概览
11_5_1 构建拓扑
11_5_2 对拓扑进行伸缩
11_5_3 从故障中存活下来
11_6 流式处理使用场景
11_7 如何选择流式处理框架
11_8 总结
附录A 在其他操作系统上安装Kafka
作者介绍
::下载地址::
>> 评论