转载至: https://www.jb51.net/books/637582.html
下载链接: 点我一键跳转到 下载链接
下载声明: 本资料仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版!
《企业大数据处理:Spark、Druid、Flume与Kafka应用实践》是一本立足于企业真实的商用项目来讲解如何高效从事大数据实践的著作。技术层面,从全栈的角度系统梳理和详尽讲解了大数据的核心技术,包括Spark、Druid、Flume、Kafka等,让我们在纷繁复杂的技术中少走弯路;经验层面,为企业的大数据技术选型和大数据平台建设提供了成熟的解决方案;实操层面,提供了大量的案例,其中包括2个综合性的案例。
全书一共分为三个部分:
第一部分(第1章):主要介绍了企业大数据系统的前期准备工作,包括构建企业大数据处理系统需要的软件环境和集群环境是如何搭建的。
第二部分(第2~7章):依次重点讲解了Spark的基本原理、使用方法和优化方式;Druid的基本原理、集群的搭建过程,以及相关的各种操作;日志收集系统Flume的基本架构、关键组件,以及分层日志收集架构的设计与实践;分布式消息队列Kafka的基本架构和集群搭建过程,以及使用Java语言实现客户端API的详细过程。
第三部分(第8~9章):详细讲解了企业大数据处理的两个实际应用案例,分别是基于Druid构建多维数据分析平台和基于JMX指标的监控系统。
前言
内容概述
目标读者
读者反馈
致谢
第一部分 准备工作
第1章 基础环境准备
1.1 软件环境准备
1.2 集群环境准备
1.3 小结
第二部分 核心技术
第2章 Spark详解
2.1 Spark概述
2.2 Spark SQL
2.3 Structured Streaming
2.4 Spark优化
2.5 小结
第3章 Druid原理及部署
3.1 架构设计
3.2 集群部署
3.3 小结
第4章 Druid数据摄入
4.1 模式设计
4.2 批量数据摄入
4.3 流数据摄入
4.4 数据更新
4.5 小结
第5章 Druid客户端
5.1 涉及组件
5.2 查询类型
5.3 查询API
5.4 小结
第6章 日志收集
6.1 Flume介绍
6.2 Flume应用实践
6.3 小结
第7章 分布式消息队列
7.1 Kafka介绍
7.2 安装部署
7.3 客户端API
7.4 小结
第三部分 项目实践
第8章 数据平台
8.1 需求分析
8.2 功能实现
8.3 小结
第9章 监控系统
9.1 InfluxDB
9.2 JMXTrans
9.3 Grafana
9.4 小结