Spark大数据处理:技术、应用与性能优化
Spark大数据处理:技术、应用与性能优化 内容简介: 这是一本依据最新技术版本,系统、全面、详细讲解Spark的著作,作者结合自己在微软和IBM的实践经验和对Spark源代码的研究撰写而成。首先从技术层面讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容;然后从应用角度讲解了一些简单的、有代表性的案例;最后对Spark的性能优化进行了探讨。 资源目录: 前 言 第1章 Spark简介 1 1.1 Spark是什么 1 1.2 Spark生态系统BDAS 4 1.3 Spark架构 6 1.4 Spark分布式架构与单机多核 架构的异同 9 1.5 Spark的企业级应用 10 1.5.1 Spark在Amazon中的应用 11 1.5.2 Spark在Yahoo!的应用 15 1.5.3 Spark在西班牙电信的应用 17 1.5.4 Spark在淘宝的应用 18 1.6 本章小结 20 第2章 Spark集群的安装与部署 21 2.1 Spark的安装与部署 21 2.1.1 在Linux集群上安装与配置Spark 21 2.1.2 在Windows上安装与配置Spark 30 2.2 Spark集群初试 33 2.3 本章小结 35 第3章 Spark计算模型 36 3.1 Spark程序模型 36 3.2 弹性分布式数据集 37...