云计算教程
Hadoop核心技术 内容简介: 百度资深Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐! 从使用、原理、运维和开发4个方面深度讲解Hadoop最核心的技术 这是一本技术深度与企业实践并重的著作,由百度顶尖的Hadoop技术工程师撰写,是百度Hadoop技术实践经验的总结。本书使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解: (1)使用:详细讲解了HDFS存储系统、MapReduce计算框架,以及HDFS的命令系统; (2)原理:结合源代码,深度分析了MapReduce、HDFS、Streaming、Pipes、Hadoop作业调度系统等重要技术和组件的架构设计、工作机制和实现原理; (3)运维:结合百度的实际生产环境,详细讲解了Hadoop集群的安装、配置、测试以及管理和运维; (4)开发:详细讲解了Hadoop Streaming、Pipes的使用和开发实践,以及MapReduce的编程实践和常见问题。 与市面上已有的Hadoop相比,本书的最大不同之处是它直切企业应用和实践Hadoop技术的痛点,深入讲解了企业最需要和最头疼的技术和问题,内容上非常聚焦。 资源目录: 前 言 基 础 篇 第1章 认识Hadoop 2 1.1 缘于搜索的小象 2 1.1.1 Hadoop的身世 2 1.1.2 Hadoop简介 3 1.1.3 Hadoop发展简史 6 1.2 大数据、Hadoop和云计算 7 1.2.1 大数据 7 1.2.2 大数据、Hadoop和云计算的关系 8 1.3 设计思想与架构 9 1.3.1 数据存储与切分 9 1.3.2 MapReduce模型 11 1.3.3 MPI和MapReduce 13 1.4 国外Hadoop的应用现状 13 1.5 国内Hadoop的应用现状 17 1.6 Hadoop发行版 20 1.6.1 Apache Hadoop...