深入理解Hadoop.第2版
云计算教程

深入理解Hadoop.第2版

深入理解Hadoop.第2版  内容简介: 本书作者基于对Hadoop系统的实践,深入浅出地对Hadoop进行了详细的讲解,包含大量的实例和技巧,可帮助有一定基础的开发者快速掌握分布式系统。主要内容包括:第1章~第4章讲解大数据系统的基本概念、Hadoop系统的关键概念,以及进行Hadoop平台管理的关键概念要素。第5章~第7章是本书的重点,深入分析了MapReduce框架,不仅包括MapReduce框架的API,还介绍MapReduce框架的更复杂概念及其设计理念。第8章~第14章介绍Hadoop生态系统,包括支持MapReduce程序的单元测试和集成测试框架、Hadoop系统的监控和日志系统、Hive框架、Pig和Crunch框架、HCatalog框架、Hadoop日志流处理、HBase等。第15章~第17章介绍了数据科学基本概念及应用、云计算实例、分布式下载服务实例等。 资源目录: 译者序 作者简介 前言 第1章为什么会有大数据1 第2章Hadoop中的概念13 第3章初识Hadoop框架34 第4章Hadoop系统管理51 第5章MapReduce开发基础78 第6章MapReduce开发进阶111 第7章 Hadoop输入/输出155 第8章 测试Hadoop程序186 第9章Hadoop的监控203 第10章使用Hadoop构建数据仓库215 第11章使用Pig进行数据处理238 第12章HCatalog和企业级Hadoop266 第13章使用Hadoop分析日志277 第14章使用HBase构建实时系统286 第15章Hadoop与数据科学317 第16章Hadoop与云计算334 第17章构建YARN应用程序349 附录A安装Hadoop 附录B使用Maven和Eclipse 附录CApache Ambari 截图:
高可用性的HDFS——Hadoop分布式文件系统深度实践
云计算教程

高可用性的HDFS——Hadoop分布式文件系统深度实践

高可用性的HDFS——Hadoop分布式文件系统深度实践 内容简介: 《高可用性的hdfs—hadoop分布式文件系统深度实践》专注于hadoop分布式文件系统(hdfs)的主流ha解决方案,内容包括:hdfs元数据解析、hadoop元数据备份方案、hadoopbackup node方案、avatarnode解决方案以及最新的ha解决方案cloudrea ha namenode等。其中有关backupnode方案及avatarnode方案的内容是本书重点,尤其是对avatarnode方案从运行机制到异常处理方案的步骤进行了详尽介绍,同时还总结了各种异常情况下avatarnode的各种处理方案。   《高可用性的hdfs—hadoop分布式文件系统深度实践》从代码入手并结合情景分析、案例解说对hdfs的元数据以及主流的hdfsha解决方案的运行机制进行了深入剖析,力求使读者在解决问题时做到心中有数,不仅知其然还知其所以然。   本书光盘包含本书部分操作的视频教程以及所有源代码、脚本等开发文件。   《高可用性的hdfs—hadoop分布式文件系统深度实践》读者主要为云计算相关领域的研发人员、云计算系统管理维护人员,也适合作为高校研究生和高年级本科生的专业课辅助教材。 资源目录: 第1章 hdfs ha及解决方案  1.1 hdfs系统架构  1.2 ha定义  1.3 hdfs ha原因分析及应对措施  1.3.1 可靠性  1.3.2 可维护性  1.4 现有hdfs ha解决方案  1.4.1 hadoop的元数据备份方案  1.4.2 hadoop的secondarynamenode方案  1.4.3 hadoop的checkpoint ode方案  1.4.4 hadoop的backupnode方案  1.4.5 drdb方案  1.4.6 facebook的avatarnode方案  1.5 方案优缺点比较 第2章 hdfs元数据解析  2.1 概述...
大数据存储MongoDB实战指南
云计算教程

大数据存储MongoDB实战指南

大数据存储MongoDB实战指南 内容简介: MongoDB是一种面向文档的分布式数据库,可扩展,表结构自由,并且支持丰富的查询语句和数据类型。时至今日,MongoDB以其灵活的数据存储方式逐渐成为IT行业非常流行的一种非关系型数据库(NoSql)。 《大数据存储MongoDB实战指南》从学习与实践者的视角出发,本着通俗精简、注重实践、突出精髓的原则,精准剖析了MongoDB的诸多概念和要点。全书共分4个部分,分别从基础知识、深入理解MongoDB、监控与管理MongoDB和应用实践几个维度详细地介绍了MongoDB的特点及应用实例。 《大数据存储MongoDB实战指南》适合有海量数据存储需求的人员、数据库管理开发人员、数据挖掘与分析人员以及各类基于数据库的应用开发人员。读者将从书中获得诸多实用的知识和开发技巧。 资源目录: 第一部分基础知识 第1章大数据与云计算 1.1什么是大数据 1.2什么是云计算 1.3大数据与云计算 1.4什么是MongoDB 1.5大数据与MongoDB 1.6MongoDB特点 1.7安装MongoDB 1.8几个重要的进程介绍 1.8.1mongod进程 1.8.2mongo进程 1.8.3其他进程 1.9适合哪些业务 1.10小结 第2章查询语言系统 2.1查询选择器 2.2查询投射 2.3数组操作 2.4小结 第3章索引与查询优化 3.1索引 3.1.1单字段索引 3.1.2复合索引 3.1.3数组的多键索引 3.1.4索引管理 3.2查询优化 3.3小结 第4章增改删操作 4.1插入语句 4.2修改语句 4.3删除语句 4.4小结 第二部分深入理解MongoDB 第5章Journaling日志功能 5.1两个重要的存储视图 5.2Journaling工作原理 5.3小结 第6章聚集分析 6.1管道模式进行聚集...