深入理解大数据:大数据处理与编程实践
深入理解大数据:大数据处理与编程实践 内容简介: 以大数据处理主流平台Hadoop1.0为核心,介绍Hadoop MapReduce,HDFS,HBase,以及Hive的基本设计思想、工作原理、系统构架、以及详细的大数据处理编程技术。 特点: (1) 重点放在教读者算法设计实现,从基础算法,到应用编程案例,解决实际问题。 (2) 作者多年的教学研究实践,课程设计沉淀,可以更深入地讨论大数据。 (3) 来自业界——Intel真实的实践经验和案例积累。 资源目录: 推荐序一 推荐序二 推荐序三 丛书序言 前言 第一部分Hadoop系统 第1章大数据处理技术简介 1.1并行计算技术简介 1.1.1并行计算的基本概念 1.1.2并行计算技术的分类 1.1.3并行计算的主要技术问题 1.2大数据处理技术简介 1.2.1大数据的发展背景和研究意义 1.2.2大数据的技术特点 1.2.3大数据研究的主要目标、基本原则和基本途径 1.2.4大数据计算模式和系统 1.2.5大数据计算模式的发展趋势 1.2.6大数据的主要技术层面和技术内容 1.3MapReduce并行计算技术简介 1.3.1MapReduce的基本概念和由来 1.3.2MapReduce的基本设计思想 1.3.3MapReduce的主要功能和技术特征 1.4Hadoop系统简介 1.4.1Hadoop的概述与发展历史 1.4.2Hadoop系统分布式存储与并行计算构架 1.4.3Hadoop平台的基本组成与生态系统 1.4.4Hadoop的应用现状和发展趋势 第2章Hadoop系统的安装与操作管理 2.1Hadoop系统安装方法简介 2.2单机和单机伪分布式Hadoop系统安装基本步骤 2.2.1安装和配置JDK 2.2.2创建Hadoop用户 2.2.3下载安装Hadoop 2.2.4配置SSH...









