R与Hadoop大数据分析实战
R与Hadoop大数据分析实战 内容简介: 本书全面而系统地讲解了如何将R语言与Hadoop技术结合并应用于大数据分析,不仅系统且深入地阐释了R与Hadoop集成技术的工具、方法、原则和最佳实践,而且通过大量实践案例深入剖析各种常见问题,能为用户高效利用R语言与Hadoop技术进行大数据处理提供翔实指导。 全书分为四部分,共7章:第一部分(第1~2章)是基础知识,主要讲解R语言以及Hadoop的安装过程、计算原理和基本概念;第二部分(第3~4章)是初级应用,主要讲解RHIPE、RHadoop和streaming三种实现方案;第三部分(第5~6章)是高级实例,主要以RHadoop为技术背景,讲解多个实际应用案例;第四部分(第7章)介绍数据库连接,主要讲解在RHadoop下如何与各类数据库进行连接。 资源目录: 译者序 前言 审校者简介 致谢 第1章 R和Hadoop入门 1 1.1 安装R 2 1.2 安装RStudio 3 1.3 R语言的功能特征 3 1.3.1 使用R程序包 3 1.3.2 执行数据操作 3 1.3.3 日渐增多的社区支持 4 1.3.4 R语言数据建模 4 1.4 Hadoop的安装 5 1.4.1 不同的Hadoop模式 6 1.4.2 Hadoop的安装步骤 6 1.5 Hadoop的特点 12 1.5.1 HDFS简介 13 1.5.2 MapReduce简介 13 1.6 HDFS和MapReduce架构 14 1.6.1 HDFS架构 14 1.6.2 MapReduce架构 15 1.6.3 通过图示了解HDFS和MapReduce架构 15 1.7 Hadoop的子项目...