Hive编程指南
Hive编程指南 内容简介: 《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。 《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。 资源目录: 第1章 基础知识 1.1 Hadoop和MapReduce综述 1.2 Hadoop生态系统中的Hive 1.2.1 Pig 1.2.2 HBase 1.2.3 Cascading、Crunch及其他 1.3 Java和Hive:词频统计算法 1.4 后续事情 第2章 基础操作 2.1 安装预先配置好的虚拟机 2.2 安装详细步骤 2.2.1 装Java 2.2.2 安装Hadoop 2.2.3 本地模式、伪分布式模式和分布式模式 2.2.4 测试Hadoop 2.2.5 安装Hive 2.3 Hive内部是什么 2.4 启动Hive 2.5 配置Hadoop环境 2.5.1 本地模式配置 2.5.2 分布式模式和伪分布式模式配置 2.5.3 使用JDBC连接元数据 2.6 Hive命令 2.7 命令行界面 2.7.1 CLI 选项 2.7.2 变量和属性 2.7.3 Hive中“一次使用”命令 2.7.4 从文件中执行Hive查询 2.7.5 hiverc文件 2.7.6 使用Hive CLI的更多介绍 2.7.7 查看操作命令历史 2.7.8 执行shell命令 2.7.9 在Hive内使用Hadoop的dfs命令 2.7.10 Hive脚本中如何进行注释 2.7.11 显示字段名称 第3章 数据类型和文件格式 3.1 基本数据类型 3.2 集合数据类型 ...