Hadoop视频100集
云计算教程

Hadoop视频100集

Hadoop是一个能够对大量数据进行分布式处理的软件框架。 Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。 Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。 Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。 Hadoop 还是可伸缩的,能够处理 PB 级数据。
大数据真实案列分析《HadoopSpark企业应用实战》11月份班
云计算教程

大数据真实案列分析《HadoopSpark企业应用实战》11月份班

大数据真实案列分析《HadoopSpark企业应用实战》11月份班 教程内容: 授 课 对 象 商业智能(BI)和企业数据仓库(EDW)的管理人员、建模人员、分析和开发人员、系统管理员等; 有意将Hadoop生态系统中的组件,作为现有EDW的补充,或未来替代产品的项目负责人及开发人员; 企业中牵涉到大数据处理的数据中心运行、规划、设计负责人; Hadoop企业级应用、整合项目的成员、负责人、开发人员 熟悉Hadoop生态系统,想了解和学习Hadoop与Spark整合在企业应用实战案例的朋友。 课 程 大 纲 本课程会介绍 Hadoop / Spark 各组件的架构,但不会涉及任何安装的内容,安装的教程、录像视频什么的网上到处都是,讲安装太浪费时间~ Hadoop/Spark环境的安装请大家自行解决,建议用Cloudera CDH或者Hortonworks HDP  本课程目标是:给大家分享一些在网上不能随便就搜到的内容和窍门,展示企业线上生产系统中应用 Hadoop、Spark 的成功案例,以及与现有企业BI平台整合的方案 第一周:企业级Hadoop/Spark应用概述,Hadoop/Spark生态系统与现有企业级应用的整合 企业级集群部署、数据管理、任务调度、集群监控 Hadoop架构介绍、Spark / Shark 介绍 Spark与Hadoop的关系 现有Hadoop架构的种种问题和限制 企业数据仓库的选型,Hadoop世界与EDW世界中的TPC(TPC DS与TPC H) Hadoop世界中的DBA 成本考量 —— 人?物?物是人非…… 第二周:Hadoop Eco System 进阶应用基础知识 HDFS...
性能之巅 洞悉系统、企业与云计算
云计算教程

性能之巅 洞悉系统、企业与云计算

性能之巅 洞悉系统、企业与云计算 内容简介: 《性能之巅:洞悉系统、企业与云计算》基于Linux 和Solaris 系统阐述了适用于所有系统的性能理论和方法,Brendan Gregg 将业界普遍承认的性能方法、工具和指标收集于本书之中。阅读本书,你能洞悉系统运作的方式,学习到分析和提高系统与应用程序性能的方法,这些性能方法同样适用于大型企业与云计算这类最为复杂的环境的性能分析与调优。 资源目录: 第1 章 绪论 ………………………………………………………………………….. 1 第2 章 方法 ……………………………………………………………………………………………….. 13 第3 章 操作系统 ……………………………………………………………………………… 72 第4 章 观测工具 …………………………………………………………………………… 98 第5 章 应用程序 ………………………………………………………………………………… 131 第6 章 CPU ………………………………………………………………………………… 162 第7 章 内存 …………………………………………………………………………………………….. 228 第8 章...
Spark专刊-Spark亚太研究院
云计算教程

Spark专刊-Spark亚太研究院

教程名称:         Spark专刊-Spark亚太研究院 《Java案例精粹150例》PDf Spark专刊】Scala入门(作者:王家虎) Spark专刊】SparkMLlib机器学习(作者:李军) Spark专刊】SparkSQL(作者:马军辉) Spark专刊】Spark与MPI(作者:张天元) Spark专刊】Spark内核(作者周小科) Spark专刊】Spark多语言编程(作者:张宇) Spark专刊】Spark最佳学习路径(作者:黄忠) Spark专刊】Spark运行原理解析(作者:孙敦灿) Spark专刊】Tachyon(作者:陈伟)
Hadoop安全:大数据平台隐私保护
云计算教程

Hadoop安全:大数据平台隐私保护

Hadoop安全:大数据平台隐私保护 内容简介: 《Hadoop安全 大数据平台隐私保护》阐述了Hadoop从早期开放的消费互联网时代到现在作为敏感数据可信平台的演变历程,介绍了包括身份验证、加密、密钥管理和商业实践在内的诸多主题,并在实际环境下加以讨论。第1章是介绍性内容,随后分为四大部分:*部分是安全架构,第二部分是验证、授权和安全审计,第三部分是数据安全,第四部分是归纳总结。*后介绍了几个使用案例,融合了书中诸多概念。 《Hadoop安全 大数据平台隐私保护》适合对Hadoop感兴趣的读者,有大数据平台保护需求的读者。 资源目录: 序  xi 前言  xii 第1章 引言  1 1.1 安全概览  1 1.1.1 机密性  2 1.1.2 完整性  2 1.1.3 可用性  2 1.1.4 验证、授权和审计  3 1.2 Hadoop 安全:简史  5 1.3 Hadoop 组件和生态系统  5 1.3.1 Apache HDFS  6 1.3.2 Apache YARN  7 1.3.3 Apache MapReduce  8 1.3.4 Apache Hive  9 1.3.5 Cloudera Impala  9 1.3.6 Apache Sentry  10 1.3.7 Apache HBase  11 1.3.8 Apache Accumulo  11 1.3.9 Apache Solr  13 1.3.10 Apache Oozie  13 1.3.11 Apache ZooKeeper  13 1.3.12 Apache Flume  13 1.3.13 Apache Sqoop  14 1.3.14 Cloudera Hue  14 1.4 小结  14...
精通MATLAB R2011a PDF
云计算教程

精通MATLAB R2011a PDF

精通MATLAB R2011a PDF 第1章 基础准备及入门11.1MATLAB的安装和工具包选择11.2Desktop操作桌面的启动21.2.1MATLAB的启动21.2.2Desktop操作桌面简介21.3Command Window运行入门31.3.1Command Window指令窗简介31.3.2最简单的计算器使用法31.3.3数值、变量和表达式51. 数值的记述52. 变量命名规则53. MATLAB默认的数学常数54. 运算符和表达式75. 面向复数设计的运算–MATLAB特点之一86. 面向数组设计的运算–MATLAB特点之二111.4Command Window操作要旨141.4.1指令窗的显示方式141. 默认的输入显示方式142. 运算结果显示143. 显示方式的永久设置151.4.2指令行中的标点符号151.4.3常用控制指令171.4.4指令窗中指令行的编辑171.5历史指令窗(Command History)181.5.1Command History历史指令窗简介181.5.2历史指令的再运行191.6当前目录浏览器(Current Directory)、路径设置器和文件管理191.6.1当前目录浏览器简介201.6.2用户目录和当前目录设置211.6.3MATLAB的搜索路径211.6.4MATLAB搜索路径的扩展221. 何时需要修改搜索路径222. 利用设置路径对话框修改搜索路径223. 利用指令path设置路径221.7工作空间浏览器和变量编辑器231.7.1工作空间浏览器和变量可视化231.7.2工作空间的管理指令251. 查询指令who及whos252. 从工作空间中删除变量和函数的指令clear253. 整理工作空间内存碎片的指令pack251.7.3Variable Editor变量编辑器261.7.4数据文件和变量的存取261. 借助工作空间浏览器产生保存变量的MAT文件26 截图:
大数据架构商业之路:从业务需求到技术方案
云计算教程

大数据架构商业之路:从业务需求到技术方案

大数据架构商业之路:从业务需求到技术方案 内容简介: 目前大数据技术已经日趋成熟,但是业界发现与大数据相关的产品设计和研发仍然非常困难,技术、产品和商业的结合度还远远不够。这主要是因为大数据涉及范围广、技术含量高、更新换代快,门槛也比其他大多数IT行业更高。人们要么使用昂贵的商业解决方案,要么花费巨大的精力摸索。本书通过一个虚拟的互联网O2O创业故事,来逐步展开介绍创业各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析;让读者身临其境,一起来探寻大数据的奥秘。书中会覆盖较广泛的技术点,并提供相应的背景知识介绍,对于想进一步深入研究细节的读者,也可轻松获得继续阅读的方向和指导性建议。 资源目录: 推荐序一 推荐序二 前  言 第1章 抉择 1 第2章 数据收集 4 2.1 互联网数据收集 4 2.1.1 网络爬虫 5 2.1.2 Apache Nutch简介 11 2.1.3 Heritrix简介 14 2.2 内部数据收集 15 2.2.1 Apache Flume简介 17 2.2.2 Facebook Scribe和Logstash 21 2.3 本章心得 21 2.4 参考资料 22 第3章 数据存储 23 3.1 持久化存储 23 3.1.1 Hadoop和HDFS 25 3.1.2 HBase简介 28 3.1.3 MongoDB 35 3.2 非持久化存储 37 3.2.1 缓存和散列 37...