Splunk大数据分析
云计算教程

Splunk大数据分析

Splunk大数据分析 内容简介: Splunk是一种典型的大数据处理工具,能够高效地按时序对数据进行存储、索引、访问,已广泛应用在多个领域。本书是介绍如何实时处理大数据并从中获得商业价值的一本实用指南。本书通过真实的大数据分析项目,从数据导入、访问、挖掘和可视化角度全面而系统地介绍Splunk的基本概念和使用方法,以帮助读者快速掌握Splunk。 全书共16章,分为四个部分:第一部分(第1~7章)介绍Splunk的基本操作,包括利用Splunk进行数据收集、处理、分析及结果可视化等的基本操作和命令,以及使用日志文件创建高级数据分析报表的方法;第二部分(第8~11章)使用“航空公司准点性能数据”介绍一个典型的数据分析案例,详细讲解如何运用Splunk深度挖掘现有数据仓库,并介绍一些新的Splunk命令和实用技巧;第三部分(第12~14章)详细介绍如何收集、处理、分析推文和Foursquare的签到信息等,涵盖分析社会化媒体流数据所需的知识;第四部分(第15~16章)详细介绍如何按需求扩展Splunk,以及分布式处理和高可用性的基本概念。此外,还包括两个附录,展示Splunk的性能以及各种可用的应用程序。 资源目录: 第1章 大数据和Splunk / 1 1.1 什么是大数据 / 1 1.2 非传统的数据处理技术 / 5 1.3 Splunk是什么 / 6 1.4 关于本书 / 7 第2章 将数据导入Splunk / 9 2.1 数据的多样性 / 9 2.2 Splunk如何处理多样化的数据 / 10 2.2.1 文件和目录 / 11 2.2.2 数据生成器 / 16 2.2.3 生成样本数据 / 17 2.2.4 网络资源 / 21 2.2.5 Windows数据 / 21 2.2.6 其他资源 /...
数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版
云计算教程

数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版

数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版 第1章二次排序:简介 19第2章二次排序:详细示例 42第3章 Top 10 列表 54第4章左外连接 96第5章反转排序 127第6章移动平均 137第7章购物篮分析 155第8章共同好友 182第9章使用MapReduce实现推荐引擎 201第10章基于内容的电影推荐 225第11章使用马尔可夫模型的智能邮件营销 .253第12章 K-均值聚类 282第13章 k-近邻 296第14章朴素贝叶斯 315第15章情感分析 349第16章查找、统计和列出大图中的所有三角形 354第17章 K-mer计数 375第18章 DNA测序 390第19章 Cox回归 413第20章 Cochran-Armitage趋势检验 426第21章等位基因频率 443第22章 T检验 468第23章皮尔逊相关系数 488第24章 DNA碱基计数 520第25章 RNA测序 543第26章基因聚合 553第27章线性回归 586第28章 MapReduce和幺半群 600第29章小文件问题 622第30章 MapReduce的大容量缓存...
炼数-数据分析与SPSS(完整)共12周
云计算教程

炼数-数据分析与SPSS(完整)共12周

炼数-数据分析与SPSS(完整)共12周 教程内容: 第一周  SPSS概览, SPSS安装与进入,数据文件的管理, 建立与保存数据文件-File,能够编辑数据文件,从原有变量计算新变量 第 二周  Descriptive Statistics菜单, Frequencies,Explore,Crosstabs过程,Compare Means菜单, Means过程,One-Samples T Test过程,Independent-Samples TTest过程 第三周  Compare Means菜单, General Linear Model菜单,两因素方差分析,univarate协方差分析,其他较简单的方差分析问题  第四周  General Linear Model菜单,多元方差分析,重复测量的方差分析 , Correlate菜单 第五周  Regression菜单,Linear过程      ,Binary Logistic过程,NonparametricTests菜单  第六周  SPSS结果窗口用法,结果浏览窗口,掌握WORD等软件中使用输出结果,进行图片编辑, SPSS统计绘图功能, 常用统计图 ,因素分析 第七周  SPSS Clementine软件功能演练,熟悉SPSS Clementine软件功能,了解SPSS Clementine 软件的各选项面板和操作方法。  ...
基于Apache Kylin 构建大数据分析平台
云计算教程

基于Apache Kylin 构建大数据分析平台

基于Apache Kylin 构建大数据分析平台  内容简介: Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay公司开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。 本书分为21章,详细讲解Apache Kylin概念、安装、配置、部署,让读者对Apache Kylin构建大数据分析平台有一个感性认识。同时,本书从应用角度,结合Dome和实例介绍了用于多维分析的Cube算法的创建、配置与优化。最后还介绍了Kyligence公司发布KAP大数据分析平台,对读者有极大的参考价值。 本书适合大数据技术初学者、大数据分析人员、大数据架构师等,也适合用于高等院校和培训学校相关专业师生教学参考。 资源目录: 第一部分 Apache Kylin基础部分 第1章 Apache Kylin前世今生 3 1.1 Apache Kylin的背景 3 1.2 Apache Kylin的应用场景 3 1.3 Apache Kylin的发展历程 4 第2章 Apache Kylin前奏 7 2.1 事实表和维表 7 2.2 星型模型和雪花型模型 7 2.2.1 星型模型 7 2.2.2 雪花型模型 8...
高性能Docker PDF
云计算教程

高性能Docker PDF

高性能Docker PDF 内容简介: 《高性能Docker》共分8 章,旨在帮助读者改善其Docker 工作流,并保证应用在生产环境中顺利进行。 《高性能Docker》中简单回顾了Docker 是如何工作的。除了Docker 的基础知识外,读者还会学到如何优化Docker基础架构和大规模应用。《高性能Docker》最后讲解的如何在基础架构中部署监控和故障排除系统,更是可以让读者更好地将学到的Docker 的特性、概念等运用到实践中。 如果你对于管理Docker 服务和Linux 文件系统有充分的理解,并希望优化你的Docker 容器,那《高性能Docker》将非常适合你。 作者简介: Allan Espinosa 是一名生活在东京的DevOps 从业者,他是很多分布式系统工具的活跃的开源贡献者,比如Docker 和Chef。Allan 维护了若干个流行的开源软件的Docker镜像,这些镜像甚至比开源团体的官方发布版还要流行。 在他的职业生涯中,Allan 还管理过一些大型分布式系统,包含生产环境中的数百到数千台服务器。他在不同的平台上构建了很多大规模应用,从美国的大型超级计算中心到日本的生产环境企业系统。 资源目录: 前言 ……………………………………………………………………………………….XI 1 准备Docker 宿主机 ……………………………………………………………………….. 1 准备一个Docker 宿主机 …………………………………………………………………………………………1 使用Docker 镜像 ……………………………………………………………………………………………………2 编译Docker 镜像 ………………………………………………………………………………………………. 3 推送Docker 镜像到资源库 ………………………………………………………………………………… 4 从资源库中拉取Docker...
Citrix整套环境部署系列详细文档教程
云计算教程

Citrix整套环境部署系列详细文档教程

教程名称:Citrix整套环境部署系列详细文档教程 课程目录: Citrix Environment Deployment Document_License Server Citrix Environment Deployment Document_VDI-in-a-Box 5.2 Citrix Environment Deployment Document_XenAPP 6.5 Citrix Environment Deployment Document_XenDesktop 5.6 Citrix Environment Deployment Document_XenServer 6.0 Domain Controller  
云计算系列讲座视频(13集)
云计算教程

云计算系列讲座视频(13集)

教程名称:中科院云计算系列讲座视频(13集) 课程目录: 中科院云计算系列讲座01 中科院云计算系列讲座02 中科院云计算系列讲座03 中科院云计算系列讲座04 中科院云计算系列讲座05 中科院云计算系列讲座06 中科院云计算系列讲座07 中科院云计算系列讲座08 中科院云计算系列讲座09 中科院云计算系列讲座10 中科院云计算系列讲座11 中科院云计算系列讲座12 中科院云计算系列讲座13