Hadoop大数据分析与挖掘实战 完整pdf
云计算教程

Hadoop大数据分析与挖掘实战 完整pdf

Hadoop大数据分析与挖掘实战 完整pdf 第1章 数据挖掘基础2第2章 Hadoop基础16第3章 Hadoop生态系统:Hive34第4章 Hadoop生态系统:HBase46第5章 大数据挖掘建模平台62第6章 挖掘建模69第7章 法律咨询数据分析与服务推荐112第8章 电商产品评论数据情感分析146第9章 航空公司客户价值分析170第10章 基站定位数据商圈分析184第11章 互联网电影智能推荐196第12章 家电故障备件储备预测分析204第13章 市供水混凝投药量控制分析218第14章 基于图像处理的车辆压双黄线检测240第15章 基于Mahout的大数据挖掘开发254第16章 基于TipDM-HB的数据挖掘二次开发272  截图:
深入理解OpenStack Neutron
云计算教程

深入理解OpenStack Neutron

深入理解OpenStack Neutron 内容简介: 本书共8章。第1章讲解Neutron概况。第2章介绍了Linux的虚拟网络知识。第3章讲述了Neutron的实现模型。第4章讲述的Neutron的资源模型。第5章讲述了Neutron的基本架构,以及架构中所涉及的Web机制、通信机制、并发机制等。第6章深入介绍Neutron启动服务的流程、通信机制与实现等。第7章深入分析了Neutron插件的驱动、消息处理机制。第8章详细讲解了Neutron代理(OVS与L3)的实现。 资源目录: 序 前 言 第1章 Neutron概述 1 1.1 Neutron的由来 1 1.2 Neutron的特性与应用 3 1.2.1 基于OpenStack的应用 4 1.2.2 基于SDN的应用 6 1.3 Neutron的扩展能力 8 1.4 本章小结 9 第2章 Linux虚拟网络基础 11 2.1 tap 11 2.2 namespace 13 2.3 veth pair 16 2.4 Bridge 17 2.5 Router 19 2.6 tun 21 2.7 iptables 24 2.7.1 NAT 27 2.7.2 Firewall 30 2.7.3 mangle 32 2.8 本章小结 32...
企业大数据系统构建实战:技术、架构、实施与应用
云计算教程

企业大数据系统构建实战:技术、架构、实施与应用

企业大数据系统构建实战:技术、架构、实施与应用 内容简介: 本书分13章,分别从企业大数据战略定位、企业大数据落地实施和价值评估,以及大数据的变革与挑战这三大方面进行撰写,宏观上涵盖了企业战略决策和定位,微观上涵盖了大数据职能、思路、方法、流程、开发、应用、评估的整个环节。企业大数据的知识完整性也是本书的特色之一。 资源目录: 前言 第1章企业大数据战略定位 1 1.1宏观 1 1.2微观 4 1.2.1资源协同 5 1.2.2战略定位 6 1.2.3启动契机 7 1.2.4大数据历程 9 1.3本章小结 12 第2章企业大数据职能规划 13 2.1大数据组织架构体系 13 2.1.1大数据部门在企业中的角色 13 2.1.2常见的大数据职能及职责 17 2.2大数据职位构建体系 24 2.2.1基础平台类 24 2.2.2数据管理类 26 2.2.3技术研发类 27 2.2.4产品设计类 30 2.2.5数据挖掘类 32 2.2.6数据分析类 33 2.3大数据制度和流程规范 35 2.3.1制度和流程规范意义...
ELK Stack权威指南 第2版
云计算教程

ELK Stack权威指南 第2版

ELK Stack权威指南 第2版 内容简介: ELK是Elasticsearch、Logstash、Kibana三个开源软件的组合,是目前开源界流行的实时数据分析方案,成为实时日志处理领域开源界的第壹选择。然而,ELK也并不是实时数据分析界的灵丹妙药,使用不恰当,反而会事倍功半。本书对ELK的原理进行了解剖,不仅分享了大量实战案例和实现效果,而且分析了部分源代码,使读者不仅知其然还知其所以然。读者可通过本书的学习,快速掌握实时日志处理方法,并搭建符合自己需要的大数据分析系统。本书分为三大部分,第壹部分“Logstash”介绍Logstash的安装与配置、场景示例、性能与测试、扩展方案、源码解析、插件开发等,第二部分“Elasticsearch”介绍Elasticsearch的架构原理、数据接口用例、性能优化、测试和扩展方案、映射与模板的定制、监控方案等,第三部分“Kibana”介绍Kibana3和Kibana5的特点对比,Kibana的配置、案例与源代码解析。 作者简介: 饶琛琳,新浪网系统架构师,曾任人人网技术专家,中华网高级运维工程师等职位。参与了大规模系统的运维监控设计与自动化平台建设,对CDN架构、系统监控和日志分析都有丰富的经验。乐于分享,是ElasticsearchChina用户组负责人之一,活跃于Puppet和Logstash等开源社区,分享了大量技术文章。 截图:
Apache Spark源码剖析
云计算教程

Apache Spark源码剖析

Apache Spark源码剖析 内容简介: 《Apache Spark源码剖析》以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。 《Apache Spark源码剖析》第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。 《Apache Spark源码剖析》对于Spark应用开发人员及Spark集群管理人员都有极好的学习价值;对于那些想从源码学习而又不知如何入手的读者,也不失为一种借鉴。 资源目录: 第一部分Spark概述1 第1章初识Spark 3 1.1 大数据和Spark 3 1.1.1 大数据的由来4 1.1.2 大数据的分析4 1.1.3 Hadoop 5 1.1.4 Spark简介6 1.2 与Spark的第一次亲密接触7 1.2.1 环境准备7 1.2.2 下载安装Spark 8 1.2.3 Spark下的WordCount 8 第二部分Spark核心概念13 第2章Spark整体框架 15 2.1 编程模型15 2.1.1 RDD 17...