实战大数据
云计算教程

实战大数据

实战大数据 内容简介: “数据是重要资产”已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。本书在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。 本书共12章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例,HDFS云文件系统实例。 本书适合大数据技术初学者、大数据从业人员和研究人员,也可以作为高等院校相关专业师生的教学参考书。 资源目录: 第一篇 大数据基础篇 第1章 大数据介绍 1.1 大数据相关概念 1.1.1 大数据的历史 1.1.2 大数据的定义 1.2 大数据研究内容 1.3 大数据研究现状 1.3.1 学术界现状 1.3.2 产业界现状 1.3.3 政府机构现状 1.4 大数据的应用领域 1.4.1 大数据在制造业的应用 1.4.2 大数据在服务业的应用 1.4.3 大数据在交通行业的应用 1.4.4 大数据在医疗行业的应用 1.5 本章小结 第2章 数据存储技术 2.1 数据存储技术介绍 2.2 数据采集与存储技术研究现状 2.2.1 传统关系型数据库...
大数据Spark企业级实战
云计算教程

大数据Spark企业级实战

大数据Spark企业级实战 内容简介: Spark是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是Apache软件基金会下所有开源项目中三大开源项目之一。   在“One Stack to rule them all”理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning、Graph Processing等大数据计算模型统一到一个技术堆栈中,开发者使用一致的API操作Spark中的所有功能;更为重要的是Spark的Spark SQL、MLLib、GraphX、Spark Streaming等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了Spark在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得Spark正在加速成为大数据处理中心的计算平台。   《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并且结合Spark源码细致的解析了Spark内核和四大子框架,最后在附录中提供了的Spark的开发语言Scala快速入门实战内容,学习完此书即可胜任绝大多数的企业级Spark开发需要。   《大数据Spark企业级实战》从零起步,完全从企业处理大数据业务场景的角度出发,基于实战代码来组织内容,对于一名大数据爱好者来说,《大数据Spark企业级实战》内容可以帮助您一站式地完成从零起步到进行Spark企业级开发所需要的全部核心内容和实战需要。 资源目录: 第1章 Spark编程模型 1.1 Spark:一体化、多元化的高速 大数据通用计算平台和库 1.1.1 为什么需要使用Spark 1.1.2 Spark技术生态系统简介 1.2 Spark大数据处理框架 1.2.1 Spark速度为何如此之快 1.2.2 RDD:分布式函数式编程 1.3 Spark子框架解析 1.3.1 图计算框架Spark GraphX 1.3.2 实时流处理框架 (Spark Streaming) 1.3.3 交互式SQL处理框架 Spark SQL 1.3.4...
Apache Spark源码剖析
云计算教程

Apache Spark源码剖析

Apache Spark源码剖析 内容简介: 《Apache Spark源码剖析》以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。 《Apache Spark源码剖析》第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。 《Apache Spark源码剖析》对于Spark应用开发人员及Spark集群管理人员都有极好的学习价值;对于那些想从源码学习而又不知如何入手的读者,也不失为一种借鉴。 资源目录: 第一部分Spark概述1 第1章初识Spark 3 1.1 大数据和Spark 3 1.1.1 大数据的由来4 1.1.2 大数据的分析4 1.1.3 Hadoop 5 1.1.4 Spark简介6 1.2 与Spark的第一次亲密接触7 1.2.1 环境准备7 1.2.2 下载安装Spark 8 1.2.3 Spark下的WordCount 8 第二部分Spark核心概念13 第2章Spark整体框架 15 2.1 编程模型15 2.1.1 RDD 17...
Storm技术内幕与大数据实践
云计算教程

Storm技术内幕与大数据实践

Storm技术内幕与大数据实践 内容简介:  《Storm技术内幕与大数据实践》内容主要围绕实时大数据系统的各个方面展开,从实时平台总体介绍到集群源码、运维监控、实时系统扩展、以用户画像为主的数据平台,最后到推荐、广告、搜索等具体的大数据应用。书中提到的不少问题是实际生产环境中因为数据量增长而遇到的一些真实问题,对即将或正在运用实时系统处理大数据问题的团队会有所帮助。 资源目录: 第1章 绪论   1.1 Storm的基本组件    1.1.1 集群组成    1.1.2 核心概念    1.1.3 Storm的可靠性    1.1.4 Storm的特性   1.2 其他流式处理框架    1.2.1 Apache S4    1.2.2 Spark Streaming    1.2.3 流计算和Storm的应用  第2章 实时平台介绍   2.1 实时平台架构介绍   2.2 Kafka架构    2.2.1 Kafka的基本术语和概念    2.2.2 Kafka在实时平台中的应用    2.2.3 消息的持久化和顺序读写    2.2.4 sendfile系统调用和零复制    2.2.5 Kafka的客户端    2.2.6 Kafka的扩展   2.3 大众点评实时平台    2.3.1 相关数据    2.3.2 实时平台简介    2.3.3 Blackhole   2.4 1号店实时平台  第3章 Storm集群部署和配置   3.1 Storm的依赖组件   3.2 Storm的部署环境   3.3 部署Storm服务    3.3.1 部署ZooKeeper    3.3.2 部署Storm    3.3.3 配置Storm   3.4 启动Storm   3.5 Storm的守护进程   3.6 部署Storm的其他节点   3.7 提交Topology  第4章 Storm内部剖析   4.1 Storm客户端   4.2 Nimbus    4.2.1 启动Nimbus服务    4.2.2 Nimbus服务的执行过程 ...
Python项目开发实战 第2版 中文_Python教程
Python教程

Python项目开发实战 第2版 中文_Python教程

资源名称:Python项目开发实战 第2版 中文 第1部分 Python开发入门 1 第1章 Python入门 2 第2章 开发Web应用 24 第3章 Python项目的结构与包的创建 48 第2部分 团队开发的周期 87 第4章 面向团队开发的工具 88 第5章 项目管理与审查 104 第6章 用Mercurial管理源码 125 第7章 完备文档的基础 162 第8章 模块分割设计与单元测试 191 第9章 Python封装及其运用 224 第10章 用Jenkins持续集成 237 第3部分 服务公开 269 第11章 环境搭建与部署的自动化 270 第12章 应用的性能改善 298 第4部分 加速开发的技巧 315 第13章 让测试为我们服务 316 第14章 轻松使用Django 327 第15章 方便好用的Python模块 355 资源截图:
精通Python设计模式 (Sakis Kasampalis) 中文高清_Python教程
Python教程

精通Python设计模式 (Sakis Kasampalis) 中文高清_Python教程

资源名称:精通Python设计模式 (Sakis Kasampalis) 中文高清 第一部分 创建型模式 第1章 工厂模式  2 第2章 建造者模式  18 第3章 原型模式  30 第二部分 结构型模式 第4章 适配器模式  40 第5章 修饰器模式  46 第6章 外观模式  53 第7章 享元模式  61 第8章 模型—视图—控制器模式  67 第9章 代理模式  74 第三部分 行为型模式 第10章 责任链模式  84 第11章 命令模式  92 第12章 解释器模式  101 第13章 观察者模式  110 第14章 状态模式  118 第15章 策略模式  127 第16章 模板模式  135 资源截图:
用Python写网络爬虫 (理查德 劳森) 中文_Python教程
Python教程

用Python写网络爬虫 (理查德 劳森) 中文_Python教程

资源名称:用Python写网络爬虫 (理查德 劳森) 中文 第1章 网络爬虫简介 1 第2章 数据抓取 23 第3章 下载缓存 39 第4章 并发下载 57 第5章 动态内容 69 第6章 表单交互 89 第7章 验证码处理 103 第8章 Scrapy 121 第9章 总结 143 资源截图:
真实世界的Python仪器监控:数据采集与控制系统自动化 中文_Python教程
Python教程

真实世界的Python仪器监控:数据采集与控制系统自动化 中文_Python教程

资源名称:真实世界的Python仪器监控:数据采集与控制系统自动化 中文 第1章 仪器学概论 第2章 基本电子学 第3章 Python编程语言 第4章 C语言编程 第5章 Python扩展 第6章 硬件:工具与耗材 第7章 物理接口 第8章 开始干吧 第9章 控制系统概念 第10章 构建并使用仿真器 第11章 仪器数据I/O 第12章 读写数据文件 第13章 用户界面 第14章 实例 资源截图: