matplotlib手册 中文_Python教程
Python教程

matplotlib手册 中文_Python教程

资源名称:matplotlib手册 中文 本书的目的是让你能快速知道怎么使用matplotlib,当然个人所总结的方法未必对于每个人都是容易接受的,但相信大多数人看完本书之后会对于matplotlib有一个比较清晰的理解, 本书是对于学习中需要用到matplotlib的人群编写的,你在阅读之前可能需要了解一些Python的知识,如果你对于Python还一点不懂,那么还是请你看下Python相关的文档吧; matplotlib是一个在Python下实现的类matlib的纯Python的三方库,旨在用Python实现matlab的功能,是Python下最出色的绘图库,功能很完善,其风格跟matlib很相似。同时也继承了Python的简单明了的风格,其可以很方便的设计和输出二维以及三维的数据,其提供了常规的笛而卡坐标,极坐标,球坐标,三维坐标等,其输出的图片质量也达到了科技论文中的印刷质量,日常的基本绘图更不在话下 资源截图:
使用Python分析社交网络数据 中文_Python教程
Python教程

使用Python分析社交网络数据 中文_Python教程

资源名称:使用Python分析社交网络数据 中文 在线社交网站为人们提供了一个构建社会关系网络和互动的平台。 每一个人和组织都可以通过社交网站互动、 获取信息并发出自 己的声音,因而吸引 了众多的使用者。 作为一个复杂的社会系统, 在线社交网站真实地记录了社会网络的增长以及人类传播行为演化。 通过抓取并分析在线社交网站的数据, 研究者可以迅速地把握人类社交网络行为背后所隐藏的规律、 机制乃至一般性的法则。 资源截图:
Python安装、配置图文详解 中文_Python教程
Python教程

Python安装、配置图文详解 中文_Python教程

资源名称:Python安装、配置图文详解 中文 Python在Linux、windows、Mac os等操作系统下都有相应的版本,不管在什么操作系统下,它都能够正常工作。除非使用平台相关功能,或特定平台的程序库,否则可以跨平台使用。本文档主要讲述了Python安装、配置图文详解 资源截图:
Python图表绘制:matplotlib绘图库入门 中文_Python教程
Python教程

Python图表绘制:matplotlib绘图库入门 中文_Python教程

资源名称:Python图表绘制:matplotlib绘图库入门 中文 matplotlib是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。 它的文档相当完备,并且Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。 在Linux下比较著名的数据图工具还有gnuplot,这个是免费的, Python有一个包可以调用gnuplot,但是语法比较不习惯,而且画图质量不高。 而 Matplotlib则比较强:Matlab的语法、python语言、latex的画图质量(还可以使用内嵌的latex引擎绘制的数学公式)。 matplotlib 实际上是一套面向对象的绘图库,它所绘制的图表中的每个绘图元素,例如线条Line2D、文字 Text、刻度等在内存中都有一个对象与之对应。 资源截图:
数据架构 大数据、数据仓库以及DATA VAULT
云计算教程

数据架构 大数据、数据仓库以及DATA VAULT

数据架构 大数据、数据仓库以及DATA VAULT 内容简介: 本书是数据仓库之父Inmon的新作,探讨数据的架构和如何在现有系统中最有效地利用数据。本书的主题涵盖企业数据、大数据、数据仓库、Data Vault、业务系统和架构。主要内容包括:在分析和大数据之间建立关联,如何利用现有信息系统,如何导出重复型数据和非重复型数据,大数据以及使用大数据的商业价值,等等。 本书的读者对象包括数据工程技术人员、管理人员以及从事数据分析和研究的科研人员。 资源目录: 第1章 企业数据  1 1.1 企业数据  1 1.1.1 企业的全体数据  1 1.1.2 非结构化数据的划分  2 1.1.3 业务相关性  3 1.1.4 大数据  3 1.1.5 分界线  4 1.1.6 大陆分水岭  5 1.1.7 企业数据全貌  6 1.2 数据基础设施  6 1.2.1 重复型数据的两种类型  7 1.2.2 重复型结构化数据  7 1.2.3 重复型大数据  8 1.2.4 两种基础设施  9 1.2.5 优化了什么  10 1.2.6 对比两种基础设施  11 1.3 分界线  12 1.3.1 企业数据分类  12 1.3.2 分界线  12 1.3.3 重复型非结构化数据  13 1.3.4 非重复型非结构化数据  15 1.3.5 不同的领域  17 1.4 企业数据统计图  17 1.5 企业数据分析  22 1.6 数据的生命周期——随时间推移理解数据  27 1.7 数据简史  31 1.7.1 纸带和穿孔卡片  31 1.7.2 磁带  32 1.7.3 磁盘存储器  32 1.7.4 数据库管理系统  32 1.7.5 耦合处理器  33 1.7.6 在线事务处理  33 1.7.7 数据仓库  34 1.7.8 并行数据管理  34 1.7.9 Data Vault  35 1.7.10 大数据  35 1.7.11 分界线  35...
Spark零基础实战
云计算教程

Spark零基础实战

Spark零基础实战 内容简介: Spark是业界公认的近几年发展快、受关注度的一体化多元化的大数据计算技术,可以同时满足不同业务场景和不同数据规模的大数据计算的需要。 本书首先通过代码实战的方式对学习Spark前必须掌握的Scala内容进行讲解并结合Spark源码的阅读来帮助读者快速学习Scala函数式编程与面向对象完美结合的编程艺术,接着对Hadoop和Spark集群安装部署以及Spark在不同集成开发环境的开发实战作出了详细的讲解,然后基于大量的实战案例来讲解Spark核心RDD编程并深度解密RDD的密码,并且通过实战的方式详解了TopN在Spark RDD中的实现,为了让读者彻底了解Spark,本书用了大量的篇幅详细解密了Spark的高可用性、内核架构、运行机制等内容。 Spark零基础实战这本书定位于零基础的学员,也可以作为有一定大数据Hadoop经验的从业者以及对大数据非常感兴趣的学生的本Spark入门书籍。 截图:
用户网络行为画像 大数据中的用户网络行为画像分析与内容推荐应用
云计算教程

用户网络行为画像 大数据中的用户网络行为画像分析与内容推荐应用

用户网络行为画像 大数据中的用户网络行为画像分析与内容推荐应用 内容简介: 如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这个问题的方法就是推荐系统。本书分为上中下三篇,共13章,上篇为用户画像知识工程基础,包括表征建模、画像计算、存储及各种更新维护等管理操作;中篇为推荐系统与用户画像,包括传统协同过滤等经典推荐算法的介绍,以及涉及用户画像的推荐方法;下篇为应用案例分析,包括Netflix、阿里等数据竞赛的经典数据案例,以及在具体工程开发过程的具体案例,分别从系统需求、总体结构、算法设计、运行流程及测试结果等五个方面提供详细案例指导。 资源目录: 上 篇 第1章 用户画像概述 3 1.1 用户画像数据来源 3 1.1.1 用户属性 5 1.1.2 用户观影行为 5 1.2 用户画像特性 5 1.2.1 动态性 5 1.2.2 时空局部性 6 1.3 用户画像应用领域 6 1.3.1 搜索引擎 6 1.3.2 推荐系统 7 1.3.3 其他业务定制与优化 7 1.4 大数据给用户画像带来的机遇与挑战 8 第2章 用户画像建模 9...
深入云计算:Hadoop应用开发实战详解(修订版)
云计算教程

深入云计算:Hadoop应用开发实战详解(修订版)

深入云计算:Hadoop应用开发实战详解(修订版) 内容简介: 本书由浅入深,全面、系统地介绍了Hadoop这一高性能处理大量数据集的理想工具。本书内容主要包括HDFS、MapReduce、Hive、HBase、Mahout、Pig、ZooKeeper、Avro、Chukwa等与Hadoop相关的子项目,各个知识点都配有精心设计的大量经典的小案例,实战性和可操作性强。 本书旨在帮助云计算初学者迅速掌握Hadoop系统,提升读者在云计算实践中的应用和开发能力。同时本书极强的系统性和大量翔实的案例对于有一定基础的中高级用户有非常好的参考价值 截图:
Hadoop安全:大数据平台隐私保护
云计算教程

Hadoop安全:大数据平台隐私保护

Hadoop安全:大数据平台隐私保护 内容简介: 《Hadoop安全 大数据平台隐私保护》阐述了Hadoop从早期开放的消费互联网时代到现在作为敏感数据可信平台的演变历程,介绍了包括身份验证、加密、密钥管理和商业实践在内的诸多主题,并在实际环境下加以讨论。第1章是介绍性内容,随后分为四大部分:*部分是安全架构,第二部分是验证、授权和安全审计,第三部分是数据安全,第四部分是归纳总结。*后介绍了几个使用案例,融合了书中诸多概念。 《Hadoop安全 大数据平台隐私保护》适合对Hadoop感兴趣的读者,有大数据平台保护需求的读者。 资源目录: 序  xi 前言  xii 第1章 引言  1 1.1 安全概览  1 1.1.1 机密性  2 1.1.2 完整性  2 1.1.3 可用性  2 1.1.4 验证、授权和审计  3 1.2 Hadoop 安全:简史  5 1.3 Hadoop 组件和生态系统  5 1.3.1 Apache HDFS  6 1.3.2 Apache YARN  7 1.3.3 Apache MapReduce  8 1.3.4 Apache Hive  9 1.3.5 Cloudera Impala  9 1.3.6 Apache Sentry  10 1.3.7 Apache HBase  11 1.3.8 Apache Accumulo  11 1.3.9 Apache Solr  13 1.3.10 Apache Oozie  13 1.3.11 Apache ZooKeeper  13 1.3.12 Apache Flume  13 1.3.13 Apache Sqoop  14 1.3.14 Cloudera Hue  14 1.4 小结  14...