Python数据科学导论 PDF 下载_Python教程
资源名称:Python数据科学导论 PDF 下载 内容简介: 本书涵盖的主题非常广泛,介绍了数据科学方方面面的知识,每一章都侧重于介绍数据科学的某一方面,为读者以后的深入学习打下基础。具体内容包括:第1、2章系统介绍大数据科学的背景知识及框架结构;第3~5章介绍机器学习相关知识;第6~9章介绍几个比较有趣的数据科学主题。本书是学习数据科学知识的入门教材,在深入学习本书的实例前,需要掌握SQL、Python及HTML5的入门知识,了解统计学和机器学习相关知识。 资源目录: 译者序 前言 关于本书 关于作者 关于封面插图 第1章 大数据世界中的数据科学1 1.1 数据科学和大数据的好处和用途2 1.2 数据种类3 1.2.1 结构化数据3 1.2.2 非结构化数据3 1.2.3 自然语言数据4 1.2.4 计算机数据4 1.2.5 图类数据5 1.2.6 音频、视频和图像数据5 1.2.7 流数据6 1.3 数据科学过程6 1.3.1 设置研究目标6 1.3.2 检索数据6 1.3.3 数据准备7 1.3.4 数据探索7 1.3.5 数据建模7 1.3.6 展示与自动化7 1.4 大数据生态系统与数据科学7 1.4.1 分布式文件系统7 1.4.2 分布式编程框架9 1.4.3 数据集成框架9 1.4.4 机器学习框架9 1.4.5 NoSQL数据库10 1.4.6 调度工具10 1.4.7 基准测试工具10 1.4.8 系统部署11 1.4.9 服务开发11 1.4.10 安全11 1.5 Hadoop工作示例介绍11 1.6 本章小结16 第2章 数据科学过程17 2.1 数据科学过程概述17 2.2 步骤1:定义研究目标并创立项目章程19 2.2.1 了解研究的目标和背景20 2.2.2 创立项目章程20...