大數據分析Excel Power BI全方位應用
云计算教程

大數據分析Excel Power BI全方位應用

大數據分析Excel Power BI全方位應用 内容简介: 隨著電腦技術的發展,資料存儲量呈現倍增成長,以資料採礦為核心的Business Intelligence(BI)顯然成為IT和其他行業的必爭之地,同時市場潮流Big Data讓巨量資料分析變得更重要,商業智慧也順理成章成為企業注重的一環,專業的分析人員更是市場人才寵兒。 基於此利基Microsoft Excel Power BI實現在數據分析與商業智慧分析領域,達到方便且有效率的作業模式。使用Excel Power BI可迅速完成以往只有透過專業商業智慧工具或花費大量時間才能完成的任務,它同時提供蒐集合併清理內外部資料來源功能(Power Query)、精華版OLAP工具(Power Pivot)、視覺化分析資料探索(Power View)與2D/3D地圖資訊分析(Power Map),協助企業能夠整合來自不同來源的巨量資料並轉化成資訊和洞察,應用在市場策略上,最終達到令人滿意的效果。 ■ 瞭解自助式商業智慧分析流程,提升人員決策能力 ■ 學習利用Excel 2016 Power BI工具建立視覺化圖表分析 ■ 學習如何從大眾熟悉的Excel環境使用Power Pivot、Power View、Power Map與Power Query ■ 內容逐步實際操作,從入門到進階,縮短學習時間,讓您有效率的抓住學習重點 ■ 帶領初學者快速掌握Power BI Desktop的使用技巧 资源目录: CH01 Power BI概論 CH02 Power Pivot精簡版OLAP CH03 Power View資料探索智慧視覺(...
华为出品:分布式云数据中心的建设与管理
云计算教程

华为出品:分布式云数据中心的建设与管理

华为出品:分布式云数据中心的建设与管理 内容简介: 目前,数量众多的数据中心给企业、政府机关带来了非常沉重的运维负担。业界流行的云计算技术还旨在解决单个数据中心内部的问题,无法解决多个数据中心之间资源共享、统一管理、提升业务服务质量的问题。华为分布式云数据中心(DistributedCloud Data Center,DC2)将传统的分散、分层、异构的传统数据中心架构,改造为全扁平式、点到点全互联、统一资源管理的分布式云数据中心架构,将多个不同地域、不同阶段、不同规模的数据中心所有资源通过逻辑集中,统一管理、统一呈现、统一运营,从而充分利用企业已有资源,支撑企业ICT服务能力高速发展。 华为分布式云数据中心市场反应颇佳,已有多个国际性项目在操作,其中某国际著名的运营商有近90个数据中心的改造需求、非洲某国家要建立9个联动的数据中心。2013年,分布式云数据中心的发布新闻稿还在巴塞罗那电信展被展会官方引用。市场急需这样一本介绍分布式云数据中心的建设与管理的图书,为企业、政府机关解燃眉之急。 资源目录: 第1章 云数据中心的历史和发展趋势 1.1 云计算给数据中心带来的变革和好处 1.2 云数据中心3.0:分布式云数据中心的定义 1.3 分布式云数据中心是数据中心发展的必然趋势 第2章 分布式云数据中心提供的关键服务与关键技术 2.1 分布式云数据中心总体架构 2.2  DCaaS服务介绍 2.3 IaaS服务关键技术:数据中心云操作系统 2.4 NaaS服务关键技术:TRILL,VXLAN,SDN 2.5 MaaS服务关键技术:自动化和管理系统 2.6 管理解决方案 第3章 IaaS的规划与建设 3.1 IaaS的规划 3.2 计算资源池的建设 3.3 存储资源池的建设 第4章 NaaS的规划与建设 4.1 Naas的规划 4.2 网络资源池的建设 应用举例 4.3 安全解决方案的建设 第5章 MaaS的设计与建设 5.1 数据中心运维管理 5.2...
Hadoop技术内幕_深入解析HADOOP_COMMON和HDFS架构设计与实现原理
云计算教程

Hadoop技术内幕_深入解析HADOOP_COMMON和HDFS架构设计与实现原理

Hadoop技术内幕_深入解析HADOOP_COMMON和HDFS架构设计与实现原理 内容简介: 《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》内容简介:“Hadoop技术内幕”共两册,分别从源代码的角度对“Common+HDFS”和MapReduce的架构设计与实现原理进行了极为详细的分析。《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》由腾讯数据平台的资深Hadoop专家、X-RIME的作者亲自执笔,对Common和HDFS的源代码进行了分析,旨在为Hadoop的优化、定制和扩展提供原理性的指导。除此之外,《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》还从源代码实现中对分布式技术的精髓、分布式系统设计的优秀思想和方法,以及Java语言的编码技巧、编程规范和对设计模式的精妙运用进行了总结和分析,对提高读者的分布式技术能力和Java编程能力都非常有帮助。《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》适合Hadoop的二次开发人员、应用开发工程师、运维工程师阅读。 全书共9章,分为三部分:第一部分(第1章)主要介绍了Hadoop源代码的获取和源代码阅读环境的搭建;第二部分(第2~5章)对Hadoop公共工具Common的架构设计和实现原理进行了深入分析,包含Hadoop的配置信息处理、面向海量数据处理的序列化和压缩机制、Hadoop的远程过程调用,以及满足Hadoop上各类应用访问数据的Hadoop抽象文件系统和部分具体文件系统等内容;第三部分(第6~9章)对Hadoop的分布式文件系统HDFS的架构设计和实现原理进行了详细的分析,这部分内容采用了总分总的结构,第6章对HDFS的各个实体和实体间接口进行了分析;第7章和第8章分别详细地研究了数据节点和名字节点的实现原理,并通过第9章对客户端的解析,回顾了HDFS各节点间的配合,完整地介绍了一个大规模数据存储系统的实现。 资源目录: 前 言 第一部分 环境准备 第1章 源代码环境准备/ 2 1.1 什么是Hadoop / 2 1.1.1 Hadoop简史/ 2 1.1.2 Hadoop的优势/ 3 1.1.3 Hadoop生态系统/ 4 1.2 准备源代码阅读环境/ 8 1.2.1 安装与配置JDK / 8 1.2.2 安装Eclipse / 9 1.2.3 安装辅助工具Ant/ 12 1.2.4 安装类UNIX Shell环境Cygwin / 13 1.3 准备Hadoop源代码/ 15 1.3.1 下载Hadoop / 15 1.3.2 创建Eclipse项目/ 16 1.3.3 Hadoop源代码组织/ 18 1.4 小结/...
大数据日知录:架构与算法
云计算教程

大数据日知录:架构与算法

大数据日知录:架构与算法 内容简介: 大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。 《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的知识梳理与讲解,相信对于读者整体和系统地了解、吸收和掌握相关的优秀技术有极大的帮助与促进作用。 《大数据日知录:架构与算法》的读者对象包括对NoSQL 系统及大数据处理感兴趣的所有技术人员,以及有志于投身到大数据处理方向从事架构师、算法工程师、数据科学家等相关职业的在校本科生及研究生。 资源目录: 第0 章 当谈论大数据时我们在谈什么……………. 1 第1 章 数据分片与路由………………………………………. 9 第2 章 数据复制与一致性…………………………………………20 第3 章 大数据常用的算法与数据结构………………………………51 第4 章 集群资源管理与调度…………………………………71 第5 章 分布式协调系统……………………………..91 第6 章 分布式通信…………………………106 第7 章 数据通道…………………………………..120 第8 章 分布式文件系统………………………………131 第9 章 内存KV 数据库……………………………..168 第10 章 列式数据库…………………………………….176 第11 章 大规模批处理系统……………………………..199...
Hadoop技术内幕深入解析YARN架构设计与实现原理
云计算教程

Hadoop技术内幕深入解析YARN架构设计与实现原理

Hadoop技术内幕深入解析YARN架构设计与实现原理 内容简介: 本书从应用角度系统讲解了YARN的基本库和组件用法、应用程序设计方法、YARN上流行的各种计算框架(MapReduce、Tez、Storm、Spark),以及多个类YARN的开源资源管理系统(Corona和Mesos);从源代码角度深入分析YARN的设计理念与基本架构、各个组件的实现原理,以及各种计算框架的实现细节。 全书共四部分13章:第一部分(第1~2章)主要介绍了如何获取、阅读和调试Hadoop的源代码,以及YARN的设计思想、基本架构和工作流程;第二部分(第3~7章)结合源代码详细剖析和讲解了YARN的第三方开源库、底层通信库、服务库、事件库的基本使用和实现细节,详细讲解了YARN的应用程序设计方法,深入讲解和分析了ResourceManager、资源调度器、NodeManager等组件的实现细节;第三篇(第8~10章)则对离线计算框架MapReduce、DAG计算框架Tez、实时计算框架Storm和内存计算框架Spark进行了详细的讲解;第四部分(第11~13章)首先对Facebook Corona和Apache Mesos进行了深入讲解,然后对YARN的发展趋势进行了展望。附录部分收录了YARN安装指南、YARN配置参数以及Hadoop Shell命令等非常有用的资料。 资源目录: 前 言 第一部分 准备篇 第1章 环境准备 2 1.1 准备学习环境 2 1.1.1 基础软件下载 2 1.1.2 如何准备Linux环境 3 1.2 获取Hadoop源代码 5 1.3 搭建Hadoop源代码阅读环境 5 1.3.1 创建Hadoop工程 5 1.3.2 Hadoop源代码阅读技巧 8 1.4 Hadoop源代码组织结构 10 1.5 Hadoop初体验 12 1.5.1 搭建Hadoop环境 12 1.5.2 Hadoop Shell介绍 15 1.6 编译及调试Hadoop源代码 16 1.6.1 编译Hadoop源代码 17 1.6.2 调试Hadoop源代码 18 1.7 小结 20 第2章 YARN设计理念与基本架构 21 2.1 YARN产生背景...