水木
水木
发布于 2024-08-22 / 12 阅读
0

大数据分析――数据仓库项目实战

链接: https://pan.baidu.com/s/1fCEQmaE6O08MLzOWLkXaSw?pwd=m2nr 提取码: m2nr

出版社: 电子工业出版社
ISBN:9787121396007
版次:1
商品编码:12741579
品牌:电子工业出版社
包装:平装
开本:16开
出版时间:2020-11-01
用纸:胶版纸
页数:396
字数:650000
正文语种:中文
产品特色




编辑推荐
适读人群 :IT互联网程序员、大数据开发人员、高级架构师、大数据相关专业高校学生、讲师


IT互联网程序员、大数据开发人员、高级架构师、大数据相关专业高校学生、讲师

内容简介

本书按照需求规划、需求实现、需求可视化的流程进行编排,遵循项目开发的实际流程,全面介绍了数据仓库的搭建过程。在整个数据仓库的搭建过程中,本书介绍了主要组件的安装部署过程、需求实现的具体思路、部分问题的解决方案等,并在其中穿插了许多与大数据和数据仓库相关的理论知识,包括大数据概论、数据仓库概论、电商业务概述、数据仓库理论准备、数据仓库建模等。

本书从逻辑上可以分为三部分:一是大数据与数据仓库概论及项目需求描述,主要介绍了数据仓库的概念、应用场景和搭建需求;二是项目部署的环境准备,介绍了如何从零开始搭建一个完整的数据仓库环境;三是需求模块实现,针对不同需求分模块进行实现,是本书的重点部分。

本书适合具有一定的编程基础并对大数据感兴趣的读者阅读。通过阅读本书,读者可以快速了解数据仓库,全面掌握数据仓库的相关技术。




作者简介

尚硅谷IT教育是一家专业的IT教育培训机构,开设了JavaEE、大数据、HTML5前端等多门学科,在互联网上发布的JavaEE、大数据、HTML5前端、区块链、C语言、Python等技术视频教程广受赞誉。

内页插图
目录

第1章 大数据与数据仓库概论 1

1.1 大数据概论 1

1.1.1 什么是大数据 1

1.1.2 大数据生态圈简介 2

1.1.3 大数据应用场景 3

1.2 数据仓库概论 4

1.2.1 什么是数据仓库 4

1.2.2 数据仓库能干什么 4

1.2.3 数据仓库的特点 5

1.3 学前导读 6

1.3.1 学习的基础要求 6

1.3.2 你将学到什么 7

1.4 本章总结 7

第2章 项目需求描述 8

2.1 任务概述 8

2.1.1 产品描述 9

2.1.2 系统目标 9

2.1.3 系统功能结构 9

2.1.4 系统流程图 10

2.2 业务描述 10

2.2.1 采集模块业务描述 10

2.2.2 数据仓库需求业务描述 16

2.2.3 数据可视化业务描述 17

2.3 系统运行环境 17

2.3.1 硬件环境 17

2.3.2 软件环境 18

2.4 本章总结 20

第3章 项目部署的环境准备 21

3.1 Linux环境准备 21

3.1.1 VMware安装 21

3.1.2 CentOS安装 21

3.1.3 远程终端安装 31

3.2 Linux环境配置 34

3.2.1 网络配置 34

3.2.2 网络IP地址配置 35

3.2.3 主机名配置 36

3.2.4 防火墙配置 37

3.2.5 一般用户设置 38

3.3 Hadoop环境搭建 38

3.3.1 虚拟机环境准备 39

3.3.2 JDK安装 45

3.3.3 Hadoop安装 46

3.3.4 Hadoop分布式集群部署 47

3.3.5 配置Hadoop支持LZO压缩 52

3.3.6 配置Hadoop支持Snappy压缩 53

3.4 本章总结 54

第4章 用户行为数据采集模块 55

4.1 日志生成 55

4.2 采集日志的Flume 57

4.2.1 Flume组件 58

4.2.2 Flume安装 58

4.2.3 采集日志Flume配置 59

4.2.4 Flume的ETL拦截器和日志类型区分拦截器 61

4.2.5 采集日志Flume启动、停止脚本 67

4.3 消息队列Kafka 68

4.3.1 Zookeeper安装 68

4.3.2 Zookeeper集群启动、停止脚本 70

4.3.3 Kafka安装 71

4.3.4 Kafka集群启动、停止脚本 73

4.3.5 Kafka Topic相关操作 74

4.4 消费Kafka日志的Flume 75

4.4.1 消费日志Flume配置 75

4.4.2 消费日志Flume启动、停止脚本 78

4.5 采集通道启动、停止脚本 79

4.6 本章总结 80

第5章 业务数据采集模块 81

5.1 电商业务概述 81

5.1.1 电商业务流程 81

5.1.2 电商常识 82

5.1.3 电商表结构 82

5.1.4 数据同步策略 89