课程介绍
课程章节
章节1: 数据仓库之数据库范式与ER实体关系模型建模 (6节)

课时01

数据库三范式

23分2秒

课时02

ER实体模型

16分10秒

课时03

数据仓库意义

14分43秒

课时04

数据仓库介绍

16分24秒

课时05

数据仓库发展过程(1)

14分11秒

课时06

数据仓库发展过程(2)

16分44秒

章节2: 数据仓库之维度建模与数据仓库分析模型 (12节)

课时07

课前回顾

5分17秒

课时08

维度建模-事实表

15分32秒

课时09

维度建模-维度表

5分59秒

课时10

星型模型

12分28秒

课时11

雪花模型

9分35秒

课时12

星型模型与雪花模型对比

5分2秒

课时13

维度建模案例

4分30秒

课时14

数据仓库分层设计(1)

13分15秒

课时15

数据仓库分层设计(2)

18分40秒

课时16

数据仓库分层设计(3)

12分59秒

课时17

数据仓库分层案例

9分14秒

课时18

数据库与数据仓库区别

5分44秒

章节3: 数据仓库之数据仓库分层设计与命名规范 (9节)

课时19

课前回顾

11分7秒

课时20

项目介绍

17分15秒

课时21

项目架构图(1)

14分1秒

课时22

项目架构图(2)

9分14秒

课时23

项目架构图(3)

9分19秒

课时24

集群配置与项目人数、周期

17分6秒

课时25

数据仓库模型

3分26秒

课时26

数据仓库命名规范

18分9秒

课时27

业务分析

13分40秒

章节4: 音乐数仓平台之项目架构及数仓分层、主题设计 (8节)

课时28

回顾项目前期准备内容

7分40秒

课时29

歌曲热度与歌手热度排行需求

10分8秒

课时30

歌曲热度与歌手热度排行需要的数据

14分44秒

课时31

数据仓库分层设计

27分6秒

课时32

数据处理流程

1分22秒

课时33

清洗客户端日志数据,保存到数仓ODS层(1)

16分4秒

课时34

清洗客户端日志数据,保存到数仓ODS层(2)

27分6秒

课时35

存储数据表介绍

7分17秒

章节5: 数仓之歌曲影响力指数分析 (10节)

课时36

回顾

16分54秒

课时37

项目目录结构

3分44秒

课时38

ProduceClintLog处理的过程代码解析

20分14秒

课时39

演示测试

9分13秒

课时40

数据表介绍,创建

8分15秒

课时41

安装Sqoop

5分44秒

课时42

抽取MySQL中song数据到Hive ODS

15分29秒

课时43

执行脚本

7分1秒

课时44

清洗数据表介绍

7分38秒

课时45

清洗“歌库歌曲表”生成“歌曲基本信息日全量表”基本讲解

15分53秒

章节6: 数仓之歌手影响力指数分析 (7节)

课时46

回顾

15分39秒

课时47

清洗“歌库歌曲表”生成“歌曲基本信息日全量表代码讲解(1)

12分31秒

课时48

清洗“歌库歌曲表”生成“歌曲基本信息日全量表代码讲解(2)

23分42秒

课时49

歌曲特征日统计表介绍

6分6秒

课时50

EDS层生成“歌曲特征日统计表”

33分47秒

课时51

运行演示

2分57秒

课时52

微信指数

19分16秒

章节7: 数仓之Sqoop全量增量数据导入 (10节)

课时53

复习

4分5秒

课时54

开窗函数

16分39秒

课时55

表数据介绍

2分42秒

课时56

统计歌手和歌曲热度需求

19分42秒

课时57

统计歌手和歌曲热度代码讲解

16分1秒

课时58

歌手热度代码讲解

4分39秒

课时59

回顾及下面内容引入

4分39秒

课时60

配置运行Azkaban(1)

17分49秒

课时61

配置运行Azkaban(2)

15分4秒

课时62

启动Azkaban

9分35秒

章节8: 数仓之Azkaban任务流调度使用及原理 (13节)

课时63

回顾

3分53秒

课时64

构建工作流(1)

30分47秒

课时65

构建工作流(2)

14分6秒

课时66

回顾歌曲歌手热度统计数据流转图

3分22秒

课时67

使用Azkaban调度歌曲歌手热度-任务一

10分14秒

课时68

使用Azkaban调度歌曲歌手热度-任务二,三,四

5分21秒

课时69

使用Azkaban调度歌曲歌手热度-任务五,六

4分13秒

课时70

编写6个任务

4分33秒

课时71

创建六张任务表

7分22秒

课时72

执行任务

10分23秒

课时73

Azkaban 问题

46秒

课时74

代码问题

18分14秒

课时75

Superset

2分30秒

章节9: 数仓之Superset BI可视化工具使用及原理 (7节)

课时76

解决上节课代码问题

14分31秒

课时77

Superset引入及window安装

11分3秒

课时78

Superset-Linux安装

21分45秒

课时79

登入Superset

6分29秒

课时80

连接mysql使用(1)

21分26秒

课时81

连接mysql使用(2)

15分13秒

课时82

连接mysql使用(3)

21分34秒

章节10: 数仓之机器详情ODS/EDS/DM分层设计 (10节)

课时83

回顾

2分45秒

课时84

第二个业务:机器详细信息统计需求

4分26秒

课时85

数据表介绍

28分25秒

课时86

业务分析

1分37秒

课时87

数仓分层设计

11分22秒

课时88

处理业务(1)

15分10秒

课时89

处理业务(2)

12分17秒

课时90

省份,城市表创建导入

6分33秒

课时91

针对Ods层数据进行分析获取EDS层-数据

12分32秒

课时92

针对Ods层数据进行分析获取EDS层-思路

16分26秒

章节11: 数仓之机器详情自动化调度及数据可视化 (9节)

课时93

回顾

10分28秒

课时94

清洗数据(1)

15分8秒

课时95

清洗数据(2)

18分42秒

课时96

查询

18分32秒

课时97

运行

5分45秒

课时98

配置到机器学习中

6分21秒

课时99

准备脚本,运行脚本

14分23秒

课时100

启动Superset 可视化

13分25秒

课时101

回答问题及下节课内容安排

8分37秒

章节12: 数仓之用户画像表模型设计 (13节)

课时102

第三个业务用户画像,统计当天7日活跃用户

16分50秒

课时103

数仓分层设计

6分49秒

课时104

EDS层 --用户主题

12分36秒

课时105

数据处理

6分0秒

课时106

创建表TO_YCAK_USR_D

5分11秒

课时107

创建表TO_YCAK_USR_APP_D

2分32秒

课时108

创建表TO_YCAK_USR_LOGIN_D

12分17秒

课时109

sqoop增量导入

7分11秒

课时110

分析获取

10分27秒

课时111

代码实现

13分44秒

课时112

查询获取当前日连续7日活跃用户

7分16秒

课时113

azkaban任务流调度

6分33秒

课时114

总计

10分44秒

章节13: 数仓之用户画像自动化调度及数据可视化 (9节)

课时115

上节课内容回顾

5分20秒

课时116

Azkaban进行任务流调度

20分46秒

课时117

使用superSet可视化

10分58秒

课时118

第四个业务:商户营收统计

13分22秒

课时119

第四个业务分析:商户营收统计

15分47秒

课时120

数据仓库分层设计:源业系统数据

19分52秒

课时121

数据仓库分层设计:EDS

8分8秒

课时122

数据仓库分层设计:DM层,EDS层,ODS层分析

9分32秒

课时123

数据仓库分层设计:DM层,EDS层,ODS层分析(二)

5分32秒

章节14: 数仓之高德api获取机器上报位置 (11节)

课时124

回顾机器营收业务

14分31秒

课时125

分析获取TW_MAC_LOC_D机器位置信息日统计表

5分24秒

课时126

增量导入

14分4秒

课时127

针对TO_YCAK_USR_LOC_D表数据,调用高德API获取位置信息得到TW_MAС_LOC_D

9分41秒

课时128

高德地图API的使用

13分36秒

课时129

分析数据-- Kafka [给运营中心使用]

14分43秒

课时130

调高德api

6分17秒

课时131

rdd算子操作访问高德api

11分39秒

课时132

代码实现

8分33秒

课时133

代码实现(二)

15分44秒

课时134

代码实现(三)

6分35秒

章节15: 数仓之商户、地区营收统计分析 (11节)

课时135

上节课回顾:数据仓库分层设计

17分48秒

课时136

上节课回顾:EDS

9分54秒

课时137

上节课回顾:各个ODS层与EDS层表之间的流转关系如下

3分45秒

课时138

统计机器营收数据信息

9分42秒

课时139

增量导入

7分44秒

课时140

ODS层与EDS层表之间的流转关系

11分52秒

课时141

针对ODS层TO_YCAK_CNSM_D清洗得到EDS层

5分45秒

课时142

代码实现

7分54秒

课时143

获取EDS层机器日营收统计表TW_MAC_STAT_D

15分1秒

课时144

统计每台机器每个套餐、每种支付类型对应的退款情况

10分47秒

课时145

获取机器日营收情况统计表

14分18秒

章节16: 数仓之营收分析自动化调度及数据可视化 (9节)

课时146

复习上节内容

8分48秒

课时147

数据业务分析-获取DM层:商户日营收统计表【mysgl中也有对应的表】

14分8秒

课时148

数据业务分析-获取DM层:地区营收日统计表

14分8秒

课时149

使用Azkaban进行任务流调度

8分38秒

课时150

使用Azkaban进行任务流调度(二)

15分46秒

课时151

使用Azkaban调度步骤

12分49秒

课时152

使用Azkaban调度步骤(二)

12分33秒

课时153

数据处理流程

4分42秒

课时154

SuperSet

15分26秒

章节17: 数仓之实时用户、机器日志采集接口实现 (11节)

课时155

流式日志数据采集接口

12分4秒

课时156

日志代码实现

7分53秒

课时157

日志代码实现(二)

10分55秒

课时158

日志代码实现(三)

9分25秒

课时159

日志代码实现(四)

8分18秒

课时160

日志代码实现(五)

9分8秒

课时161

日志代码实现(六)

4分20秒

课时162

配置信息解析

8分15秒

课时163

数据处理

7分16秒

课时164

流式业务:统计每台机器实时pvuv

12分25秒

课时165

流式业务:统计每台机器实时pvuv(二)

22分6秒

章节18: 数仓之Flume实时日志采集实现 (11节)

课时166

上节课回顾

11分35秒

课时167

统计机器uv

3分19秒

课时168

Receiver模式

13分18秒

课时169

Direct模式

11分18秒

课时170

pirect模式

10分4秒

课时171

利用Kafka维护消费者offset

11分41秒

课时172

代码实现

13分0秒

课时173

代码实现(二)

10分4秒

课时174

代码实现(三)

10分9秒

课时175

统计实时歌曲热榜

17分11秒

课时176

统计实时歌曲热榜(二)

11分6秒

章节19: 数仓之实时用户地区日活分析 (13节)

课时177

Spark优化:资源优化

11分21秒

课时178

Spark优化:并行度优化

10分2秒

课时179

Spark优化:代码优化

6分3秒

课时180

代码优化:尽量避免使用shuffle算,使用map端有预聚合的操作

7分7秒

课时181

代码优化:使用高性能的算子,使用广播变量,使用Kryo序列化

5分53秒

课时182

代码优化:优化数据结构,总结

2分44秒

课时183

Shuffle优化

3分4秒

课时184

内存优化

7分17秒

课时185

堆外内存优化

4分33秒

课时186

数据倾斜的处理

4分43秒

课时187

数据倾斜解决方式

12分16秒

课时188

数据倾斜解决方式(二)

12分16秒

课时189

问题答疑

6分28秒

您没有该体系课权限,需要开通权限请点击联系老师。
联系老师
个问题,0回答
提问
暂无提问,赶紧去提问吧~