最近搜索
暂无搜索记录
热搜
JAVA
大数据
分布式
Python
人工智能
爬虫
WEB
JavaScript
认证
课时01
数据库三范式
23分2秒
课时02
ER实体模型
16分10秒
课时03
数据仓库意义
14分43秒
课时04
数据仓库介绍
16分24秒
课时05
数据仓库发展过程(1)
14分11秒
课时06
数据仓库发展过程(2)
16分44秒
课时07
课前回顾
5分17秒
课时08
维度建模-事实表
15分32秒
课时09
维度建模-维度表
5分59秒
课时10
星型模型
12分28秒
课时11
雪花模型
9分35秒
课时12
星型模型与雪花模型对比
5分2秒
课时13
维度建模案例
4分30秒
课时14
数据仓库分层设计(1)
13分15秒
课时15
数据仓库分层设计(2)
18分40秒
课时16
数据仓库分层设计(3)
12分59秒
课时17
数据仓库分层案例
9分14秒
课时18
数据库与数据仓库区别
5分44秒
课时19
课前回顾
11分7秒
课时20
项目介绍
17分15秒
课时21
项目架构图(1)
14分1秒
课时22
项目架构图(2)
9分14秒
课时23
项目架构图(3)
9分19秒
课时24
集群配置与项目人数、周期
17分6秒
课时25
数据仓库模型
3分26秒
课时26
数据仓库命名规范
18分9秒
课时27
业务分析
13分40秒
课时28
回顾项目前期准备内容
7分40秒
课时29
歌曲热度与歌手热度排行需求
10分8秒
课时30
歌曲热度与歌手热度排行需要的数据
14分44秒
课时31
数据仓库分层设计
27分6秒
课时32
数据处理流程
1分22秒
课时33
清洗客户端日志数据,保存到数仓ODS层(1)
16分4秒
课时34
清洗客户端日志数据,保存到数仓ODS层(2)
27分6秒
课时35
存储数据表介绍
7分17秒
课时36
回顾
16分54秒
课时37
项目目录结构
3分44秒
课时38
ProduceClintLog处理的过程代码解析
20分14秒
课时39
演示测试
9分13秒
课时40
数据表介绍,创建
8分15秒
课时41
安装Sqoop
5分44秒
课时42
抽取MySQL中song数据到Hive ODS
15分29秒
课时43
执行脚本
7分1秒
课时44
清洗数据表介绍
7分38秒
课时45
清洗“歌库歌曲表”生成“歌曲基本信息日全量表”基本讲解
15分53秒
课时46
回顾
15分39秒
课时47
清洗“歌库歌曲表”生成“歌曲基本信息日全量表代码讲解(1)
12分31秒
课时48
清洗“歌库歌曲表”生成“歌曲基本信息日全量表代码讲解(2)
23分42秒
课时49
歌曲特征日统计表介绍
6分6秒
课时50
EDS层生成“歌曲特征日统计表”
33分47秒
课时51
运行演示
2分57秒
课时52
微信指数
19分16秒
课时53
复习
4分5秒
课时54
开窗函数
16分39秒
课时55
表数据介绍
2分42秒
课时56
统计歌手和歌曲热度需求
19分42秒
课时57
统计歌手和歌曲热度代码讲解
16分1秒
课时58
歌手热度代码讲解
4分39秒
课时59
回顾及下面内容引入
4分39秒
课时60
配置运行Azkaban(1)
17分49秒
课时61
配置运行Azkaban(2)
15分4秒
课时62
启动Azkaban
9分35秒
课时63
回顾
3分53秒
课时64
构建工作流(1)
30分47秒
课时65
构建工作流(2)
14分6秒
课时66
回顾歌曲歌手热度统计数据流转图
3分22秒
课时67
使用Azkaban调度歌曲歌手热度-任务一
10分14秒
课时68
使用Azkaban调度歌曲歌手热度-任务二,三,四
5分21秒
课时69
使用Azkaban调度歌曲歌手热度-任务五,六
4分13秒
课时70
编写6个任务
4分33秒
课时71
创建六张任务表
7分22秒
课时72
执行任务
10分23秒
课时73
Azkaban 问题
46秒
课时74
代码问题
18分14秒
课时75
Superset
2分30秒
课时76
解决上节课代码问题
14分31秒
课时77
Superset引入及window安装
11分3秒
课时78
Superset-Linux安装
21分45秒
课时79
登入Superset
6分29秒
课时80
连接mysql使用(1)
21分26秒
课时81
连接mysql使用(2)
15分13秒
课时82
连接mysql使用(3)
21分34秒
课时83
回顾
2分45秒
课时84
第二个业务:机器详细信息统计需求
4分26秒
课时85
数据表介绍
28分25秒
课时86
业务分析
1分37秒
课时87
数仓分层设计
11分22秒
课时88
处理业务(1)
15分10秒
课时89
处理业务(2)
12分17秒
课时90
省份,城市表创建导入
6分33秒
课时91
针对Ods层数据进行分析获取EDS层-数据
12分32秒
课时92
针对Ods层数据进行分析获取EDS层-思路
16分26秒
课时93
回顾
10分28秒
课时94
清洗数据(1)
15分8秒
课时95
清洗数据(2)
18分42秒
课时96
查询
18分32秒
课时97
运行
5分45秒
课时98
配置到机器学习中
6分21秒
课时99
准备脚本,运行脚本
14分23秒
课时100
启动Superset 可视化
13分25秒
课时101
回答问题及下节课内容安排
8分37秒
课时102
第三个业务用户画像,统计当天7日活跃用户
16分50秒
课时103
数仓分层设计
6分49秒
课时104
EDS层 --用户主题
12分36秒
课时105
数据处理
6分0秒
课时106
创建表TO_YCAK_USR_D
5分11秒
课时107
创建表TO_YCAK_USR_APP_D
2分32秒
课时108
创建表TO_YCAK_USR_LOGIN_D
12分17秒
课时109
sqoop增量导入
7分11秒
课时110
分析获取
10分27秒
课时111
代码实现
13分44秒
课时112
查询获取当前日连续7日活跃用户
7分16秒
课时113
azkaban任务流调度
6分33秒
课时114
总计
10分44秒
课时115
上节课内容回顾
5分20秒
课时116
Azkaban进行任务流调度
20分46秒
课时117
使用superSet可视化
10分58秒
课时118
第四个业务:商户营收统计
13分22秒
课时119
第四个业务分析:商户营收统计
15分47秒
课时120
数据仓库分层设计:源业系统数据
19分52秒
课时121
数据仓库分层设计:EDS
8分8秒
课时122
数据仓库分层设计:DM层,EDS层,ODS层分析
9分32秒
课时123
数据仓库分层设计:DM层,EDS层,ODS层分析(二)
5分32秒
课时124
回顾机器营收业务
14分31秒
课时125
分析获取TW_MAC_LOC_D机器位置信息日统计表
5分24秒
课时126
增量导入
14分4秒
课时127
针对TO_YCAK_USR_LOC_D表数据,调用高德API获取位置信息得到TW_MAС_LOC_D
9分41秒
课时128
高德地图API的使用
13分36秒
课时129
分析数据-- Kafka [给运营中心使用]
14分43秒
课时130
调高德api
6分17秒
课时131
rdd算子操作访问高德api
11分39秒
课时132
代码实现
8分33秒
课时133
代码实现(二)
15分44秒
课时134
代码实现(三)
6分35秒
课时135
上节课回顾:数据仓库分层设计
17分48秒
课时136
上节课回顾:EDS
9分54秒
课时137
上节课回顾:各个ODS层与EDS层表之间的流转关系如下
3分45秒
课时138
统计机器营收数据信息
9分42秒
课时139
增量导入
7分44秒
课时140
ODS层与EDS层表之间的流转关系
11分52秒
课时141
针对ODS层TO_YCAK_CNSM_D清洗得到EDS层
5分45秒
课时142
代码实现
7分54秒
课时143
获取EDS层机器日营收统计表TW_MAC_STAT_D
15分1秒
课时144
统计每台机器每个套餐、每种支付类型对应的退款情况
10分47秒
课时145
获取机器日营收情况统计表
14分18秒
课时146
复习上节内容
8分48秒
课时147
数据业务分析-获取DM层:商户日营收统计表【mysgl中也有对应的表】
14分8秒
课时148
数据业务分析-获取DM层:地区营收日统计表
14分8秒
课时149
使用Azkaban进行任务流调度
8分38秒
课时150
使用Azkaban进行任务流调度(二)
15分46秒
课时151
使用Azkaban调度步骤
12分49秒
课时152
使用Azkaban调度步骤(二)
12分33秒
课时153
数据处理流程
4分42秒
课时154
SuperSet
15分26秒
课时155
流式日志数据采集接口
12分4秒
课时156
日志代码实现
7分53秒
课时157
日志代码实现(二)
10分55秒
课时158
日志代码实现(三)
9分25秒
课时159
日志代码实现(四)
8分18秒
课时160
日志代码实现(五)
9分8秒
课时161
日志代码实现(六)
4分20秒
课时162
配置信息解析
8分15秒
课时163
数据处理
7分16秒
课时164
流式业务:统计每台机器实时pvuv
12分25秒
课时165
流式业务:统计每台机器实时pvuv(二)
22分6秒
课时166
上节课回顾
11分35秒
课时167
统计机器uv
3分19秒
课时168
Receiver模式
13分18秒
课时169
Direct模式
11分18秒
课时170
pirect模式
10分4秒
课时171
利用Kafka维护消费者offset
11分41秒
课时172
代码实现
13分0秒
课时173
代码实现(二)
10分4秒
课时174
代码实现(三)
10分9秒
课时175
统计实时歌曲热榜
17分11秒
课时176
统计实时歌曲热榜(二)
11分6秒
课时177
Spark优化:资源优化
11分21秒
课时178
Spark优化:并行度优化
10分2秒
课时179
Spark优化:代码优化
6分3秒
课时180
代码优化:尽量避免使用shuffle算,使用map端有预聚合的操作
7分7秒
课时181
代码优化:使用高性能的算子,使用广播变量,使用Kryo序列化
5分53秒
课时182
代码优化:优化数据结构,总结
2分44秒
课时183
Shuffle优化
3分4秒
课时184
内存优化
7分17秒
课时185
堆外内存优化
4分33秒
课时186
数据倾斜的处理
4分43秒
课时187
数据倾斜解决方式
12分16秒
课时188
数据倾斜解决方式(二)
12分16秒
课时189
问题答疑
6分28秒