欢迎来到在线教学平台
问题答疑
首页
全部课程
公开课
云课直播
新闻公告
数图资源
智汇大讲堂
更多
首页
全部课程
公开课
云课直播
新闻公告
数图资源
智汇大讲堂
教师登录
学生登录
首页
全部课程
公开课
云课直播
新闻公告
数图资源
智汇大讲堂
教师登录
学生登录
首页 - 课程列表 - 课程详情
返回
大数据采集与清洗
课程类型:
选修课
发布时间:
2024-04-11 15:29:30
主讲教师:
课程来源:
建议学分:
0.00分
课程编码:
mk002604
课程介绍
课程目录
教师团队
{1}--数据之潮:大数据采集与清洗概述
[1.1]--1.1初识大数据采集与预处理 徐建国(1)
(14分钟)
[1.2]--1.2数据清洗概述 徐建国(1)
(18分钟)
[1.3]--1.3认识ETL 徐建国(1)
(15分钟)
{2}--流动的数据江河:探索Flume和Kafka的数据采集
[2.1]--2.1 Flume简介 王子童(1)
(9分钟)
[2.2]--2.2 Flume安装 王子童(1)
(17分钟)
[2.3]--2.3 基于Flume的系统日志采集 王子童
(13分钟)
[2.4]--2.4 Kafka简介及安装 王子童(1)
(20分钟)
[2.5]--2.5 Flume+Kafka采集项目 王子童
(15分钟)
{3}--数据的炼金术:Kettle初体验
[3.1]--3.1Kettle环境部署 王娟娟(1)
(11分钟)
[3.2]--3.2Kettle之转换 王娟娟(1)
(19分钟)
[3.3]--3.3Kettle之作业 王娟娟(1)
(15分钟)
{4}--ETL之舞:探索数据的抽取
[4.1]--4.1文本抽取 王娟娟
(14分钟)
[4.2]--4.2抽取web数据 陈荣
(12分钟)
[4.3]--4.3抽取数据库数据 陈荣
(9分钟)
{5}--ETL之舞:探索数据的清洗与转换
[5.1]--5.1数据去重 陈荣
(10分钟)
[5.2]--5.2缺失值处理 陈荣
(15分钟)
[5.3]--5.3异常值处理 杜慧(改)
(17分钟)
[5.4.1]--不一致数据转换(上)
(8分钟)
[5.4.2]--不一致数据转换(下)
(18分钟)
[5.5]--大数据采集与清洗(样片)
(18分钟)
[5.6]--5.6商务规则的计算 杜慧(1)
(14分钟)
{6}--ETL之舞:探索数据的加载
[6.1]--5.7数据加载 杜慧(1)
(15分钟)
{7}--绿影探密:校内植物图像采集
[7.1]--视觉科学创新工作室“植物分类识别“项目的介绍李鹏(1)
(5分钟)