数据仓库与数据挖掘
大约 2 分钟
数据仓库与数据挖掘
1. 课时1-4:数据仓库与数据挖掘概述和认识数据 🍐
- 数据仓库
- 数据挖掘
- Anaconda平台 ✏️ ❤️
- Jupyter Notebook ✏️ ❤️
- 认识数据
- 数据可视化
- 数据对象的相似性度量
上课地点:至真楼409(1,2)
2. 课时5-8:数据预处理1 🍐
- 数据预处理概述
- 数据清理 🍐
- 数据清洗实操 🍐 ❤️ ✏️
- 数据清洗之异常检测实操 ✏️ 🍐
- 数据集成 🍐❤️ ✏️
- 数据标准化 🍐❤️ ✏️
上课地点:至真楼409(1,2)
3. 课时9-12:数据预处理2 🍐
- 数据归约 ✏️🍐
- 数据变换与数据离散化概要 🍐
- 数据变换之规范化
- 数据变换之哑变量
- 数据变换之离散化
4. 课时13-16:数据仓库、ETL、OLAP技术1 🍐
- 一步讲解完怎样创建数据仓库
- 数据仓库概要
- 多维数据模型和OLAP
- 数据仓库的发展
- 数据仓库的设计
5. 课时17-20:数据仓库、ETL、OLAP技术2 🍐
- Hadoop的生态结构
- 虚拟机和Docker以及Docker Compose安装
- 安装Hadoop和Hive并测试
- 基于Hive的数据仓库实现实操
6. 课时21-24:回归分析 🍐
- 回归分析概述
- 线性回归
2.1 线性回归概述
2.2 线性回归实战准备 - 逻辑回归
- 其他回归方式
- 多项式回归
- 岭回归
- Lasso 回归
- 弹性网络回归
7. 课时25-28:关联规则 🍐
- 关联规则分析概述
- 频繁项集挖掘方法
- 提高Apriori算法效率
- 垂直数据格式挖掘频繁项集-Eclat
- 关联模式评估
- 实操- Apriori算法应用
8. 课时29-32:分类 🍐
- 分类概述
- 分类决策树归纳
- ID3算法
- C4.5算法
- CART算法
- KNN算法
- 支持向量机
- 朴素贝叶斯分类
- 模型评估和选择
- 模型组合分类
9. 课时33-36:聚类 🍐
- 聚类分析概述
- K-Means聚类算法
- 层级聚类
- 基于密度的聚类
- 其他聚类方法
10. 课时37-40:深度学习和离群点检测 🍐
- 神经网络与深度学习
- CNN和RNN
- 离群点检测
11. 课时41-44:复习和测试 🍐
12. 课时41-44:数据挖掘实战 🍐
👉 剩下章节,敬请期待!👈
