课程背景
1.数据挖掘是近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,当前大数据分析几乎都离不开数据挖掘技术,应用广泛,是业界所需;
2.数据挖掘集合了概率统计、机器学习、人工智能、数据可视化、算法等等多门计算机领域核心知识,是信息技术研究的重要领域;
3.掌握数据挖掘的相关知识技能对于学生当下就业和未来深造都有重要意义。
课程目标
1.帮助学生理解数据挖掘的基本方法、技术与原理
2.培养学生运用数据挖掘的基本方法、技术与原理解决实际问题的能力
3.培养学生的数据思维,促使学生以数据思维思考问题和解决问题
课程设计原则
1.紧紧围绕不同数据挖掘任务中所面临的大规模、高纬度、多类型、非传统分布等问题,探索解决以上问题的一般路径;
2.以问题牵引,关联学生已有数据结构、数据库、机器学习等知识,引导学生主动思考与讨论;
3.注重技术实践,本着层层递进式原则,从数据挖掘全流程初体验、经典数据挖掘问题实践、真实应用问题实践三个不同层次展开实践教学;
按百分制计分:60~80分为合格,80分以上为优秀。
期末考试成绩占比:40%
单元测试占比:20%
单元作业占比:20%
课程讨论占比:20%(“课堂讨论”中回复的数量10个获得该项满分)
课时 1
1.1 绪论
课时 3
2.1 数据类型和统计
2.2 数据可视化
2.3 数据相似性
课时 4
3.1 数据清洗
3.2 数据集成
3.3 数据规约
3.4 数据转换
课时 2
4.1 贝叶斯分类基本概念
4.2 贝叶斯分类案例
课时 3
5.1 决策树基本概念
5.2 决策树构建方法
5.3 决策树分类案例
课时 2
6.1 k-均值聚类基本方法
6.2 k-均值聚类案例
课时 2
7.1 逻辑回归基本原理
7.2 逻辑回归正则化
课时 2
8.1 关联规则挖掘概念与基本算法
概率统计
数据结构与算法
数据库系统
机器学习