SPOC学校专有课程
数据挖掘原理及实践
第4次开课
开课时间: 2024年02月25日 ~ 2024年06月07日
学时安排: 2小时每周
当前开课已结束 已有 46 人参加
老师已关闭该学期,无法查看
spContent=
—— 课程团队
课程概述

数据挖掘技术,结合人工智能模型和模式识别算法,依托数据仓库作为存储数据和资源管理的手段,以联机处理技术提取和分析数据,为管理和决策者提供全面且准确的商业机遇和潜在价值信息。本课程项目将系统地讲解数据挖掘的基本概念和基本方法,结合Python软件工具进行数据挖掘的实验教学,并结合行业案例介绍数据挖掘的最新进展。要求学生通过本课程的学习,认识到数据挖掘在大数据平台架构内所起的重要作用,掌握数据挖掘的原理,理解关联、回归、分类、聚类、预测等技术要点和实践方法,了解数据挖掘的应用情况和发展方向。通过课程习题和实验设计,要求学生掌握用Python等工具进行数据挖掘的实践能力。选课学生应具有一定的Matlab或Python编程能力。

授课目标

本课程利用多媒体设备与计算机建模工具讲解数据挖掘的基本原理和技术,通过实例演示让学生了解数据回归、模式分类、聚类的基本概念,以及数据挖掘主要算法及数据挖掘技术在生物医学工程中的运用,掌握基本的计算机建模工具使用方法。本课程涉及大量英文文献和数学理论,要求学生应具备较好的英文基础知识和数学功底。

成绩 要求

学习过程中通过平时课程测验,期末提交课程论文。成绩合格后修满学分。


为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。

 

电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。

 

完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。

 

认证证书申请注意事项:

1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。

2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。


课程大纲
数据挖掘引言
1.1 数据挖掘的目的
1.2 数据挖掘的概念
1.3 数据挖掘的功能简介
1.4 数据挖掘的概念
1.5 数据挖掘的使用技术简介
数据的属性和表现形式
2.1 数据的属性
2.2 数据可视化
2.3 数据的相似性和相异性度量
数据预处理
3.1 数据预处理的目标和主要任务
3.2 数据清理
3.3 数据集成
3.4 数据降维
3.5 数据变换与离散化
数据的统计分析
4.1 数据分布的概率密度建模
4.2 基于概率密度分布的统计分析
4.3 数据分布的正态性检验
4.4 离群值的统计分布
4.5 统计数据的点估计和区间估计
4.6 随机数据序列的特征分析
数据的相关和回归分析
5.1 数据相关性分析
5.2 单变量线性回归分析
5.3 多元线性回归分析
5.4 Logistic回归分析
数据挖掘中的关联规则
6.1 数据关联的基本概念和术语
6.2 数据关联的Apriori算法策略
数据的分类和预测
7.1 数据分类和预测的基本概念
7.2 决策树归纳分类方法
7.3 统计分类
7.4 支持向量机分类
7.5 分类效果的性能评估
数据的聚类分析
8.1 聚类分析的基本概念
8.2 划分聚类方法
8.2 层次聚类方法
8.3 基于密度的聚类方法
数据挖掘的应用和发展
9.1 数据挖掘在生物医学领域的应用举例
展开全部
预备知识

公共英语,高等数学,线性代数,概率论

参考资料

范明、孟小峰译,《数据挖掘:概念与技术 (3)》,机械工业出版社,2012 ( ISBN978-7-111-39140-1)

厦门大学
1 位授课老师
吴云峰

吴云峰

副教授

下载
下载

下载App