SPOC学校专有课程
数据挖掘原理及应用
分享
spContent=数据挖掘原理与算法是一门应用性极强的科学,是在信息技术领域迅速兴起的计算机技术。本课程为选修课,通过本课程的学习,使学生掌握数据挖掘的基本概念,了解数据挖掘的定义和功能以及实现数据挖掘的主要步骤和具体实现方法,初步掌握数据挖掘的算法,使学生在学习本课程后,能实现简单的数据挖掘算法编程,了解实现数据挖掘的具体操作具有初步设计,为学生进一步从事该方向的学习与研究工作打下基础。
—— 课程团队
课程概述

本课程采用线上线下混合教学模式,通过使用现代信息技术,介绍常用的解决实际问题的技术和算法,联系实际问题介绍如何使用这些算法解决实际问题。该课程具有理论与实际紧密结合的特点,通过强有力的实验环节,培养学生运用较高层次的数据处理等观点和知识,能对实际问题进行分析、归纳、提炼,通过选择适当的算法及编程求解,提高学生的数学应用能力和开展科研工作的能力。

成绩要求

本课程的学习环节包含:观看讲课视频并参与讨论、完成单元测试、完成实验作业、参加期末考试。

1.成绩构成:观看讲课视频并参与讨论20%单元测试10%、完成实验作业并上传20%,期末考核50%

2. 单元测试的题型以选择题、填空题、判断题等客观题型为主;

3.实验作业以算法及程序设计题目为主;

4.期末考试题型以问答题和计算题为主,根据课程教学大纲和授课内容来确定考试范围和考试要求;

5.成绩分为三级计分制:分别为优秀、合格、不合格;

 85分至100分为优秀,可获得优秀证书;总评成绩60分至84分为合格,可获得合格证书。

课程大纲
预备知识

先修课程:《数学分析》、《高等代数》,《概率论与数理统计》,《MATLAB程序设计》

参考资料
  1. 《数据挖掘概念与技术》,Jiawei Han、Micheline Kamber 著,范明等译,机械工业出版社,2012年第三版
  2. 《数据挖掘-概念、模型、方法和算法》,Mehmed Kantardzic 著,闪四清、陈茵、程雁等译,清华大学出版社,2003
  3. 《数据挖掘-实用机器学习技术》,Ian H. Witten著,机械工业出版社。
  4. 实战大数据 MATLAB数据挖掘详解与实践》,许国根,贾瑛著,清华大学出版社,2017.
常见问题

1.  这门课程数学功底要求很深吗,是不是特别难学?

回答:这门课程涉及的知识点较为丰富,需要一定的数学基础,但是课程属于应用数学的范畴,课堂教学从实例出发,通过建模和优化去解决实际的数据挖掘方面的问题,理论要求相对较弱,因此绝大部分同学完全可以听懂,并通过对相关算法编程,进一步巩固课程内容的深入理解。

2. 这门课将学到的重要模型和算法有哪些?

回答:本科阶段,这门课的模型和算法集中在关联分析、分类和聚类这三块内容,每块内容按照不同的思想,又可细分为多个模型和算法,建议在初学时,对关联、分类和聚类的基础算法予以掌握。

3. 对于实现算法,需要掌握何种编程语言呢?

回答:对于各类算法的实现,没有统一的编程语言或编程环境要求