数据挖掘与python实践
分享
课程详情
课程评价
spContent=身处数据时代,如何在“数据爆炸但知识缺乏”的社会中沙里淘金。数据挖掘作为一门交叉学科,融合了算法、数据库、统计学、信息技术等诸多知识,不仅提供了很好的解决思路,也是有力的科研工具和人工智能发展的重要基础。思维上对数据敏感、实践中熟练掌握工具已经成为了当代数据分析人才的必备素质。
—— 课程团队
课程概述

数据挖掘与Python实践》课程主要讲授数据挖掘的基本理论、各个分支及应用。课程涵盖DM的定义、流程、数据预处理、数据可视化、关联分析、聚类、分类、数值预测等内容。通过课程学习,你将会掌握数据挖掘的基本理论、思想和方法,并通过简单易用的软件来解决相关的问题。



授课目标

1.  了解和掌握数据挖掘的基本理论、流程和方法。

2.  了解和掌握数据挖掘过程过中的技术,如数据预处理、数据可视化、关联分析、聚类、分类、数值预测等内容。

3.  通过课程学习,能通过简单易用的软件来解决数据挖掘的相关问题


课程大纲
预备知识
  1. 数理统计

  2. 高等代数

证书要求

1.考核成绩的构成比例为:平时成绩占40%,期末考试成绩占60%。按百分制计分,60分至84分为合格,85分至100分为优秀。

 

2.平时成绩分为单元检测与课后讨论两部分,单元检测占平时成绩的50%,课后讨论占平时成绩的50%。

 

3.单元检测要求同学们在期末考试前的规定时间内做答完毕,每次检测均有3次做答机会,取最高分计入成绩。

 

4.课后讨论题发布在课堂交流区。课后讨论针对每期老师留的问题,在课堂交流区进行回答。评分机制侧重于发言内容,同学们在课堂交流区内进行5次有效讨论,课后讨论得50分;10次及以上有效讨论,课后讨论得满分100分;没有进行有效讨论得0分。

 

5.期末考试占总成绩的60%,主要考察同学们对本课程所学内容的掌握程度与应用能力。

 

注:为对学生负责、保证平台证书权威性,2019年9月开始,中国大学MOOC平台不再发放免费证书,原有认证证书的申请方式和流程不变。


参考资料

1.  《数据挖掘:概念与技术》.韩家炜.(第三版). 北京:机械工业出版社,2012.

2.  《商务智能》,刘红岩.北京:清华大学出版社,2013.

3.  《机器学习》,周志华. 北京:清华大学出版社,2016.

4.  《统计学习方法》,李航. 北京:清华大学出版社,2019.

5.  《Python for Data Analysis》,Wes McKinney. O'Reilly Media, 2019.

6.  《利用Python进行数据分析》,徐敬一(译), 北京:机械工业出版社,2018.



常见问题

1.课程各单元的发布时间是什么时候?

   课程教学和发布安排一般是每个单元为一周,个别单元为两周,具体时间如表所示。


单元单元内容发布时间
第一单元导言2021/3/3    10:00:00
第二单元认识数据2021/3/10  10:00:00
第三单元数据预处理2021/3/17  10:00:00
第四单元关联规则挖掘2021/3/24  10:00:00
第五单元分类2021/4/7    10:00:00
第六单元数值预测2021/4/21  10:00:00
第七单元聚类分析2021/5/5   10:00:00
第八单元复杂数据的挖掘2021/5/19 10:00:00


2.每章测试和期末测试在什么时间?

   每章测试在每章课程教学发布之后,期末测试在课程结束后一周,2021年5月26号开始-2021年6月5号结束。