学校云 建设你的专属在线教育平台
中国大学MOOC
SPOC学校专有课程
数据挖掘
分享
spContent=欢迎来到《数据挖掘》,本课程的会尽量以多样的教学方式,使同学们利用能够利用简单易学优雅的Python便捷地获取、表示、分析和展示数据,让大家愉快地学习用Python进行数据挖掘。
—— 课程团队
课程概述

  

本课程是为电子商务本科专业开设的一门专业选修课,主要讲授数据挖掘的基本概念、原理和方法,通过对实际数据的分析更加深入地理解常用的数据挖掘模型,具有较强的实践性、应用性。

本课程的教学目的是使学生理解数据挖掘的基本概念和方法,掌握数据挖掘软件的使用方法和处理步骤,掌握几种常用的数据挖掘模型,培养学生利用数据挖掘软件对具体项目进行数据收集和对所获得数据进行处理、进行数据挖掘操作的能力,为进一步研究学习数据挖掘方法和从事实践技术工作奠定基础。

整个课程使用Python语言进行教学和实践,从Python的基本语法开始,通过案例和实战,讲授如何从本地和网络获取数据,如何表示数据,再到对数据进行预处理,以及分析、统计和可视化,直至理解几种数据挖掘模型的基本原理、应用场景以及挖掘结果的理解。最终达到使同学们能够使用Python对实际数据进行准确分析的目的。



授课目标

爱上Python,爱上数据分析,爱上用Python进行数据分析!

成绩 要求

最终成绩由平时成绩和期末成绩共同组成,具体分值分配如下

1、单元测验(15分):每一单元结束有单元测验,学生需要在规定时间内完成测试,共有三次答题机会,取最高分录入系统。

2、单元作业(25分):每单元结束后由单元作业,需要在规定时间内完成作业。

3、课堂讨论(10分):每一节课后都有讨论题目,学生在课堂交流区讨论总条数达到10条即可获得满分。

4、期末考试(50分):线上测试,学生需要在规定时间内完成,按比例计入总成绩。期末测试占总成绩的50%


课程大纲
预备知识

   本课程需要一些程序设计的基本概念如计算机求解问题的框架和一些如素数判断这样的基本算法,缺少上述基础的同学不用太担心,在上课过程中可以根据课程自己进度补充一下相关知识并多多进行编程练习即可。

参考资料

1. Python环境

Python 平台/IDE下载:

Anaconda官网下载地址:https://www.anaconda.com/distribution/

【说明】安装Anaconda后使用其中的Spyder,也可使用Anaconda中包含的Jupyter Notebook(Anaconda装好后直接启动后可使用,可将所有代码和执行结果存放于一个ipynb文件中,且能编辑和重新执行代码,还支持Markdown等文本编辑标记语言);或安装PyCharm等其他Python IDE,相比较来说,Anaconda平台已安装的第三方库更全,需要额外安装的包非常少,但内核的稳定性不如PyCharm,可根据自身情况选择安装,较优化的做法是使用PyCharm,同时在PyCharm中将解释器设为Anaconda,充分结合两者的优势,具体方式详见第一周文档说明和视频介绍~

2.Python参考书籍和网站

(1)  Python程序设计, 张莉, 金莹等. 高等教育出版社, 2019. 

(2)  Python编程 从入门到实践, [美]埃里克·马瑟斯 著, 人民邮电出版社.

(3)  SciPy科学计算:https://www.scipy.org/

(4)  Wes McKinney, Python for Data Analysis. 东南大学出版社. (英文影印本,中译版名为《利用Python进行数据分析》)

(5) Python标准手册和其他相关Python库官网文档

注:(1)将在9月初正式出版

常见问题


提问:是不是只要看完课程视频就可以完全掌握课程内容了?

回答:MOOC课程学习有它的特殊性,时长较短,并且每位学习者的基础有差异,所以我们提供了较多的In-video quiz和编程题/小项目的案例及参考答案,根据需要大家可以在视频学习后多加练习和理解。

提问:本课程是Python 2.x还是Python 3.x?

回答:Python 3.x,当然两者的区别没那么大,少部分专业必须用Python 2.x的学习者不用担心。