数据仓库与数据挖掘
分享
课程详情
课程评价
spContent=信息时代的到来,以及数据获取手段的多样,促使各行各业都积累了海量的格式各异的数据,其类型包括表格数据、文本数据、图形图像,视频数据,等等。 爆炸式增长的数据量,为快速的查找、访问需要的信息,以及从这些海量的数据里发现有价值的信息带来了困难。那么,如何高效的实现数据管理,方便快速的从中获取有价值的信息,并能够提供辅助决策,就成了当今各行各业急需解决的重要问题。 青岛大学王常颖老师和隋毅老师开设的《数据仓库与数据挖掘》课程,从海量数据的存储方式——数据仓库与OLAP开始讲起,通过介绍数据预处理中的数据清洗、数据变换、数据集成等技术、数据挖掘中的关联、聚类、分类和序列模式挖掘等算法,以及经典数据挖掘算法的Python编程实践,带领大家开启数据沙漠中的掘金之旅。
—— 课程团队
课程概述

通过本课程的学习,学生能够理解数据库技术的发展为何导致数据挖掘、以及数据挖掘潜在应用的重要性;掌握数据仓库和多维数据结构,OLAP(联机分析处理)的实现以及数据仓库与数据挖掘的关系;熟悉数据挖掘之前的数据预处理技术;掌握数据挖掘技术的关联、聚类、分类、序列分析等常用算法的原理和算法;掌握经典数据挖掘算法的Python编程实践。

本课程由青岛大学数据科学与软件工程学院与计算机科学技术学院经验丰富的教师团队主讲,所有主讲教师均在大数据领域工作多年,积累了丰硕的教学与科研成果。通过该课程的学习,学生能够为将来从事数据仓库的规划和实施以及数据挖掘技术的研究工作打下一定的基础。

授课目标

知识目标1:理解数据挖掘的基本概念和原理

知识目标2:学习和掌握数据挖掘的关联分析、分类分析、聚类分析等常用算法

知识目标3:培养学生应用数据挖掘技术对现实数据进行有效分析和处理的能力

知识目标4:培养学生能够用主流的Python语言进行数据挖掘


能力目标 1:具备分析、推理和解决工程问题的能力;

能力目标2:具有自主学习和终身学习的意识,有不断学习和适应发展的能力

能力目标 3:具备与业界同行及社会公众进行有效沟通与交流的能力

课程大纲
预备知识

Python程序设计语言、数据结构、算法分析

证书要求

为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。

 

电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。

 

完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。

 

认证证书申请注意事项:

1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。

2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。


参考资料

1. 李爱国、厍向阳编著,《数据挖掘原理、算法及应用》,西安电子科技大学出版社,2012年。

2. 王仁武编著,《Python与数据科学》,华东师范大学出版社,2016年。

3. 吴振宇、李春忠、李建锋编著,《Python数据处理与挖掘》,人民邮电出版社,2020年。

4.邵峰晶、于忠清、王金龙、孙仁诚编著,《数据挖掘原理与算法》,科学出版社,2009年。