随着计算方法和信息技术的不断发展,大量数据的产生和收集导致信息爆炸,而信息可以产生价值,因而需要我们对这些数据进行实时和深层次的分析。单独的数据查询和统计已经不能满足深层次的分析需求,而结合统计学、数据库、机器学习等技术的数据挖掘技术可以帮助人们从数据海洋中发现隐藏的知识模式。
本课程以数据挖掘应用为主线,通过实例解释它们的原理、概念和技术,使学生明白数据挖掘常用算法的主要功能和应用场景,算法包括:决策树、贝叶斯、聚类、关联规则、神经网络、逻辑回归、时间序列、、序列聚类。其次讲解数据仓库和多维数据集的创建和分析方法等一些其他分析方法。本课程实验基于SQLServer Analysis分析平台,不需要掌握编程语言,目的是通过课程学习引导学生对数据挖掘产生兴趣,并且逐渐培养学生的数据意识,对较为成熟的技术和方法具有相应的分析应用能力。并为以后深入学习打下基础。
通过该课程的学习,使学生对数据仓库、数据挖掘、多维分析的相关基础知识有一定的了解,并对较为成熟的技术和方法具有相应的应用分析能力。引导学生对数据挖掘产生兴趣,并且逐渐培养学生的数据意识,并为以后深入学习相关理论及应用打下的基础。
MOOC成绩(30%);SPOC成绩(40%);线下考试(30%)
掌握数据库的基本概念,掌握数据库中表的基本操作。
《数据仓库与数据挖掘应用教程》 李春葆等 清华大学出版社
《数据挖掘教程》 翁敬农 等译 清华大学出版社
《数据挖掘概念与技术》 Jiawei Han 机械工业出版社
《SQL Server数据挖掘与商业智能基础及案例实战》 谢邦昌 中国水利水电出版
Q:这门课需要编程吗?
A:不需要。我们使用的是SQLServer的分析平台,在上面直接使用相应算法即可。但在大作业环节,建议大家尝试编程方法实现数据挖掘。
Q:这门课偏理论还是偏应用?
A:偏应用。