SPOC学校专有课程
数据仓库与数据挖掘
分享
spContent=数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策;数据挖掘又称为数据库中的知识发现,是基于人工智能、机器学习、统计学等技术,高度自动化地分析原有的数据,进行归纳性推理,从数据仓库或数据库中提取可信的、新颖的、有效的、人们感兴趣的、能被人理解的知识的高级处理过程。本课程是数据科学与大数据技术、人工智能、计算机科学与技术等相关专业的重要课程之一。
—— 课程团队
课程概述

《数据仓库与数据挖掘》是数据科学与大数据技术、人工智能、计算机科学与技术等相关专业的重要课程之一。本课程主题是如何使用数据仓库存储管理大数据时代的海量数据,并从大数据中挖掘出潜在的价值。通过本门课程可以获得海量数据管理的技术和挖掘海量数据的各类流行的数据挖掘算法。掌握了本门课程知识将为学生成为数据科学家提供必要支撑条件。本门课程理论结合实践,使学生能够从实践中体会理论的价值。

课程大纲
预备知识

离散数学,数据结构,概率论,数据库系统原理,计算机程序设计

参考资料

教材:数据仓库与数据挖掘(第二版)陈志泊 

参考书:

[1] Jiawei Han, Micheline Kamber, Jian Pei. Data Mining: Concepts and Techniques. 3rd Edition. 韩家炜, 坎伯, 裴健. 数据挖掘:概念与技术(英文版·第3版). 机械工业出版社; 第1版 (2012年3月1日). 

[2] I.H. Witten and E. Frank. Data Mining – Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann. 威滕, 弗兰克. 数据挖掘:实用机器学习技术(原书第4版),机械工业出版社,2018年3月. 

[3] 陈封能(Pang-Ning Tan), 斯坦巴赫(Michael Steinbach), 库玛尔(Vipin Kumar),段磊 张天庆等译. 数据挖掘导论.机械工业出版社,原书第2版 (2019年8月).

[4]  W. H. Inmon. Building the Data Warehouse. Wiley Publlishing,4th Ed,2006.