数据挖掘是综合了机器学习、统计和数据库的一门现代计算机技术,旨在发现海量数据中的模型与模式,具有巨大的应用前景。在很多重要领域,数据挖掘都发挥着积极的作用。因此这门课程是统计专业及相关专业的重要课程之一。
通过本课程的学习,使学生掌握商业数据预处理技术(包括数据清理、数据集成和转换、数据归约等方法)和数据挖掘技术(包括分类、预测、关联和聚类的概念与技术),并且熟悉商业数据挖掘的基本原理和发展方向。通过将理论与实践相结合,要求学生能够把所学知识与技术用于实际商业数据挖掘问题。
本课程由南京邮电大学经济学院经验丰富的教师团队主讲,所有主讲教师均在大数据领域工作多年,积累了丰硕的教学与科研成果。通过该课程的学习,学生能够实现用统计软件R进行简单的数据挖掘算法编程,了解实现数据挖掘的具体操作,也为继续深造打下坚实的基础。
本课程要求学生了解数据挖掘技术的整体概貌;掌握数据挖掘的基本概念;了解数据挖掘技术的主要应用及当前的研究热点问题和发展方向;掌握数据挖掘常用算法的原理和技术方法;熟悉数据挖掘方法的主要步骤和具体实现;会用统计软件R实现对商业数据的挖掘。
总分100分,其中期末考试占60%,在线成绩占40%。
统计学、计量经济学、统计软件R的操作