SPOC学校专有课程
数据挖掘
第1次开课
开课时间: 2021年04月23日 ~ 2021年05月19日
学时安排: 4-6小时每周
当前开课已结束 已有 29 人参加
老师已关闭该学期,无法查看
spContent=数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程,其通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 本《数据挖掘》课程以人工智能、机器学习、统计分析等课程作为先导课程,更强调数据挖掘过程中,针对真实数据中大规模、高纬度、类型复杂、非传统分布等问题的常用技术和方法,并从真实案例的数据挖掘全流程实践中培养学员的数据思维。
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程,其通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 本《数据挖掘》课程以人工智能、机器学习、统计分析等课程作为先导课程,更强调数据挖掘过程中,针对真实数据中大规模、高纬度、类型复杂、非传统分布等问题的常用技术和方法,并从真实案例的数据挖掘全流程实践中培养学员的数据思维。
—— 课程团队
课程概述
  • 课程背景

1.数据挖掘是近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,当前大数据分析几乎都离不开数据挖掘技术,应用广泛,是业界所需;

2.数据挖掘集合了概率统计、机器学习、人工智能、数据可视化、算法等等多门计算机领域核心知识,是信息技术研究的重要领域;

3.掌握数据挖掘的相关知识技能对于学生当下就业和未来深造都有重要意义。

  • 课程目标

1.帮助学生理解数据挖掘的基本方法、技术与原理

2.培养学生运用数据挖掘的基本方法、技术与原理解决实际问题的能力

3.培养学生的数据思维,促使学生以数据思维思考问题和解决问题

  • 课程设计原则

1.紧紧围绕不同数据挖掘任务中所面临的大规模、高纬度、多类型、非传统分布等问题,探索解决以上问题的一般路径;

2.以问题牵引,关联学生已有数据结构、数据库、机器学习等知识,引导学生主动思考与讨论;

3.注重技术实践,本着层层递进式原则,从数据挖掘全流程初体验、经典数据挖掘问题实践、真实应用问题实践三个不同层次展开实践教学;

成绩 要求
  • 按百分制计分:60~80分为合格,80分以上为优秀。

  • 期末考试成绩占比:40%

  • 单元测试占比:20%

  • 单元作业占比:20%

  • 课程讨论占比:20%(“课堂讨论”中回复的数量10个获得该项满分)

课程大纲


第一章 绪论



课时 1


  • 1.1 绪论




第二章 认识数据



课时 3


  • 2.1 数据类型和统计


  • 2.2 数据可视化


  • 2.3 数据相似性




第三章 数据预处理



课时 4


  • 3.1 数据清洗


  • 3.2 数据集成


  • 3.3 数据规约


  • 3.4 数据转换




第四章 朴素贝叶斯分类



课时 2


  • 4.1 贝叶斯分类基本概念


  • 4.2 贝叶斯分类案例




第五章 决策树分类



课时 3


  • 5.1 决策树基本概念


  • 5.2 决策树构建方法


  • 5.3 决策树分类案例




第六章 k-均值聚类



课时 2


  • 6.1 k-均值聚类基本方法


  • 6.2 k-均值聚类案例




第七章 逻辑回归



课时 2


  • 7.1 逻辑回归基本原理


  • 7.2 逻辑回归正则化




第八章 关联规则挖掘



课时 2


  • 8.1 关联规则挖掘概念与基本算法


展开全部
预备知识

概率统计

数据结构与算法

数据库系统

机器学习

源课程

该SPOC课程部分内容来自以上源课程,在源基础上老师进一步增加了新的课程内容

国防科技大学
2 位授课老师
李莎莎

李莎莎

讲师

王挺

王挺

教授

下载
下载

下载App