课程概述

1.我为什么要学习这门课?

机器学习是人工智能的重要组成和技术基础,伴随着人工智能几十年的发展,期间几次大起大落。作为机器学习的高级阶段,最近几年深度学习算法在自然语言处理、语音识别、图像处理等领域的突破应用和广泛接受。这也标志着机器学习已经彻底迈出实验室大门,走向实践,推动着人工智能向更高阶段发展。数据应用和人工智能发展已经引起了全球关注。企业对机器学习的人才需求增大,与之密切相关的数据科学家、数据挖掘工程师、大数据分析师、机器学习工程师等数据分析类人才成为本世纪最有吸引力的职业。根据相关企业估计,上述人才的增长高峰将持续6-8年。为此,教育部批准了一批高校成立了数据科学与大数据技术、大数据应用、智能科学与技术、人工智能等相关专业,为业界培养相应的机器学习专业人才。本课程就是对机器学习感兴趣的学员准备的。

 

2.这门课的主题是什么?

在介绍传统的机器学习理论的基础上,突出了机器学习目前主流的一些内容,包括深度学习的典型算法与应用、知识图谱、机器学习在电子推荐技术的应用等。

 

3.学习这门课可以获得什么?

从早期的统计学习、发展到联结主义的神经网络、直至深度神经网络的过程中,机器学习解决了企业应用的一些问题,辅助业务人员和管理人员做出更好的决策,在一些应用领域已经达到甚至超过人的智能水平,从而引发机器学习在金融、智能制造、零售、电子商务、电信等众多行业的广泛应用。通过本课程的学习,使学员可以初步了解机器学习的常用算法以及典型的应用领域,为更深入地学习高级机器学习以及实战打下基础。


4.这门课有什么特色和亮点?

机器学习是一门理论和实践并重的课程,其中的内容比较多,很多算法也有一定的难度。机器学习的应用也需要一定的经验和技巧。本课程参阅了大量文献资料,结合过去多年的数据分析研究和实践,重新梳理了机器学习的整个课程体系,使得内容尽量覆盖机器学习的基本内容,深入浅出,学生在此基础上可以钻研机器学习高级的算法。课程通过大量的选择题、填空和判断题检验和巩固学员对基本知识的理解。


5.这门课的学习方法建议

建议结合教材《机器学习》(人民邮电出版社,2018)、《机器学习案例实战》(人民邮电出版社,2019)学习,打好基础,线下动手练习,循序渐进。

证书要求

1.按时学习每章节的视频

2.完成每章节的测试(以选择题、填空和判断题为主)

3.积极参加讨论和互评

4.通过课程的结业测试

预备知识

学习本课程需要掌握机器学习的基本概念、常用算法,并在此基础上应用于相关领域,培养一定的分析实际问题的能力。之前需要有一定的统计学、高等数学、线性代数、Python编程等基础。

授课大纲

第一单元  机器学习概论

机器学习简介

机器学习过程

机器学习常用算法(1)

机器学习常用算法(2)

机器学习常见问题

从事机器学习的准备

机器学习的常用应用领域

机器学习概述

机器学习的认识

第二单元  分类算法

主分量分析和奇异值分解

判别分析

决策树概述

ID3算法

C4.5算法和CART算法

连续属性离散化、过拟合问题

集成学习

支持向量机基本概念

支持向量机原理

支持向量机的应用

朴素贝叶斯模型

贝叶斯网络模型算法

贝叶斯网络的应用

常用分类算法的问题

决策树和分类

第三单元  神经网络基础

神经网络简介

神经网络相关概念

BP神经网络算法(1)

BP神经网络算法(2)

神经网络的应用

神经网络基础

神经网络的基本概念

第四单元  聚类分析

EM算法

聚类分析的概念

聚类分析的度量

基于划分的方法(1)

基于划分的方法(2)

基于密度聚类和基于层次聚类

基于模型的聚类

聚类算法的基本理解

聚类的应用案例分析

第五单元  可视化分析

可视化分析基础

可视化分析方法

在线教学的数据分析案例

可视化分析总结

可视化分析的应用

第六单元   关联分析

关联分析基本概念

Apriori算法

关联规则应用

关联分析及其应用

关联规则的实际应用

第七单元  回归分析

回归分析基础

线性回归分析

非线性回归分析

线性回归的总结

回归分析的应用

第八单元   文本分析

文本分析简介

文本分析基本概念

语言模型、向量空间模型

词法、分词、句法分析

语义分析

文本分析应用

知识图谱简介

知识图谱技术

知识图谱构建和应用

文本分析综合知识

文本分析的应用

第九单元  分布式机器学习、遗传算法

分布式机器学习框架

并行决策树

并行k-均值算法

并行多元线性回归模型

遗传算法基础

遗传算法的过程

遗传算法的应用

蜂群算法

分布式机器学习基础

分布式机器学习总结

分布式决策树算法

第十单元  电子推荐系统

推荐系统基础

推荐系统结构

基于人口统计学的推荐、基于内容的推荐

基于协同过滤的推荐算法

基于图的模型、基于PageRank的推荐、基于关联规则的推荐

其他推荐方法

推荐结果的评测方法

推荐结果的评测指标

推荐系统常见问题

推荐系统总结

推荐系统的应用

第十一单元  深度学习

深度学习复习

生成对抗网络

卷积基本概念

LeNet框架(1)

LeNet框架(2)

卷积基本单元

卷积神经网络训练

强化学习

迁移学习

图像定位于识别2

对偶学习

图像定位与识别1

基于卷积的股票预测

循环神经网络RNN基础

循环神经网络的训练和示例

长短期记忆网络LSTM

基于LSTM的股票预测

深度神经网络基础

深度学习的初步应用

第十二单元 面向实践的机器学习课程研讨

动手实践

机器学习复习题2

机器学习复习题1

课程教学方法研讨

参考资料

1.赵卫东,董亮编著.机器学习.北京:人民邮电出版社,2018(教材,python语言

2.赵卫东. 机器学习案例实战. 北京:人民邮电出版社,2019(实训,python语言)

3.赵卫东,董亮著.数据挖掘实用案例分析.北京:清华大学出版社,2018(案例)

常见问题

1. 我没有基础可以学习吗?

答:可以的,本课程只需要掌握必要的高等数学、线性代数和统计基础知识。

2. 机器学习算法那么多,我怎么学习?

答:可以先熟悉基本的方法和算法,培养对数据分析的兴趣,奠定一定的基础后,逐步学习较难的算法。特别推荐通过案例和应用学习。有关机器学习技能的培养很重要,具体的方法请参考论文:数据分析类课程的技能培养方法探讨(https://mp.weixin.qq.com/s/HtOZwZXMlErmn87FFIkKYQ)。

3.如何使用课程中提到的算法解决实际问题?

答:可以课后先阅读和调试一下经典的案例和代码,然后尝试解决一些简单的问题,通过参加比赛、各种技术研讨、仿真型的项目,直至参加实际项目,这是一个循序渐进的过程,需要耐心、兴趣和毅力。

4.本课程是否会讲实训的内容?

答:本课程是机器学习的基本课程,适合学习机器学习的新手,后续还会推出高级机器学习课程,到时会与线下的实训练习结合

5.本课程有无配套的实验资源?

答:有的,开课过程会提供下载地址。

6.实验是否有推荐的平台和工具?

答:以下的机器学习平台和工具可以使用:

Anaconda下载地址:https://www.anaconda.com/download/,具体的安装使用方法可以参考https://mp.weixin.qq.com/s/dfYNepLqoMRVZywh_eWWSQ

(Tensorflow等机器学习库可以使用pip命令安装)

7.本课程采用什么语言?

答:Python语言。

8.课程总体难度如何?

答:属于机器学习基本的内容,难度总体属于入门,希望学员有较好的高等数学、线性代数和统计学等基本知识。