学校云 建设你的专属在线教育平台
中国大学MOOC
SPOC学校专有课程
人工智能
分享
spContent=本课程采用案例教学法: 边理论边实践,理论与实践并重,理论以实践为背景,实践以理论为指引。 案例教学四步走:数据分析,数据挖掘,特征工程,机器学习。 教学方法四步走:问题导向,深入浅出,循序渐进,一以贯之。
—— 课程团队
课程概述

我为什么要学习这门课?

无论你身处何种行业,何种职位,大数据与机器学习都有可能成为你创新的动力,创新的理由,创新的重要选项。

这门课的主题是关于什么?

本课程精选七个大数据与机器学习经典案例,全部采用国际著名机构发布的真实数据,研究领域涉及房产零售、生物信息、图像处理、蛋白质折叠、自动驾驶、机器问答、植物病理等。

案例从数据分析和预处理开始,到特征工程,再到机器学习建模,最后完成模型评估,系统推演,丝毫毕现。对于历史经典模型(LeNet-5)、结构优美的模型(VGG-16)、自身应用广泛并对后来算法影响深远的模型(ResNetInception)、性能卓著的后起之秀模型(YOLOv1v4DenseNetEfficientNetEfficientDetBERT)等,予以重点关注。

本课程具备高阶性、创新性与挑战性三种创新特质,可做为大数据与人工智能专业学习、毕业设计指导课程、创新训练指导课程、实训实习指导课程,亦可供研究生和工程技术人员学习参考。


学习这门课可以获得什么?

从数据分析和预处理开始,到数据挖掘,再到机器学习建模,最后是模型评估,构成了一个个完整的复杂系统推演过程,本课程契合教育部新工科培养体系中复杂系统设计能力的教学目标,让您在工程实践中熏陶成长,在复杂系统设计中淬炼过硬本领。

这门课有什么特色和亮点?

案例在易读、易学、易用、易模仿、易创新等方面,坚持一流教学标准,用一流课程标准引领各个环节的创作,既有内容美,又有形式美,让您学得轻松,学得快乐,学有所成。总之,按照认知规律,抽丝剥茧,层层推进,多种模型对比分析,做到让每个案例都纲举目张,助推构建知识大局观。


授课目标

目标1理解掌握数据分析与处理的基本方法,熟练应用Numpy、Pandas、Matplotlib、Seaborn等数据分析与处理工具。


目标2理解掌握深度学习的基本原理,如卷积神经网络(CNN)、序列模型与循环神经网络、自然语言处理(NLP)等。


目标3理解掌握经典与前沿机器学习模型。对于历史经典模型(LeNet-5)、结构优美的模型(VGG-16)、自身应用广泛并对后来算法影响深远的模型(ResNet、Inception),性能卓著的后起之秀模型(YOLO v1~v4、DenseNet、EfficientNet、EfficientDet、BERT)等,予以重点关注。


目标4边理论边实践,结合具体应用领域,如房产零售、生物信息、图像处理、蛋白质折叠、自动驾驶、机器问答、植物病理等,提升实战能力。


成绩 要求

课程满分100分。包含以下四项考核:

【1】单元测验,占总分比例20%

【2】单元作业,占总分比例20%

【3】课程讨论,占总分比例10%

【4】期末考试,占总分比例50%

 

客观题评分标准为:

(1)单选题:1分/题

(2)多选题:2分/题

(3)判断题:1分/题

(4)填空题:2分/题

 

主观题(作业题)评分标准为:

(1)作业互评最少个数为5个。

(2)互评完成度的奖惩计分规则为:

l  未参与互评的学生将给与所得分数:50%。

l  未完成互评的学生将给与所得分数的80%。

l  全部完成互评的学生将给与所得分数的100%

l  备注:学生作业成绩为作业各计分项去掉最小和最大值后的平均值之和


课程大纲
预备知识

[1] Python程序设计:熟练掌握Python程序设计方法。

[2] 概率与数理统计:理解掌握基本的概率与数理统计模型。

[3] 线性代数:理解掌握向量、矩阵的运算。

[4] 较好的自学能力,能短时间熟悉理解Numpy、Pandas、Matplotlib、Seaborn、TensorFlow、Keras等编程框架的用法。


参考资料

[1] 董相志,张志旺,田生文,曲海平.大数据与机器学习经典案例(微课视频版).北京:清华大学出版社,2020.
[2] 吴恩达. 神经网络和深度学习. 《网易云课堂》
[3] 吴恩达. 改善深层神经网络:参数调试、正则化以及优化. 《网易云课堂》
[4] 吴恩达. 结构化机器学习项目. 《网易云课堂》
[5] 吴恩达. 卷积神经网络. 《网易云课堂》
[6] 吴恩达. 序列模型. 《网易云课堂》
[7] (美)Ian Goodfellow,(加)Yoshua Bengio,(加)Aaron Courville.深度学习.北京:人民邮电出版社,2017.
[8] 周志华.机器学习.北京:清华大学出版社,2016.[9] 雷明.机器学习—原理、算法与应用.北京:清华大学出版社,2019.
[10] (美) Stephen Lucci,(美)Danny Ko.人工智能(第2版).北京:人民邮电出版社,2018.
[11] (美) Stuart J.Russell,(美) Peter Norvig.人工智能:一种现代的方法(第3版).北京:清华大学出版社,2013.


常见问题

【1】本课程采用何种编程环境?

Jupyter Notebook

【2】需要安装那些开源软件包?

Anaconda安装包+TensorFlow2.1以上版本+Keras

Anaconda安装包已经包含常用的机器学习软件框架,如Numpy、Pandas、Matplotlib、

Seaborn等。某些情况需要根据项目需要单独安装或升级一些其他第三方开源框架

【3】如何获得项目使用的数据集?

     数据集文件超过100MB,请在课程中提供的开源地址下载

     如果数据集文件比较小,请在课程学习资料中下载。