本课程主要介绍了机器学习的核心理论和算法,主要内容包括以下几个部分:
第一部分机器学习定义,包括有监督学习和无监督学习;
第二部分编程基础,主要介绍Python基本语法、Numpy模块、Pandas模块、常用分支结构、sklearn库以及类与面向对象编程;
第三部分模型的评价与选择,包括数据集的划分、偏差和方差的调整、学习曲线、误差分析等;
第四部分有监督学习,包括回归和分类的基本算法:线性回归,logistic回归,决策树、随机森林、支持向量机、神经网络等;
第五部分无监督学习,包括聚类、降维、异常检测等算法。
本课程是一门比较系统的机器学习入门课程,主要面向对机器学习和Python语言感兴趣的初学者,可供本科生、部分专业的研究生以及数据分析爱好者使用。
本课程的教学目的旨在使学生掌握机器学习中的核心算法及其基本理论,并会用Python语言实现。从而学会利用机器学习,解决金融、信息工程等领域中的实际问题。重视课程知识体系的同时,要把马克思主义立场观点方法的教育与科学精神的培养结合起来,提高学生正确认识问题、分析问题和解决问题的能力。培养学生探索未知、追求真理、勇攀科学高峰的责任感和使命感。
线性代数、微积分、概率论与数理统计(或统计学)
课堂测试与作业占40%、期末考试占60%,按百分制计分,60分及以上为合格,80分及以上为优秀。
1 吴恩达,机器学习(Coursea课程讲稿,本课程的参考教材).
2 James, Witten, Hastie and Tibshirani (2013), An Introduction to Statistical Learning with Applications in R, Springer (中译本《统计学习导论-基于R应用》,机械工业出版社).
3 Trevor Hastie, Robert Tibshirani, Jerome Friedman, The Elements of Statistical Learning, Data Mining, Inference, and Prediction. Second Edition, 2008.
4 Christopher Bishop,Pattern Recognition and Machine Learning,2006.
5 Machine Learning: A Probabilistic Perspective, K. P. Murphy
6 周志华,机器学习,清华大学出版社,2016.
7 李航,统计学习方法,清华大学出版社,2012.
问: 没有编程基础是否可以学习该课程。
答:可以,机器学习是一门实用的数据分析课程,需要会一门语言,我们课程几乎是零基础起步,但没有学过编程的同学,需要花更多的时间练习编程。
声明
严禁在本教学平台发布与课程无关的非法、违禁信息,且拒绝暴力文字,提倡做文明人,共铸美好心灵。