机器学习和数据挖掘作为大数据时代的基础方法和技术,是促进人类的社会进步、经济发展和文化提高的重要工具。本门课程将涵盖经典的机器学习算法,包括线性回归、逻辑回归、交叉验证和自助法、模型选择和正则化方法、决策树、随机森林和提升法、K近邻法、朴素贝叶斯、神经网络和聚类。学生将学习如何使用Python实现这些方法并解决实际问题。
课程目标:
理解机器学习的令人兴奋之处
能够掌握机器学习方法的思想、相关基础理论
能够利用Python语言实现算法
能够应用机器学习算法到你感兴趣的问题中
有能力开始机器学习的研究、参加大数据、机器学习、数据挖掘竞赛
平时成绩40% + 期末成绩60%
数学分析 (或高等数学)
高等代数 (或线性代数)
概率论
数理统计 (或统计学)
Python程序设计
教材:
[1] 李航. 统计学习方法. 清华大学出版社, 2019.5
参考书:
[1] 周志华. 机器学习. 清华大学出版社, 2016.1
[2] [美] Jiawei Han, [美] Micheling Kamber, [美] Jian Pei 等 著; 范明,孟小峰 译,数据挖掘: 概念与技术(原书第3版). 机械工业出版社. 2012.8
[3] Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, An Introduction to Statistical Learning: with Applications in R, Second edition, Springer, 2021
[4] Trevor Hastie, Robert Tibshirani, Jerome Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second edition, Springer, 2016
[5] Kevin P. Murphy, Machine Learning - A Probabilistic Perspective, MIT Press, 2012.5.