SPOC学校专有课程
机器学习与数据挖掘
分享
spContent=
—— 课程团队
课程概述

机器学习和数据挖掘作为大数据时代的基础方法和技术,是促进人类的社会进步、经济发展和文化提高的重要工具。本门课程将涵盖经典的机器学习算法,包括线性回归、逻辑回归、交叉验证和自助法、模型选择和正则化方法、决策树、随机森林和提升法、K近邻法、朴素贝叶斯、神经网络和聚类。学生将学习如何使用Python实现这些方法并解决实际问题。


课程目标:

  1. 理解机器学习的令人兴奋之处

  2. 能够掌握机器学习方法的思想、相关基础理论

  3. 能够利用Python语言实现算法

  4. 能够应用机器学习算法到你感兴趣的问题中

  5. 有能力开始机器学习的研究、参加大数据、机器学习、数据挖掘竞赛

成绩要求

平时成绩40% + 期末成绩60%

课程大纲
预备知识

数学分析 (或高等数学)

高等代数  (或线性代数)

概率论

数理统计 (或统计学)

Python程序设计

参考资料

教材:

[1] 李航. 统计学习方法. 清华大学出版社, 2019.5


参考书:

[1] 周志华. 机器学习. 清华大学出版社, 2016.1

[2] [] Jiawei Han, [] Micheling Kamber, [] Jian Pei ; 范明,孟小峰 ,数据挖掘: 概念与技术(原书第3版). 机械工业出版社. 2012.8

[3] Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, An Introduction to Statistical Learning: with Applications in R, Second edition, Springer, 2021

[4] Trevor Hastie, Robert Tibshirani, Jerome Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second edition, Springer, 2016

[5] Kevin P. Murphy, Machine Learning - A Probabilistic Perspective, MIT Press, 2012.5.