SPOC学校专有课程
大数据分析与预测技术
分享
spContent=课程旨在培养学生利用大数据技术解决经济与管理问题,实现大数据的价值。学生在理解大数据的基础上,掌握大数据的分类与预测、聚类、关联和异常检测等领域的业务建模,熟练运用Python语言实现分类与预测、聚类、关联和异常检测等大数据分析算法,初步掌握Hadoop、Spark等大数据系统的实现技术与工具。
—— 课程团队
课程概述

为什么百度、腾讯和淘宝比你还了解你自己的喜好?医生如何利用数据分析做出正确诊断,教师是否要摒弃自身创造性为孩子提供精确有效的教育指导,以及政府、法院如何在推动信息公开的同时制定出有益于未来的制度和法案等......这些问题依赖于人们掌握大数据思维和大数据技术。

本课程让学生理解大数据、掌握大数据技术以及熟悉利用利用大数据技术解决经济与管理问题,实现大数据的价值。

学习这门课,

学生在理解大数据的基础上,掌握大数据的分类与预测、聚类、关联和异常检测等领域的业务建模,熟练运用Python语言实现分类与预测、聚类、关联和异常检测等大数据分析算法,初步掌握Hadoop、Spark等大数据系统的实现技术与工具。

课程特色在于让学生学习大数据方法、技术同时培养学生大数据思维:定量思维、相关思维和实验思维。

授课目标

掌握概念内涵

掌握算法内在原理

掌握算法如何实现

掌握开源技术内核

建立大数据思维

成绩要求

教学内容分为9章,其中第3章有2个章末测试,其他每章1个章末测试,共有10个平时章末测试。

平时章节测验由4道单选、4道多选和2道判断题组成,限时20分钟,有2次机会。占最终成绩的60%。

期末考试由20道单选、20道多选和10道判断题组成,限时1个小时,满分100分。占最终成绩的40%。

课程大纲
预备知识

Python编程、统计学

能够利用Python实现选择、循环、顺序等程序结构,掌握Python数据类型和实现。掌握描述性统计和推断性统计知识。

参考资料

(1)王宏志,大数据分析原理与实践,机械工业出版社,2018;

(2)赵卫东,董亮,机器学习,人民邮电出版社,2018;

(3)Charu C. Aggarwal.Outlier Analysis.Springer International Publishing AG 2017;

(4)范明,范宏建译.数据挖掘导论,人民邮电出版社;2006;

(5)黄红梅,张良均,Python数据分析与应用,人民邮电出版社,2018;

(6)Thomas Erl, et.al.Big Data Fundamentals Concepts, Drivers & Techniques. Arcitura Education Inc.2016;

(7)Srinath Perera,et.al. Hadoop MapReduce Cookbook.  Packt Publishing. 2013.