为什么百度、腾讯和淘宝比你还了解你自己的喜好?医生如何利用数据分析做出正确诊断,教师是否要摒弃自身创造性为孩子提供精确有效的教育指导,以及政府、法院如何在推动信息公开的同时制定出有益于未来的制度和法案等......这些问题依赖于人们掌握大数据思维和大数据技术。
本课程让学生理解大数据、掌握大数据技术以及熟悉利用利用大数据技术解决经济与管理问题,实现大数据的价值。
学习这门课,
学生在理解大数据的基础上,掌握大数据的分类与预测、聚类、关联和异常检测等领域的业务建模,熟练运用Python语言实现分类与预测、聚类、关联和异常检测等大数据分析算法,初步掌握Hadoop、Spark等大数据系统的实现技术与工具。
课程特色在于让学生学习大数据方法、技术同时培养学生大数据思维:定量思维、相关思维和实验思维。
掌握概念内涵
掌握算法内在原理
掌握算法如何实现
掌握开源技术内核
建立大数据思维
教学内容分为9章,其中第3章有2个章末测试,其他每章1个章末测试,共有10个平时章末测试。
平时章节测验由4道单选、4道多选和2道判断题组成,限时20分钟,有2次机会。占最终成绩的60%。
期末考试由20道单选、20道多选和10道判断题组成,限时1个小时,满分100分。占最终成绩的40%。
Python编程、统计学
能够利用Python实现选择、循环、顺序等程序结构,掌握Python数据类型和实现。掌握描述性统计和推断性统计知识。
(1)王宏志,大数据分析原理与实践,机械工业出版社,2018;
(2)赵卫东,董亮,机器学习,人民邮电出版社,2018;
(3)Charu C. Aggarwal.Outlier Analysis.Springer International Publishing AG 2017;
(4)范明,范宏建译.数据挖掘导论,人民邮电出版社;2006;
(5)黄红梅,张良均,Python数据分析与应用,人民邮电出版社,2018;
(6)Thomas Erl, et.al.Big Data Fundamentals Concepts, Drivers & Techniques. Arcitura Education Inc.2016;
(7)Srinath Perera,et.al. Hadoop MapReduce Cookbook. Packt Publishing. 2013.