自2015年以来,“大数据”已成为最热门的名词之一。大数据在企业决策中扮演着越来越重要的角色,各个行业都不约而同地提出了大数据的口号,与大数据相关的新名词、新需求不断涌现,数据是未来的石油“的观念正深入人心。
与大数据需求火爆相对应的是数据人才的缺失。全面的数据改革迫在眉睫,如何真正落实大数据的应用,深入发掘数据,为各行各业带来数据驱动的变革成为了新的挑战。为了培养在校学生的大数据思维,了解大数据在不同行业的应用,本课程以行业案例为主,介绍了数据分析中的常见8大类主要任务,并配合实际操作向大家完整介绍数据分析的基本流程和操作方法。
可能很多同学会担心:(1)我的数据基础差,我能学习这门课程么?本课程在组织的时候,会尽量回避深奥的数据公式推导,而是以浅显的语言和循序渐进的方式介绍相关术语和算法概要,并使任何具备基本数学知识的人能理解整个数据处理的过程。(2)学习这门课程需要编写代码么?不需要!在我们的课程中,我们会选择一个功能齐全、开放源码、免费使用的、基于图形用户界面的数据科学工具,在使用过程中,你不需要编写任何代码,就能实现数据科学各种算法,当然如果你有Python和R的基础将能更帮助你更好地学习本课程。
总成绩在60-85分(不包含85分),评定为合格;总成绩在85分及以上,评定为优秀。
总成绩组成:
(1)视频观看:查看所有课程视频。占40分;
(2)课程讨论:在"讨论区"栏目的“课堂交流区”中完成10次或10次以上与课程内容相关的发帖或回复。占10分;
(2)线下课堂:参与线下课堂,完成线下任务。占50分。
《机器学习》,周志华,2016,清华大学出版社
《预测分析与数据挖掘 RapidMiner实现》,[美] 瓦杰·考图(Vijay Kotu) 著,严云 译,2018,人民邮电出版社