探索数据的奥秘
分享
课程详情
课程评价
spContent=我们已越来越习惯于利用数据来帮我们做决策。但是,我们对数据的解读真的可靠吗?甚至是,我们搜集的数据真的可靠吗?数据科学,强调用科学的态度对待实际应用中的数据,有其严格的流程、规范和准则。课程《探索数据的奥秘》,将开启一次数据分析的科学旅程,让我们学会科学地搜集数据与利用数据。
—— 课程团队
课程概述

伴随当今数据采集、传输、存储以及互联网技术的大力发展,社会生活中的方方面面每天都产生、积累着大量数据。对这些数据的有效处理与及时应用需求带来对传统的数据分析领域的新的挑战。针对上述挑战,近年来以互联网为代表的工业界带领了数据科学的热潮。然而,随着数据科学在业界的流行,一些由于基本概念不清晰或应用不规范而带来的结论误导(如有偏样本搜集、p值操纵等),也开始日益凸显,并进而引起了学术界的关注。

数据科学是应用科学的方法、流程、算法和系统从多种形式的结构化或非结构化数据中提取知识和洞见的交叉学科,其内容跨越数学、计算机、信息学、系统科学等多领域,难以采用传统分门别类的方法进行介绍。因此,本课程立足于数据科学中的“科学”性,从学术的严谨性追求出发,着重为学生确立数据科学中的各种基本概念与原理,建立数据科学的完整的规范化流程。具体,将遵照严谨的科学探索流程,按“问题提出-目标制定-数据收集-探索性数据分析-建立模型-评价模型-结果展示”的规范化步骤为学生依次介绍各环节的关键概念、原理和准则,并佐以丰富的案例分析和模拟项目训练,启发学生主动思考,培养学生在实践中树立严谨的科学思维方式及规范的数据科学流程,对于指导可靠的数据分析具有重要意义。

本课程所有的代码都基于Python语言编写,课程中也会有专门一章介绍Python的使用,确保没有Python基础的同学也能快速理解并使用课程中的具体代码。

本课程力求简洁、易懂,包含了丰富的案例,所以,适合所有对数据科学有兴趣的大专院校学生和社会人士学习。


授课目标

通过本课程的学习,掌握数据科学的基本概念、规范化流程和思维方法,然后能独立地完成数据科学项目。

课程大纲
预备知识

线性代数、概率论和随机过程、计算机编程基础

证书要求

根据平台规定,不提供免费电子证书,只提供认证证书,需同学提出申请。本课程期评成绩60分以上可申请合格证书,89分以上可申请优秀证书。

参考资料
  1. 黄晓林、刘斌等,《数据科学导论--探索数据的奥秘》,北京:清华大学出版社,2020

  2. Ozdemir S. Principles of Data Science(数据科学原理). 影印版.南京:东南大学出版社,2017