本门课程共包括数据科学概述、大数据关键技术分析、Python基础、函数和模块、文件读取、数据采集、 数据处理:NumPy、数据处理:Pandas统计分析、数据可视化与利用等九部分内容。最后一章利用一个实际的项目,为同学们展示数据分析的整个流程。通过学习本课程,目的是使学生能够掌握数据科学的基本概念、基本理论,并在此基础上掌握Python数据分析工具以及在管理实践中的应用。
课程目标1:了解数据科学的基础概念,基本理论。
课程目标2:了解Python语言的基础概念、Python的安装与运行、Python程序开发与基本语法、基本数据类型、运算符与表达式,以及程序的控制结构。
课程目标3:熟悉网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。
课程目标4:了解Scrapy框架以及其中主要的类,如何用编写网络爬虫测试网站,自动化处理。
课程目标5:了解numpy数组的特点、属性及创建,数组的形状操作,数组数据的获取,数组的基本运算及广播机制,数组的排序及统计分析,矩阵的创建及运算,文本数据文件及二进制文件的读写。
学生应该掌握计算机基础、高等数学和统计学的相关知识。
为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。
电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 http://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。
完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。
认证证书申请注意事项:
1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。
2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。
数据科学:理论、方法与Python语言实践,谢健民主编,人民邮电出版社。ISBN:9787115585950