课程概述

       本课程公共通识类课程,目的是向各专业大学生普及大数据的基础知识。使学生能够了解大数据的基本概念、基本技术和应用场景,理解大数据分析的基本原理和方法,并能够应用大数据思维和分析方法解决本专业的相关问题。课程的特色是:

1、课程内容与实际应用紧密结合;

2、通过实例与案例分析,加深学习者对课程知识的理解;

3、充分利用媒体展示内容,使得课程内容直观形象、易于理解;

4、强调互动,让学生可以充分参与到教学的过程中,收获最好的教学效果。

证书要求

为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。

 

电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。

 

完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。

 

认证证书申请注意事项:

1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。

2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。


预备知识

掌握计算机应用的基础知识,以及Windows、Linux系统和MS Office的基本使用方法。

授课大纲

课程简介

《大数据导论》课程简介

第一章 绪论

1.5 大数据的现状与发展趋势

1.4 大数据的安全与共享

1.1 什么是大数据

1.2 大数据的价值和作用

1.3 大数据时代的思维变革

第一章单元测试(1)

第一章单元测试(2)

第二章 大数据相关技术基础

2.1 大数据相关技术基础(1):云计算和Hadoop简介

2.2 大数据相关技术基础(2):大数据采集和预处理

2.3 大数据相关技术基础(3):大数据计算、分析与可视化

第二单元测验(1)

第三章 数据采集与预处理

3.1 大数据的来源

3.2 大数据采集

3.3 大数据预处理

3.4 大数据集成

《数据采集与预处理》实践指导书

第三单元测试(1)

第四章 Hadoop架构和大数据存储简介

4.1 hadoop简介之一

4.1 hadoop简介之二

4.2 HDFS的简要介绍

4.3 基于HDFS的数据库之一

4.3 基于HDFS的数据库之二

4.3 基于HDFS的数据库之三

4.4 一种基于Hadoop的数据仓库之一

4.4 一种基于Hadoop的数据仓库之二

4.4 一种基于Hadoop的数据仓库之三

《大数据实验环境构建》实验指导书1

单元测验:hadoop简介

单元测验:HDFS

单元测验:Hbase

单元测验:Hive

第五章 典型大数据计算框架

5.1 一种并行编程模型--MapReduce-之一

5.1 一种并行编程模型--MapReduce-之二

5.1 一种并行编程模型--MapReduce-之三

5.1 一种并行编程模型--MapReduce-之四

5.2 Apache Spark之一

5.2 Apache Spark之二

5.2 Apache Spark之三

第五章单元测试1-MapReduce

第五章单元测试2-Spark

第六章 大数据分析

6.1 数据描述性分析

6.2 回归分析

6.3 聚类分析

6.4 分类分析

6.5 Weka数据挖掘软件简介

第六章单元测验1-数据描述性分析

第六章单元测试2-聚类算法

第六章单元测试3-分类算法

第七章 大数据可视化

7.1.1 数据可视化的概念

7.1.2 数据可视化的发展历程

7.1.3 数据可视化技术

7.2.1 数据可视化的技术分类

7.2.2 数据可视化具体方法

7.3.1 数据可视化工具简介

7.3.2 Excel数据可视化方法与应用

7.3.3 Tableau可视化基础

第七章单元测试1

第七章单元测试2

第八章 大数据的应用

8.1 大数据的广泛应用

8.2.1 推荐系统-1

8.2.2 推荐系统-2

8.3.1 城市大数据-1

8.3.2 城市大数据-2

第八章单元测试1

第八章单元测试2

参考资料
  1. 严宣辉,罗天键,严雨薇,大数据导论,电子工业出版社,2024.12
  2. 张尧学,胡春明主编. 大数据导论(第2版). 机械工业出版社,2021.7
  3. 严宣辉,张仕,赖会霞,韩凤萍. 大数据技术及应用——基于Python语言. 电子工业出版社. 2021.10