课程概述

本课程的特色主要包括:

(1)本课程讲授大数据分析的基本原理、相关技术和典型应用案例,学习者能够了解大数据应用系统的构造方法和过程,培养大数据思维意识,掌握数据分析的基本技术和方法。

(2)本课程以大数据处理流程为线索,分别介绍数据采集、数据清洗加工、数据分析、开源大数据计算平台、数据可视化等内容。对常用的大数据编程语言Python进行入门级介绍。

(3)课程中介绍了大量的大数据应用案例,这些案例来自于不同的行业和领域,为大家提供不同学科专业多方面的参考。

(4)课程基于华为公有云设计了在线大数据实践体系,在学习理论知识的同时,按照实验手册,亲自动手实践,体验各种算法和工具。

(5)课程介绍了大数据人才需求及常见的工作岗位,为学习者进行自身的职业规划提供参考和帮助。


本课程理论讲授部分在爱课程网学习,实践操作部分在华为双创云实践平台学习(https://bitreg.xiaoqiqiao.com/loginPage/login.html)。实践平台的部分截图如下所示:


实验启动界面:

系统概览界面:

实验操作界面:

证书要求

课程成绩构成如下所示:

  • 单元测试:20%

  • 课程实验:30%

  • 期末考试:40%

  • 参加讨论:10%

本课程没有免费证书,只有认证证书。认证证书需付费在线申请,成绩达到课程考核分数标准的学生,具备申请资格。

预备知识

了解和掌握计算机的基本概念和基本操作。

授课大纲

【第1周】初识大数据

1.5 在线实验平台介绍

【第一周】讨论题

1.1 大数据定义

1.2 大数据应用场景

1.3 大数据分析流程

1.4 如何参与大数据分析

【第一周】单元测试

【第2周】大数据应用纵览

【第二周】讨论题

2.1 大数据应用纵览

2.2 智能医疗大数据

2.3 旅游大数据案例

2.4 旅游大数据在线实验

【第3周】数据可视化

3.6 可视化在线实验

【第三周】讨论题

3.1 数据可视化简介

3.2 高维数据可视化

3.3 网络和层次化数据可视化

3.4 时空数据可视化

3.5 文本数据可视化

【第4周】Python 大数据基础

【第四周】讨论题

4.1 数据类型

4.2 数据结构

4.3 在线实验

【第四周】单元测试

【第5周】Python 大数据基础

5.1 数据存取

5.2 数据交换

5.3 数据加工和展示

5.4 在线实验

【第五周】讨论题

【第5周】单元测试

【第6周】数据分析方法

【第六周】讨论题

【第6周】单元测试

6.1 概述

6.2 统计数据分析方法

6.3 基于机器学习的分析方法

【第7周】数据分析方法

【第七周】讨论题

【第七周】 单元测试

7.1 经典机器学习算法

7.2 在线实验

【第8周】开源平台和工具

【第八周】 单元测试

8.5 在线实验

【第八周】讨论题

8.1 数据获取与清洗

8.2 数据存储与管理

8.3 数据处理与分析

8.4 资源管理与调度

参考资料

参考教材:

[1]. 《大数据导论》, 梅宏主编,高等教育出版社

[2]. 《大数据导论》,张尧学主编,机械工业出版社

[3].《python程序设计从基础开发到数据分析》,夏敏捷主编,清华大学出版社

常见问题

Q1:不会编程可以学习该课程吗?

A :  课程中的“Python大数据基础”主要讲授了面向大数据分析与设计所需要的编程基础知识,包括了数据类型、数据结构、数据存取、数据加工和展示等部分内容,并且配套了相关的在线实践内容,所以没有编程基础也可以学习该课程。


Q2:非信息类专业的学生可以学习该课程吗?

A :  该课程主要面向非信息类学生设计,提供了很多应用案例,希望大家结合专业知识和行业知识进行学习和思考。