课程概述

    在大数据爆发的短短几年中,NoSQL成为处理大数据必须掌握的热门核心技术之一。

    本课程结合MongoDB、Redis等全面介绍NoSQL数据库技术,是一门NoSQL数据库技术入门课程,也是NoSQL初学者了解NoSQL技术全貌的课程。

    《NoSQL数据库技术》课程授课语言通俗易懂,内容由浅入深,即可以让学生学好NoSQL基础知识,掌握NoSQL数据库技术,具备代码实战能力,又能培养学生系统性考虑问题的能力。非常适合向全面了解NoSQL的高校学生,相关IT工程师,和所有对NoSQL数据库感兴趣的技术人员作为入门课程学习。



课程内容:

NoSQL理论部分:
第一讲:NoSQL就是非关系型数据库
第二讲:非关系型数据库和传统数据库的区别
第三讲:NoSQL数据库四大存储模式


NoSQL实践部分:

MongoDB:
第四讲:文档数据库MongoDB入门
第五讲:文档数据库MongoDB提高
第六讲:MongoDB案例实战

Redis:
第七讲:键值数据库Redis入门
第八讲:键值数据库Redis提高
第九讲:Redis案例实战


期末考试:课程结课后一周

学习完本课程以后,欢迎继续学习后续的《大数据处理技术》课程,其中包含列族数据库HBase相关知识。

证书要求

课程总成绩是由课堂讨论(10%)、单元作业(20%)、单元测验(20%和期末考试(50%)组成。

课堂练习包含理论练习与实践练习。

单元作业包含理论作业与实践作业。

单元测验包含基础理论知识与实践知识,可先在大数据库平台上验证有效性。

期末考试包含选择题,填空题,判断题,简答题,内容包含理论知识与实践知识。



预备知识

面向对象编程、数据库、操作系统

授课大纲

第0讲 课程介绍

课程及其配套在线资源介绍

本讲配套讲义PPT-第0讲 课程介绍

第1讲 大数据概述

1.1 大数据时代

1.2 大数据概念和影响

1.3 大数据的应用

1.4 大数据的关键技术

1.5 大数据与云计算、物联网

本讲配套讲义PPT-第1讲-大数据概述

第1讲大数据概述章节单元测验

第2讲 大数据处理架构Hadoop

本讲实验答疑-第2讲-大数据处理架构Hadoop

2.1 概述

2.2 Hadoop项目结构

2.3 Hadoop的安装与使用

2.4 Hadoop集群的部署和使用

本讲配套讲义PPT-第2讲-大数据处理架构Hadoop

大数据处理架构Hadoop单元测验

第3讲 分布式文件系统HDFS

3.1 分布式文件系统HDFS简介

3.2 HDFS相关概念

3.3 HDFS体系结构

3.4 HDFS存储原理

3.5 HDFS数据读写过程

3.6 HDFS编程实践

本讲配套讲义PPT-第3讲-分布式文件系统HDFS

分布式文件系统HDFS单元测验

分布式文件系统HDFS单元作业

第4讲 分布式数据库HBase

4.1 HBase简介

4.2 HBase数据模型

4.3 HBase的实现原理

4.4 HBase运行机制

4.5 HBase应用方案

4.6 HBase安装配置和常用Shell命令

4.7 HBase常用Java API及应用实例

本讲配套讲义PPT-第4讲-分布式数据库HBase

分布式数据库HBase单元测验

分布式数据库HBase单元作业

第5讲 NoSQL数据库

5.1 NoSQL概述

5.2 NoSQL与关系数据库的比较

5.3 NoSQL的四大类型

5.4 NoSQL的三大基石

5.5 从NoSQL到NewSQL数据库

5.6 文档数据库MongoDB

本讲配套讲义PPT-第5讲-NoSQL数据库

NoSQL数据库单元测验

第6讲 云数据库

6.1 云数据库概述

6.2 云数据库产品

6.3 云数据库系统架构

6.4 Amazon AWS和云数据库

6.5 微软云数据库SQL Azure

6.6 云数据库实践

本讲配套讲义PPT-第6讲-云数据库

云数据库单元测验

第7讲 MapReduce

7.1 MapReduce概述

7.2 MapReduce的体系结构

7.3 MapReduce工作流程

7.4 Shuffle过程原理

7.5 MapReduce应用程序执行过程

7.6 实例分析:WordCount

7.7 MapReduce的具体应用

7.8 MapReduce编程实践

本讲配套讲义PPT-第7讲-MapReduce

MapReduce单元测验

第8讲 数据仓库Hive

8.1 数据仓库概念

8.2 Hive简介

8.3 SQL转换成MapReduce作业的原理

8.4 Impala

8.5 Hive编程实践

本讲配套讲义PPT-第8讲-数据仓库Hive

数据仓库Hive单元测验

第9讲 Hadoop再探讨

9.1 Hadoop的优化与发展

9.2 HDFS2.0的新特性

9.3 新一代资源管理调度框架YARN

9.4 Hadoop生态系统中具有代表性的功能组件

本讲配套讲义PPT-第9讲-Hadoop再探讨

Hadoop再探讨单元测验

第10讲 Spark

10.1 Spark概述

10.2 Spark生态系统

10.3 Spark运行架构

10.4 Spark SQL

10.5 Spark的部署和应用方式

10.6 Spark编程实践

本讲配套讲义PPT-第10讲-Spark

Spark单元测验

第11讲 流计算

11.1 流计算概述

11.2 流计算处理流程

11.3 流计算的应用

11.4 开源流计算框架Storm

11.5 Spark Streaming、Samza以及三种流计算框架的比较

11.6 Storm编程实践

本讲配套讲义PPT-第11讲-流计算

流计算单元测验

第12讲 图计算

12.1 图计算简介

12.2 Pregel简介

12.3 Pregel图计算模型

12.4 Pregel的C++ API

12.5 Pregel的体系结构

12.6 Pregel的应用实例——单源最短路径

12.7 Hama的安装和使用

本讲配套讲义PPT-第12讲-图计算

图计算单元测验

第13讲 大数据在不同领域的应用

13.1 大数据应用概览

13.2 推荐系统

13.3 大数据在智能医疗和智能物流领域运用

本讲配套讲义PPT-第13讲-大数据在不同领域的应用

大数据在不同领域的应用单元测验

参考资料

1,相关教材

刘瑜.NoSQL数据库入门与实践,中国水利水电出版社,2019年6月

2,各种技术综合网站

综合网站上包含了各种NoSQL数据库技术专题,可以根据自身需要去寻找对应的内容,并进行在线交流。

https://nosql-database.org/,NoSQL官网,可以了解所有已经公布的NoSQL数据库情况,英文。

https://blog.chinaunix.net/,ChinaUnix,中文。

https://bbs.csdn.net/,CSDN论坛

https://www.oschina.net/project/tag/235/nosql,开源中国,中文

https://database.51cto.com/,51CTO数据库,中文

https://bbs.51cto.com/forumdisplay.php?fid=341,51CTO关于NoSQL技术论坛

3,各种源代码下载及学习地址

https://www.mongodb.org/,MongoDB官网,英文

https://www.mongodb.org.cn/,MongoDB中文网,中文

https://redis.io,Redis官网,英文

https://www.redis.cn/,Redis中文官网,中文

https://hbase.apache.org/,HBase官网,英文

【后续学习内容】学习完本入门级课程以后,欢迎继续学习后续的《大数据处理技术》课程,其中包含列族数据库HBase相关知识。