课程详情
课程评价
spContent=大数据在不论在研究还是工程领域都是热点之一,算法是大数据管理与计算的核心主题。本课程试图简要介绍大数据计算中涉及到的基本算法设计方法。适用于大数据研究与开发人员,也适用于数据科学爱好者。
—— 课程团队
课程概述

大数据算法这门课程旨在通过讲授一些大数据上基本算法设计思想,包括概率算法、I/O有效算法和并行算法,让听课的同学们接触到和传统算法课程不一样的算法设计与分析思路,并且以最新的研究成果为导向,让参与这门课程学习的同学了解大数据算法的前沿知识。通过这门课程的学习,同学可以掌握大数据算法设计的基本思想,并通过本门课程的作业,掌握大数据算法设计与分析的技术。

课程大纲

课程分为10讲,每讲1小时左右

第一讲 大数据算法概述

第二讲 亚线性算法概述

第三讲 亚线性算法例析

第四讲 外存算法概述

第五讲 外存查找结构

第六讲 外存图数据算法

第七讲 基于MapReduce的并行算法设计

第八讲 MapReduce算法例析

第九讲 非MapReduce的并行算法设计

第十讲 众包算法

预备知识

“算法设计与分析” 和 “概率与统计”

证书要求

设置“合格”(达到60%成绩)、"优秀"(达到80%成绩)两档课程标准,由任课教师签发课程结业证书,其中成绩“优秀”者将颁发优秀证书。

参考资料

《大数据算法》(作者:王宏志)

《算法导论(第三版)》(作者:Thomas H.Cormen / Charles E.Leiserson / Ronald L.Rivest / Clifford Stein;译者:殷建平 / 徐云 / 王刚 / 刘晓光 / 苏明 / 邹恒明 / 王宏志 )一书如下的章节:第1-3章,第5章,第9章,第11章,第12章,第18章,第22-25章和第34-35章。

《概率与计算》(作者:Michael Mitzenmacher;译者:史道齐)一书的如下章节:第1-5章