随着信息技术的发展以及信息化基础设施的建设,企业和机构在运营过程中积累和收集了大量的业务数据,而决策部门在进行决策时却发现,这些海量的数据很难直接提供有效的、科学的决策支持,将业务数据应用于决策支持不仅是一个学术问题,同时也是一个实际应用问题,具有企业、机构应用需求的紧迫性。
本课程是传统计算机科学和管理科学的交叉学科,是新兴的基于大数据进行科学管理的知识介绍,是面向数据分析和处理的信息技术在商业中的拓展和外延。课程以案例教学为基础,依托先进的数据管理和分析软件,培养学生以数据驱动为基础的商业决策管理和风险控制理念,帮助解决传统商业和金融领域的难题。
本课程强调理论联系实际的培养模式,注重学生学以致用的能力培养 。课程在内容安排上努力使学生能够掌握基本的商务智能基础理论和技术(如,数据仓库、OLAP、数据挖据等),能够针对具体的商业问题,熟练地运用先进的数据管理和分析技术,设计并实施有效的智能解决方案,从而帮助机构提升风险预测和管理能力,促进企业采用以数据为驱动的科学管理理念,完善各种商务流程,增强科学决策能力,从而提高企业的效率和核心竞争力。
1.掌握对分析主题的抽象方法和构建模型,设计并实现比较规范的数据仓库系统。 2.掌握多维分析将数据转化为信息的本质,熟练掌握构建多维模型的方法。 3.应用商务智能软件构建数据挖掘模型,并掌握模型评价和选择标准,利用模型进行数据分析和预测。 4.初步具备利用商务智能技术解决实际问题的能力。
第一周 商务智能概述及数据仓库
1.1 商务智能概述
1.2 业务数据和分析数据
1.3 业务数据库和分析型应用
1.4 数据仓库概念
数据仓库概念
第二周 数据仓库设计
2.1 数据仓库设计方法
2.2 数据仓库三级模型
2.3 物理模型设计
2.4 元数据
2.5 数据的抽取和清洗
2.6 数据转换和装载策略
2.7 数据仓库实施
数据仓库设计
第三周 联机多维分析
3.1 多维分析模型
3.2 维度和度量
3.3 联机多维分析
多维分析
第四周 案例背景及数据仓库实施
4.1 案例背景
4.2 事实表和维度表设计
4.3 建立数据库和表
4.4 数据库备份和还原
4.5 利用BI工具创建数据仓库
数据仓库设计
第五周 数据挖掘行业应用
5.1 数据挖掘概念
5.2 金融业应用
5.3 保险业应用
5.4 证券、零售业应用
第六周 数据挖掘理论基础
6.1 数据预处理
6.2 聚类分析
6.3 关联分析
6.4 决策树分析
第七周 数据挖掘实践基础
初步使用python和jupyter编程
课程介绍与实验环境安装使用
数组(array)、序列(series)与数据框(dataframe)
第八周 数据挖掘数据预处理
使用pandas做评论数据预处理(2)
使用pandas做评论数据预处理(1)
使用pandas做评论数据预处理(3)
第九周 文本数据探索
探索评论数据
基于情感词典做情感分析
股评文本分词
第十周 数据挖掘模型
机器学习模型简介
分类模型评估
朴素贝叶斯模型
1、计算机操作基础
2、信息检索基础
3、计算机程序设计基础
4、数据库理论与应用基础
为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。
电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。
完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。
认证证书申请注意事项:
1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。
2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。
1.Delivering Business Intelligence with Microsoft SQL Server 2012 3/E. Brian Larson. McGraw Hill Professional, 2012年3月- 832 页
2. W H Inmon 著. 数据仓库(第三版). 机械工业出版社, 2003。
3. Gordon S. Linoff , Michael J. A. Berry. Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management. Wiley; 3 edition (2011)。
4. Mehmed Kantardzic 著. 数据挖掘——概念、模型、方法和算法。 清华大学出版社, 2003。
5. Ralph Kimball,Margy Ross。The Data Warehouse Toolkit: the Complete Guide to Dimensional Modeling。John Wiley & Sons Inc.
6.周志华,机器学习, 清华大学出版社, 2016
7.董付国. Python程序设计基础(第2版). 北京:清华大学出版社,2018.1