多元统计分析及R语言建模
分享
课程详情
课程评价
spContent=随着大数据、云计算和人工智能时代的来临,一门集数学、统计学和计算机科学为一体的数据科学在全世界范围内迅速兴起。多元统计分析简称多元分析,是统计学的一个重要分支,也是近几十年迅速发展的一个分支。多元统计分析方法成为处理多变量数据不可缺少的重要技术和方法,是大数据分析的重要工具。
—— 课程团队
课程概述

多元统计分析是以概率统计这门数学科学为基础,应用线性代数的基本原理和方法结合计算机对实际资料和信息进行收集、整理和分析的一门科学。因此,它的原理较为抽象,对学生的数学基础要求也较高,教学中存在着大量的数学公式、数学符号、矩阵运算和统计计算,必须借助于现代化的计算工具,本书正是基于广泛使用的统计分析软件R语言进行的。

R语言是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。在目前保护知识产权的大环境下,开发和利用R语言将对我国的统计事业有非常重大的现实意义

本书是关于R的一个应用教材。由于主要针对本科生和研究生本书将重点放在了对R的工作原理的解释和模型建立上R语言涉及广泛,因此对于学生来讲,了解和掌握一些基本概念及原理是很有必要的,关于R语言的基本统计分析请见作者编写的《数据统计分析级R语言编程》(2014)。在打下扎实的基础后,进行更深入的学习将会变得轻松许多。本着深入浅出的宗旨,本书将大量配合图表等形式,尽可能使用通俗的语言,使读者容易理解而并不失细节。

本书写作的指导思想是:在不失严谨的前提下,明显不同于纯数理类教材,努力突出实际案例的应用和统计思想的渗透,结合R语言较全面地系统介绍多元分析的实用方法。在系统介绍多元分析基本理论和方法的同时,尽力结合社会、经济、自然科学等领域的研究实例,把多元分析的方法与实际应用结合起来,注意定性分析与定量分析的紧密结合,努力把我们在实践中应用多元分析的经验和体会融入其中。几乎每种方法都强调它们各自的优缺点和实际运用中应注意的问题。为使读者掌握本书内容,又考虑到这门课程的应用性和实践性,每章给出一些简单的思考与练习。我们鼓励读者自己利用一些实际数据去实现这些方法。多元分析的应用离不开计算机,本书的案例主要运用迅速兴起的R语言实现。本书一个显著的特点是在每种方法后结合实例概要介绍了R语言的实际操作实现过程。

授课目标

   多元统计分析方法涉及较为复杂的数学理论计算繁琐。大多多元统计方法无法用手工计算,必须有计算机和统计软件的支持,因此在写作上也不可能将计算步骤逐步地写出来。作者认为对于一般的科技工作者,重要的不在于理解多元统计方法的数学原理,也不完全需要掌握具体的计算步骤,重要的是了解多元统计方法的分析目的、基本思想、分析逻辑、应用条件和结果解释。所以读者可以忽略有关章节中数学理论和具体计算过程的介绍,着重阅读每种方法的应用条件,基本分析思想,实例的具体应用和结果解释。


课程大纲

第1章  多元统计分析概述

第1章 讲义及案例分析

第一讲  引言

第二讲 多元统计分析概述

第三讲 统计技术及软件应用

第1章 单元作业

第2章 多元数据的数学表达

第二讲 多元数据的R语言使用

第一讲 多元数据的数学表达

第2章 讲义及案例分析

第2章 单元作业

第3章 多元数据的直观表示

第二讲 多元数据的R语言图书

第一讲 数据直观分析的思想

第3章 讲义及案例分析

第3章 单元作业

第4章 多元相关与回归分析

第二讲 线性回归分析模型

第一讲 相关与回归分析概述

第4章 讲义及案例分析

第4章 单元作业

第5章 广义与一般线性模型

第二讲 广义线性模型

第一讲 模型的选择

第5章 讲义及案例分析

第三讲 一般线性模型

第5章 单元作业

第6章 判别分析及R使用

第二讲 距离判别分析

第6章 讲义及案例分析

第三讲 Bayes判别

第一讲 线性判别分析

第6章 单元作业

第7章 聚类分析及R使用

第三讲 快速聚类法

第7章 讲义及案例分析

第一讲 聚类分析介绍

第二讲 系统聚类法

第7章 单元作业

第8章 主成分分析及R使用

第一讲 主成分的直观解释

第二讲 主成分性质及使用

第8章 讲义及案例分析

第8章 单元作业

第9章 因子分析及R使用

第二讲 因子载荷及旋转

第一讲 因子分析模型介绍

第三讲 因子得分及评价

第9章 讲义及案例分析

第9章 单元作业

第10章 对应分析及R使用

第一讲 对应分析的基本原理

第10章 讲义及案例分析

第二讲 对应分析的计算步骤

第10章 单元作业

第11章 典型相关分析及R使用

第11章 讲义及案例分析

第二讲 典型相关的检验与计算

第一讲 典型分析的基本框架

第11章 单元作业

第12章 多维标度法及R 使用

第12章 讲义及案例分析

第二讲 MDS的古典解法及计算

第一讲 MDS的基本理论和方法

第12章 单元作业

第13章 综合评价方法及R使用

第三讲 数据无量纲化方法

第二讲 指标体系权重的确定

第一讲 综合评价指标体系构建

第13章 讲义及案例分析

第四讲 综合评价方法应用

第13章 单元作业

预备知识

 基础的数学知识,学习过概率论和数理统计”,或者自学过“线性代数”中矩阵运算等内容。


证书要求

本课程的学习环节包含:观看讲课视频、掌握每讲的案例分析,完成每讲的练习题、完成单元测验题、参与课程讨论、参加期末考试。

   课程学习成绩由三部分构成:

   (1)单元作业:在每一章学习结束后,将有一次单元作业,题型为思考题和练习题,所有单元作业分数占课程成绩的20%

   (2)单元测验:在每一章学习结束后,将有一次单元测验,题型为选择题和填空题,所有单元测验分数占课程成绩的20%

   (3)课程考试:课程结束后,学生可以参加课程的最后考试,成绩占60%

  完成课程学习并考核合格(>=60)的可获得合格证书,成绩优秀(>80)的可获得优秀证书。



参考资料

 [1] 王斌会编著《多元统计分析及R语言建模》 暨南大学出版社,2016.3

      (第四版,“十二五”国家级规划教材)

[2] 王斌会编著《数据统计分析及R语言编程》北京大学出版社,2014.8

 [3] 王斌会编著《计量经济学模型及R语言应用》北京大学出版社,2015.5

     [4]   王斌会R语言学习博客:Rstat.leanote.com


常见问题

R语言是属于GNU系统的一个自由、免费、源代码开放的软件,是一个用于统计计算、数据分析和统计制图的优秀工具。

作为一个免费的统计软件,它有UNIXLINUXMacOSWINDOWS版本,均可免费下载和使用。R的官方网站是http://www.r-project.org。在官方网站可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得http://cran.r-project.org