属性数据分析
分享
课程详情
课程评价
spContent=属性数据分析广泛应用于社会科学、行为科学、生物医学、公共卫生、市场营销、教育和农业科学等许多领域,本课程仅仅要求学生具有基础统计课程的知识,包括参数统计、假设检验、回归分析模型及方差分析模型,欢迎前来学习!
—— 课程团队
课程概述

       属性数据分析主要介绍用于分析属性数据的统计模型,是面向本科生开设的介绍属性数据分析引论的课程,主要覆盖属性数据的介绍,列联表分析,广义线性模型,并重点介绍 logistic 回归模型和 logit 模型等。

       本课程采用教师讲授、学生实践相结合的实验教学形式,努力形成教师和学生双向互动,理论学习结合实践运用,达到学以致用的结果。教师讲授是主要的课堂教学方式,同时加入程序指导操作的环节,引导学生进行实践练习。在学期末要求学生提交 1 篇课程论文.

       通过本课程的学习,学生可掌握与属性数据有关的统计学基础知识,如学会何处理、建模、分析属性数据,并学会通过用广义线性模型、logistic 回归模型等理论分析属性数据。通过课堂讲授让学生具有坚实的理论基础,通过对大量典型例子的介绍和分析, 使学生掌握基本方法,并在课后的习题练习中掌握使用软件分析属性数据的方法,具有思考和分析问题,并能实际解决问题的能力。

      

课程大纲

第一周  Chapter 1  Introduction

1.1 Preface to Categorical Data Analysis

1.2 Probability Distributions for Categorical Data + 1.3 Statistical Inference for A Proportion

第一章相关程序

homework 1

第二周 Chapter 2  Contingency Tables(1)

2.1 Probability Structure for Contingency Tables

2.2 Comparing Proportions in Two-by-Two Tables

2.3 The Odds Ratio

2.4 Chi-Square Test of Independence

第三周 Chapter 2  Contingency Tables(2)+ 程序课

第一章作业答案

2.5 Testing Independence for Ordinal Data

2.6 Exact Inference for Small Samples

2.7 Association in Three-Way Tables

第一章第二章程序课

第二章相关程序

homework 2

第四周 Chapter 3 Generalized Linear Model(1)

3.1  Components of A Generalized Linear Model

3.2   Generalized Linear Models for Binary Data

第五周 Chapter 3 Generalized Linear Model(2)

第二章作业答案

3.3  Generalized Linear Models for Count Data

3.4  Statistical Inference and Model Checking

第三章相关程序

homework 3

第三章作业答案

第三章作业答案

第六周 期中考试

第七周 Chapter4 Logistic Regression(1)

4.1  Interpreting the Logistic Regression Model

4.2  Inference for Logistic Regression

第八周 Chapter4 Logistic Regression(2)

4.3  Logistic Regression with Categorical Predictors

4.4  Multiple Logistic Regression

第四章相关程序

homework4

课程论文写作要求及参考案例

课程论文写作要求及评分细则

课程论文参考案例1

课程论文参考案例2

期中考试参考答案

期中考试参考答案

第九周 Chapter5 Building and Applying Logistic Regression Models

5.1  Strategies in Model Selection

5.2  Model Checking

5.3  Effects of Sparse Data

第五章相关程序

homework5

第十周  Chapter6 Multicategory Logit Models(1)

第四章作业答案

6.1  Logit Model for Nominal Responses

6.2 Cumulative Logit Models for Ordinal Responses

6.3 Paired-Category Ordinal Logits

第十一周 Chapter6 Multicategory Logit Models(2)+程序课

第五章作业答案

6.4 Test of Conditional Independence

第三、四、五、六章程序演示

homework6

第十二周 第六章作业答案

第六章作业答案

预备知识

要求学生具有基础统计课程的知识,如数理统计,回归分析等,不需要微积分、矩阵代数等高等数学的知识。

证书要求

本课程考试用百分制计算,成绩达到 60 分以上者为合格,具体考试及计分方法如下:

1.     作业(30%

1)完成作业,但未参与互评的学生所得最终作业分数为本人作业实际分数的50%

2)完成作业并参与互评,但未全部完成5次互评的学生所得最终作业分数为本人作业实际分数的80%

3)完成作业并全部完成互评的学生将100%得到本人作业实际分数。

备注:随堂练习不计入最终成绩。

 

2. 期中考试(35%

1)试题设置:共分为五道大题,每道大题有2~3个问题,共计100分,题型与单元作业题型设置类似,均为计算题和简答题。

2)期中考试开放时间为 2018年10月291030 -- 1111日晚2330,即在这一时段都内可以进行期中考试答题。

 

3. 课程论文(35%

本课程期末考试的形式是,要求在截止时间前提交一份课程论文

1)课程论文提交截止时间为:2018年123023:30。2018年11月12日起至2018年123023:30之间都可以提交课程论文(word, PDF文档)。

2)课程论文要求,格式和评分细则等请见课程发表内容中的《课程论文要求和细则》  

 


参考资料

选用教材 
An Introduction to Categorical Data Analysis. Second Edition. Alan  Agresti (2007). John Wiley & Sons.

参考书目与文献 
(1) Analysis of Categorical Data. Agresti, A., New York: Wiley, 2002. 

(2) Generalized Linear Models. 2nd Ed. McCullagh P. and Nelder J.,  London: CRC Publishers, 1989. 

(3)《属性数据分析引论(第二版)》张淑梅  王睿  曾莉 译,  高等 教育出版社. 

(4)《实用多元统计方法与 SAS 系统》高惠璇,北京大学出版社.