属性数据分析
分享
课程详情
课程评价
spContent=属性数据分析广泛应用于社会科学、行为科学、生物医学、公共卫生、市场营销、教育和农业科学等许多领域,本课程仅仅要求学生具有基础统计课程的知识,包括参数统计、假设检验、回归分析模型及方差分析模型,欢迎前来学习!
—— 课程团队
课程概述

       属性数据分析主要介绍用于分析属性数据的统计模型,是面向本科生开设的介绍属性数据分析引论的课程,主要覆盖属性数据的介绍,列联表分析,广义线性模型,并重点介绍 logistic 回归模型和 logit 模型等。

       本课程采用教师讲授、学生实践相结合的实验教学形式,努力形成教师和学生双向互动,理论学习结合实践运用,达到学以致用的结果。教师讲授是主要的课堂教学方式,同时加入程序指导操作的环节,引导学生进行实践练习。在学期末要求学生提交 1 篇课程论文.

       通过本课程的学习,学生可掌握与属性数据有关的统计学基础知识,如学会何处理、建模、分析属性数据,并学会通过用广义线性模型、logistic 回归模型等理论分析属性数据。通过课堂讲授让学生具有坚实的理论基础,通过对大量典型例子的介绍和分析, 使学生掌握基本方法,并在课后的习题练习中掌握使用软件分析属性数据的方法,具有思考和分析问题,并能实际解决问题的能力。

      

课程大纲

第一周  Chapter 1  Introduction

1.1 Preface to Categorical Data Analysis

1.2 Probability Distributions for Categorical Data +1.3 Statistical Inference for A Proportion

第一章相关程序

Homework 1

第二周 Chapter 2  Contingency Tables(1)

2.1 Probability Structure for Contingency Tables

2.2 Comparing Proportions in Two-by-Two Tables

2.3 The Odds Ratio

2.4 Chi-Square Test of Independence

Answer to homework 1

第三周 Chapter 2  Contingency Tables(2)+ 程序课

2.5 Testing Independence for Ordinal Data

2.6 Exact Inference for Small Samples

2.7 Association in Three-Way Tables

第一章第二章程序课

第二章相关程序

Homework 2

第四周 Chapter 3 Generalized Linear Model(1)

3.1  Components of A Generalized Linear Model

3.2   Generalized Linear Models for Binary Data

Answer to homework 2

第五周 Chapter 3 Generalized Linear Model(2)

3.3  Generalized Linear Models for Count Data

3.4  Statistical Inference and Model Checking

第三章相关程序

Homework 3

第六周 Mid-term Exam + Answer to homework 3 

Midterm Exam

Answer to homework 3

第七周 Chapter 4 Logistic Regression(1)

4.1  Interpreting the Logistic Regression Model

4.2  Inference for Logistic Regression

第八周 Chapter 4 Logistic Regression(2)

4.3  Logistic Regression with Categorical Predictors

4.4  Multiple Logistic Regression

第四章相关程序

Homework 4

第九周 Chapter 5 Building and Applying Logistic Regression Models

5.1  Strategies in Model Selection

5.2  Model Checking

5.3  Effects of Sparse Data

Answer to homework4

第五章相关程序

Homework 5

第十周  Chapter 6 Multicategory Logit Models(1)

6.1  Logit Model for Nominal Responses

6.2 Cumulative Logit Models for Ordinal Responses

6.3 Paired-Category Ordinal Logits

Answer to homework 5

第十一周 Chapter 6 Multicategory Logit Models(2)+ 程序课

6.4 Test of Conditional Independence

Homework 6

第三、四、五、六章程序演示

第十二周 课程论文要求 + Answer to homework 6

Answer to homework 6

预备知识

要求学生具有基础统计课程的知识,如数理统计,回归分析等,不需要微积分、矩阵代数等高等数学的知识。

证书要求

本课程考试用百分制计算,成绩达到 60 分以上者为合格,具体考试及计分方法如下:

1.     作业(30%

1)完成作业,但未参与互评的学生所得最终作业分数为本人作业实际分数的50%

2)完成作业并参与互评,但未全部完成互评的学生所得最终作业分数为本人作业实际分数的80%

3)完成作业并全部完成互评的学生将100%得到本人作业实际分数。

备注:课堂练习不计入最终成绩。

 

2. 期中考试(30%

1)试题设置:共分为五道大题,每道大题有2~3个问题,共计100分,题型与单元作业题型设置类似,均为计算题和简答题。

2)期中考试开放时间为 2018431030 -- 417日晚2330,即在这一时段都内可以进行期中考试答题。

 

3. 课程论文(40%

本课程期末考试的形式是,要求在截止时间前提交一份课程论文

1)课程论文提交截止时间为:201861523:30。即日起至201861523:30之间都可以提交课程论文(word, PDF文档)。

2)课程论文要求,格式和评分细则等请见课程发表内容中的《课程论文要求和细则》  

 


参考资料

选用教材 
An Introduction to Categorical Data Analysis. Second Edition. Alan  Agresti (2007). John Wiley & Sons.

参考书目与文献 
(1) Analysis of Categorical Data. Agresti, A., New York: Wiley, 2002. 

(2) Generalized Linear Models. 2nd Ed. McCullagh P. and Nelder J.,  London: CRC Publishers, 1989. 

(3)《属性数据分析引论(第二版)》张淑梅  王睿  曾莉 译,  高等 教育出版社. 

(4)《实用多元统计方法与 SAS 系统》高惠璇,北京大学出版社.