




已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
广义线性模型 Generalized linear model,2010-4-15,山东大学公共卫生学院:刘静,2,明确两个概念:,线性模型(linear model),也称经典线性模型(classical linear model)或一般线性模型(general linear model, GLM)。 广义线性模型(generalized linear model,GENMOD)是一般线性模型的直接推广,由Nelder & Wedderburn(1972)首先提出。,2010-4-15,山东大学公共卫生学院:刘静,3,SAS软件中的PROC GLM:,PROC GLM analyzes data within the framework of general linear models. PROC GLM handles models relating one or several continuous dependent variables to one or several independent variables. The independent variables may be either classification variables or continuous variables. Thus, the GLM procedure can be used for many different analyses, including simple regression multiple regression analysis of variance (ANOVA), especially for unbalanced data analysis of covariance response-surface models (响应面模型) weighted regression polynomial regression (多项式回归) partial correlation multivariate analysis of variance (MANOVA) repeated measures analysis of variance,2010-4-15,山东大学公共卫生学院:刘静,4,The GENMOD Procedure The GENMOD procedure fits generalized linear models. The class of generalized linear models is an extension of traditional linear models that allows the mean of a population to depend on a linear predictor through a nonlinear link function and allows the response probability distribution to be any member of an exponential family of distributions. Many widely used statistical models are generalized linear models. These include classical linear models with normal errors, logistic and probit models for binary data, and log-linear models for multinomial data. Many other useful statistical models can be formulated as generalized linear models by the selection of an appropriate link function and response probability distribution.,SAS软件中的PROC GENMOD:,2010-4-15,山东大学公共卫生学院:刘静,5,一、何为“广义线性模型”?,广义线性模型(generalized linear model)由Nelder & Wedderburn(1972)首先提出,是一般线性模型的直接推广,它使因变量的总体均值通过一个非线性连接函数(link function)而依赖于线性预测值,同时还允许响应概率分布为指数分布族中的任何一员。许多广泛应用的统计模型均属于广义线性模型,如logistic回归模型、Probit回归模型、Poisson回归模型、负二项回归模型等。,2010-4-15,山东大学公共卫生学院:刘静,6,指数分布族的概率密度(概率函数)可表示为:,其中,和为两个参数, 称为自然参数, 为离散参数;a、b、c为函数。,2010-4-15,山东大学公共卫生学院:刘静,7,2010-4-15,山东大学公共卫生学院:刘静,8,一个广义线性模型包括以下三个组成部分: (1)线性成分(linear component ) : (2)随机成分(random component ): (3)连接函数 ( link function): 连接函数为一单调可微(连续且充分光滑)的函数。,何为“广义线性模型”?(续),2010-4-15,山东大学公共卫生学院:刘静,9,2010-4-15,山东大学公共卫生学院:刘静,10,SAS9.0 GENMOD过程中所整合的响应变量分布类型,2010-4-15,山东大学公共卫生学院:刘静,11,广义线性模型在两个方面对经典线性模型进行了推广: (1)一般线性模型中要求因变量是连续的且服从正态分布,在广义线性模型中,因变量的分布可扩展到非连续的资料,如二项分布、Poisson分布、负二项分布等。 (2)一般线性模型中,自变量的线性预测值就是因变量的估计值,而广义线性模型中,自变量的线性预测值是因变量的函数估计值。,何为“广义线性模型”?(续),2010-4-15,山东大学公共卫生学院:刘静,12,包括:多元线性回归模型 logistic回归模型 Probit回归模型 Poisson回归模型 负二项回归模型 ,广义线性模型的一般形式:,何为“广义线性模型”?(续),2010-4-15,山东大学公共卫生学院:刘静,13,Generalized linear models(广义线性模型),Family of regression models Outcome variable determines choice of model Uses Control of confounding Model building, risk prediction,Outcome Model Continuous Linear regression Binomial Logistic regression Survival Cox model Counts Poisson regression,2010-4-15,山东大学公共卫生学院:刘静,14,二、广义线性模型的参数估计,广义线性模型的参数估计一般不能用最小二乘估计,常用加权最小二乘法(weighted least squared, WLS)或最大似然法(maximum likelihood)估计。 各回归系数需用迭代方法求解。 求得 后,用下式估计:,2010-4-15,山东大学公共卫生学院:刘静,15,二、广义线性模型的参数估计(续),2010-4-15,山东大学公共卫生学院:刘静,16,Log-likelihood functions,2010-4-15,山东大学公共卫生学院:刘静,17,Log-likelihood functions,2010-4-15,山东大学公共卫生学院:刘静,18,Log-likelihood functions,2010-4-15,山东大学公共卫生学院:刘静,19,Log-likelihood functions,2010-4-15,山东大学公共卫生学院:刘静,20,三、广义线性模型的假设检验,广义线性模型的检验一般用似然比检验、Wald检验和记分检验。模型的比较用似然比检验。 (1)似然比检验:似然比检验是通过比较两个相嵌套模型(如模型P嵌套于模型K内)的对数似然函数来进行的,其统计量G为:,其中,模型P中的自变量是模型K中自变量的一部分,另一部分就是要检验的变量。这里G服从自由度为K-P的2分布。,2010-4-15,山东大学公共卫生学院:刘静,21,Likelihood ratio statistic(似然比统计量),Compares two nested models g() = + 1x1 + 2x2 + 3x3 + 4x4 (model 1) g() = + 1x1 + 2x2 (model 2) LR statistic -2 log (likelihood model 2 / likelihood model 1) = -2 log (likelihood model 2) -2log (likelihood model 1) LR statistic is a 2 with DF = number of extra parameters in model,三、广义线性模型的假设检验 (1)似然比检验(续),2010-4-15,山东大学公共卫生学院:刘静,22,三、广义线性模型的假设检验(续),(2)回归系数的Wald检验: Wald检验是通过比较估计系数与0的差别来进行的,其检验统计量为: 或,这里,z为标准正态变量。参数的可信区间如下计算:,2010-4-15,山东大学公共卫生学院:刘静,23,三、广义线性模型的假设检验(续),(3)比分(Score)检验: 以未包含 某个或某几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数之系数为0,计算似然函数的一阶偏导数(又称有效比分)及信息矩阵,两者相乘即为比分检验统计量S。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- ppp 特许经营合同标准文本
- aia设计施工合同标准文本
- 公司转让经营合同样本
- 加盟经销合同标准文本
- 普通离心式喷雾干燥机企业县域市场拓展与下沉战略研究报告
- 智能响应材料企业ESG实践与创新战略研究报告
- 移界电泳仪企业ESG实践与创新战略研究报告
- 农产品加工专用设备企业ESG实践与创新战略研究报告
- 农村冷库建设施工合同样本
- 农村水果收购合同标准文本
- 2025届广东省高三一模生物学试卷(原卷版+解析版)
- 新工科背景下大学化学课程的创新与实践探索
- 转院转诊制度
- T-CAPT 014-2024 新闻行业 大规模预训练模型 语言模型安全性要求
- 2025年湖北省高考模拟检测卷(二)-解析卷
- 《卵石动物造型》游戏课件
- 2025年中职入团考试题型及答案
- 2025四川成都陆港枢纽投资发展集团限公司招聘人事专员1人自考难、易点模拟试卷(共500题附带答案详解)
- 湖北省部分普通高中联盟2023-2024学年高一下学期数学期中考试试卷(含答案)
- 养老院新员工安全培训
- 2025年四川雅安市名山区茗城有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论