版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
广义线性模型第一页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静2明确两个概念:线性模型(linearmodel),也称经典线性模型(classicallinearmodel)或一般线性模型(generallinearmodel,GLM)。广义线性模型(generalizedlinearmodel,GENMOD)是一般线性模型的直接推广,由Nelder&Wedderburn(1972)首先提出。第二页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静3SAS软件中的PROCGLM:PROCGLManalyzesdatawithintheframeworkofgenerallinearmodels.PROCGLMhandlesmodelsrelatingoneorseveralcontinuousdependentvariablestooneorseveralindependentvariables.Theindependentvariablesmaybeeitherclassificationvariablesorcontinuousvariables.
Thus,theGLMprocedurecanbeusedformanydifferentanalyses,includingsimpleregressionmultipleregressionanalysisofvariance(ANOVA),especiallyforunbalanceddataanalysisofcovarianceresponse-surfacemodels(响应面模型)weightedregressionpolynomialregression(多项式回归)partialcorrelationmultivariateanalysisofvariance(MANOVA)repeatedmeasuresanalysisofvariance第三页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静4TheGENMODProcedureTheGENMODprocedurefits
generalizedlinearmodels.Theclassofgeneralizedlinearmodelsisanextensionoftraditionallinearmodelsthatallowsthemeanofapopulationtodependonalinearpredictorthroughanonlinearlinkfunctionandallowstheresponseprobabilitydistributiontobeanymemberofanexponentialfamilyofdistributions.Manywidelyusedstatisticalmodelsaregeneralizedlinearmodels.Theseincludeclassicallinearmodelswithnormalerrors,logisticandprobitmodelsforbinarydata,andlog-linearmodelsformultinomialdata.Manyotherusefulstatisticalmodelscanbeformulatedasgeneralizedlinearmodelsbytheselectionofanappropriatelinkfunctionandresponseprobabilitydistribution.SAS软件中的PROCGENMOD:第四页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静5一、何为“广义线性模型”?广义线性模型(generalizedlinearmodel)由Nelder&Wedderburn(1972)首先提出,是一般线性模型的直接推广,它使因变量的总体均值通过一个非线性连接函数(linkfunction)而依赖于线性预测值,同时还允许响应概率分布为指数分布族中的任何一员。许多广泛应用的统计模型均属于广义线性模型,如logistic回归模型、Probit回归模型、Poisson回归模型、负二项回归模型等。第五页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静6指数分布族的概率密度(概率函数)可表示为:其中,和为两个参数,称为自然参数,为离散参数;a、b、c为函数。第六页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静7第七页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静8一个广义线性模型包括以下三个组成部分:(1)线性成分(linearcomponent):(2)随机成分(randomcomponent):(3)连接函数(linkfunction):连接函数为一单调可微(连续且充分光滑)的函数。何为“广义线性模型”?(续)第八页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静9第九页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静10SAS9.0GENMOD过程中所整合的响应变量分布类型第十页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静11广义线性模型在两个方面对经典线性模型进行了推广:(1)一般线性模型中要求因变量是连续的且服从正态分布,在广义线性模型中,因变量的分布可扩展到非连续的资料,如二项分布、Poisson分布、负二项分布等。(2)一般线性模型中,自变量的线性预测值就是因变量的估计值,而广义线性模型中,自变量的线性预测值是因变量的函数估计值。何为“广义线性模型”?(续)第十一页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静12包括:多元线性回归模型
logistic回归模型
Probit回归模型
Poisson回归模型负二项回归模型
广义线性模型的一般形式:何为“广义线性模型”?(续)第十二页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静13Generalizedlinearmodels(广义线性模型)FamilyofregressionmodelsOutcomevariabledetermineschoiceofmodel
UsesControlofconfoundingModelbuilding,riskpredictionOutcome ModelContinuous LinearregressionBinomial LogisticregressionSurvival CoxmodelCounts Poissonregression第十三页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静14二、广义线性模型的参数估计广义线性模型的参数估计一般不能用最小二乘估计,常用加权最小二乘法(weightedleastsquared,WLS)或最大似然法(maximumlikelihood)估计。各回归系数需用迭代方法求解。求得后,用下式估计:第十四页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静15二、广义线性模型的参数估计(续)第十五页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静16Log-likelihoodfunctions第十六页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静17Log-likelihoodfunctions第十七页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静18Log-likelihoodfunctions第十八页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静19Log-likelihoodfunctions第十九页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静20三、广义线性模型的假设检验
广义线性模型的检验一般用似然比检验、Wald检验和记分检验。模型的比较用似然比检验。(1)似然比检验:似然比检验是通过比较两个相嵌套模型(如模型P嵌套于模型K内)的对数似然函数来进行的,其统计量G为:其中,模型P中的自变量是模型K中自变量的一部分,另一部分就是要检验的变量。这里G服从自由度为K-P的2分布。模型P的对数似然函数模型K的对数似然函数第二十页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静21Likelihoodratiostatistic(似然比统计量)Comparestwonestedmodels
g()=+1x1+2x2+3x3+4x4(model1)g()=+1x1+2x2(model2)LRstatistic-2log(likelihoodmodel2/likelihoodmodel1)=[-2log(likelihoodmodel2)]-
[-2log(likelihoodmodel1)]LRstatisticisa2withDF=numberofextraparametersinmodel三、广义线性模型的假设检验(1)似然比检验(续)第二十一页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静22三、广义线性模型的假设检验(续)(2)回归系数的Wald检验:
Wald检验是通过比较估计系数与0的差别来进行的,其检验统计量为:或这里,z为标准正态变量。参数的可信区间如下计算:第二十二页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静23三、广义线性模型的假设检验(续)(3)比分(Score)检验:以未包含某个或某几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数之系数为0,计算似然函数的一阶偏导数(又称有效比分)及信息矩阵,两者相乘即为比分检验统计量S。当样本含量较大时,S的分布近似服从2分布,自由度为检验的参数个数。第二十三页,共二十四页,2022年,8月28日2010-4-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版浅析劳动合同法下gaming行业劳务派遣问题2篇
- 2024年度高品质原材料供应合同版B版
- 2024版设备采购合同:戊公司与己公司之间的设备采购及安装协议3篇
- 2024版物业公司车辆管理服务合同3篇
- 2024年供应商定期供应合作合同样本一
- 2024年度道路改造项目协议版B版
- 2024年房地产专业顾问服务协议模板版
- 2024年初创公司股权分配协议3篇
- 2024年企业间借款合同
- 2024年度物流仓储服务合同:供应链管理3篇
- GB/T 3477-2008船用风雨密单扇钢质门
- GB/T 27648-2011重要湿地监测指标体系
- GB/T 21010-2017土地利用现状分类
- 格鲁尼格《卓越公共关系与传播管理》课件
- 班组学习与创新培训试题
- (新版)卫星天线理论考试参考题库(含答案)
- 三年级上册美术课件-3.色彩的变化|赣美版 (共19张PPT)
- 班主任技能大赛-13张课件
- 100道题单名数复名数单位转换
- 区块链导论课件(全)全书教学教程完整版电子教案最全幻灯片
- 公司单位档案盒各类标签可修改打印
评论
0/150
提交评论