版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
广义线性模型第一页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静2明确两个概念:线性模型(linearmodel),也称经典线性模型(classicallinearmodel)或一般线性模型(generallinearmodel,GLM)。广义线性模型(generalizedlinearmodel,GENMOD)是一般线性模型的直接推广,由Nelder&Wedderburn(1972)首先提出。第二页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静3SAS软件中的PROCGLM:PROCGLManalyzesdatawithintheframeworkofgenerallinearmodels.PROCGLMhandlesmodelsrelatingoneorseveralcontinuousdependentvariablestooneorseveralindependentvariables.Theindependentvariablesmaybeeitherclassificationvariablesorcontinuousvariables.
Thus,theGLMprocedurecanbeusedformanydifferentanalyses,includingsimpleregressionmultipleregressionanalysisofvariance(ANOVA),especiallyforunbalanceddataanalysisofcovarianceresponse-surfacemodels(响应面模型)weightedregressionpolynomialregression(多项式回归)partialcorrelationmultivariateanalysisofvariance(MANOVA)repeatedmeasuresanalysisofvariance第三页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静4TheGENMODProcedureTheGENMODprocedurefits
generalizedlinearmodels.Theclassofgeneralizedlinearmodelsisanextensionoftraditionallinearmodelsthatallowsthemeanofapopulationtodependonalinearpredictorthroughanonlinearlinkfunctionandallowstheresponseprobabilitydistributiontobeanymemberofanexponentialfamilyofdistributions.Manywidelyusedstatisticalmodelsaregeneralizedlinearmodels.Theseincludeclassicallinearmodelswithnormalerrors,logisticandprobitmodelsforbinarydata,andlog-linearmodelsformultinomialdata.Manyotherusefulstatisticalmodelscanbeformulatedasgeneralizedlinearmodelsbytheselectionofanappropriatelinkfunctionandresponseprobabilitydistribution.SAS软件中的PROCGENMOD:第四页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静5一、何为“广义线性模型”?广义线性模型(generalizedlinearmodel)由Nelder&Wedderburn(1972)首先提出,是一般线性模型的直接推广,它使因变量的总体均值通过一个非线性连接函数(linkfunction)而依赖于线性预测值,同时还允许响应概率分布为指数分布族中的任何一员。许多广泛应用的统计模型均属于广义线性模型,如logistic回归模型、Probit回归模型、Poisson回归模型、负二项回归模型等。第五页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静6指数分布族的概率密度(概率函数)可表示为:其中,和为两个参数,称为自然参数,为离散参数;a、b、c为函数。第六页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静7第七页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静8一个广义线性模型包括以下三个组成部分:(1)线性成分(linearcomponent):(2)随机成分(randomcomponent):(3)连接函数(linkfunction):连接函数为一单调可微(连续且充分光滑)的函数。何为“广义线性模型”?(续)第八页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静9第九页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静10SAS9.0GENMOD过程中所整合的响应变量分布类型第十页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静11广义线性模型在两个方面对经典线性模型进行了推广:(1)一般线性模型中要求因变量是连续的且服从正态分布,在广义线性模型中,因变量的分布可扩展到非连续的资料,如二项分布、Poisson分布、负二项分布等。(2)一般线性模型中,自变量的线性预测值就是因变量的估计值,而广义线性模型中,自变量的线性预测值是因变量的函数估计值。何为“广义线性模型”?(续)第十一页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静12包括:多元线性回归模型
logistic回归模型
Probit回归模型
Poisson回归模型负二项回归模型
广义线性模型的一般形式:何为“广义线性模型”?(续)第十二页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静13Generalizedlinearmodels(广义线性模型)FamilyofregressionmodelsOutcomevariabledetermineschoiceofmodel
UsesControlofconfoundingModelbuilding,riskpredictionOutcome ModelContinuous LinearregressionBinomial LogisticregressionSurvival CoxmodelCounts Poissonregression第十三页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静14二、广义线性模型的参数估计广义线性模型的参数估计一般不能用最小二乘估计,常用加权最小二乘法(weightedleastsquared,WLS)或最大似然法(maximumlikelihood)估计。各回归系数需用迭代方法求解。求得后,用下式估计:第十四页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静15二、广义线性模型的参数估计(续)第十五页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静16Log-likelihoodfunctions第十六页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静17Log-likelihoodfunctions第十七页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静18Log-likelihoodfunctions第十八页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静19Log-likelihoodfunctions第十九页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静20三、广义线性模型的假设检验
广义线性模型的检验一般用似然比检验、Wald检验和记分检验。模型的比较用似然比检验。(1)似然比检验:似然比检验是通过比较两个相嵌套模型(如模型P嵌套于模型K内)的对数似然函数来进行的,其统计量G为:其中,模型P中的自变量是模型K中自变量的一部分,另一部分就是要检验的变量。这里G服从自由度为K-P的2分布。模型P的对数似然函数模型K的对数似然函数第二十页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静21Likelihoodratiostatistic(似然比统计量)Comparestwonestedmodels
g()=+1x1+2x2+3x3+4x4(model1)g()=+1x1+2x2(model2)LRstatistic-2log(likelihoodmodel2/likelihoodmodel1)=[-2log(likelihoodmodel2)]-
[-2log(likelihoodmodel1)]LRstatisticisa2withDF=numberofextraparametersinmodel三、广义线性模型的假设检验(1)似然比检验(续)第二十一页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静22三、广义线性模型的假设检验(续)(2)回归系数的Wald检验:
Wald检验是通过比较估计系数与0的差别来进行的,其检验统计量为:或这里,z为标准正态变量。参数的可信区间如下计算:第二十二页,共二十四页,2022年,8月28日2010-4-15山东大学公共卫生学院:刘静23三、广义线性模型的假设检验(续)(3)比分(Score)检验:以未包含某个或某几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数之系数为0,计算似然函数的一阶偏导数(又称有效比分)及信息矩阵,两者相乘即为比分检验统计量S。当样本含量较大时,S的分布近似服从2分布,自由度为检验的参数个数。第二十三页,共二十四页,2022年,8月28日2010-4-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 4D生物材料调控免疫微环境的修复策略
- 2025年东莞市竹溪中学招聘体育临聘教师备考题库及1套完整答案详解
- 九年级上册第六单元课外古诗词诵读二《丑奴儿·书博山道中壁》课件
- 3D打印导板在神经外科手术中的精准穿刺技术
- 3D打印器官移植的伦理安全评估框架
- 简约风棕色团队建设培训
- 3D可视化技术在脑动脉瘤手术中的应用策略
- 张家港市第一人民医院招聘劳务派遣人员20人备考题库及1套完整答案详解
- 陕西省西咸新区秦汉中学2026年教师招聘备考题库有答案详解
- 生成式人工智能在历史竞赛课堂中的应用差异及适配性分析教学研究课题报告
- 口腔解剖生理学牙的一般知识-医学课件
- 2026年1月辽宁省普通高中学业水平合格性考试地理仿真模拟卷01(考试版)
- 酒店股权转让合同范本
- 关于某某脑机接口数据采集与使用知情同意书
- 绿盟科技安全培训内容课件
- 安生生产法规定
- 国开2025年《行政领导学》形考作业1-4答案
- 2025年湖南水利水电职业技术学院单招《职业适应性测试》真题(真题汇编)附答案详解
- 广东省德育课题申报书
- 铁路专业基础知识考试题及答案
- 2025年职业技能鉴定考试(考评员)经典试题及答案
评论
0/150
提交评论