第3章-广义线性模型_第1页
第3章-广义线性模型_第2页
第3章-广义线性模型_第3页
第3章-广义线性模型_第4页
第3章-广义线性模型_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主编:费宇中国人民大学出版社2023/9/51.第3章广义线性模型3.1广义线性模型概述3.2Logistic模型3.3对数线性模型2023/9/52.3.1

广义线性模型概述第2章我们研究了多元线性模型,该模型的一个重要假定是因变量是连续型的变量(通常假定服从正态分布),但在许多情况下,这种假定并不合理,例如下面这两种情况.(1)结果变量可能是类型变量.二值分类变量和多分类变量.(比如:是/否,差/一般/良好/优秀等)显然都不是连续型变量.2023/9/53.3.1广义线性模型概述(2)结果变量可能是计数型变量(比如:一周交通事故的数目)这类变量都是非负的有限值,而且它们的均值和方差通常是相关的(一般线性模型假定因变量是正态变量,而且相互独立).普通线性回归模型(2.3)假定因变量y服从正态分布,其均值满足关系式:μ=Xβ,这表明因变量的条件均值是自变量的线性组合.本章介绍两种常见的广义线性模型:Logistic模型与对数线性模型.2023/9/54.3.1广义线性模型概述1.广义线性模型的定义:(1)随机成分:设y1,y2,…,yn是来自于指数分布族的随机样本,即yi的密度函数为其中ai(.),b(.),ci(.)是已知函数,参数αi是典则参数,ϕ是散度参数.2023/9/55.1.广义线性模型的定义:(2)联结函数:设yi的均值为μi而函数m(.)是单调可微的联接函数,使得其中是协变量,是未知参数向量.2023/9/56.指数分布族正态分布二项分布泊松分布2023/9/57.2.正态线性回归模型正态分布属于指数分布族,其密度函数为与(3.1)对照可知2023/9/58.2.正态线性回归模型只要取联结函数为,则正态线性回归模型满足广义线性模型的定义.类似的,容易验证,二项分布和泊松分布都属于指数分布族.下面介绍实际中应用广泛的两种广义线性模型:Logistic模型和对数线性模型.2023/9/59.3.2Logistic模型1.模型定义 设yi服从参数为pi的二项分布,则μi=E(yi)=pi采用逻辑联结函数,即这个广义线性模型称为Logistic模型.2023/9/510.例3.1(数据文件为eg3.1)表3.1某地区45个家庭的调查数据2023/9/511.2.模型的参数估计和检验采用R软件中的广义线性模型过程glm()可以完成回归系数的估计,以及模型回归系数的显著性检验.程序如下:#eg3.1广义线性模型:Logistic模型#打开数据文件eg3.1.xls,选取A1:B46区域,然后复制data3.1<-read.table("clipboard",header=T)#将eg3.1.xls数据读入到data3.1中glm.logit<-glm(y~x,family=binomial,data=data3.1)#建立y关于x的logistic回归#模型,数据为data3.1summary(glm.logit)#模型汇总,给出模型回归系数的估计和显著性检验等yp<-predict(glm.logit,data.frame(x=15))p.fit<-exp(yp)/(1+exp(yp));p.fit#估计x=15时y=1的概率2023/9/512.运行以上程序可得如下结果:Call:glm(formula=y~x,family=binomial,data=data3.1)DevianceResiduals:Min1QMedian3QMax-1.21054-0.054980.000000.004331.87356Coefficients:EstimateStd.ErrorzvaluePr(>|z|)(Intercept)-21.280210.5203-2.0230.0431*x1.64290.83311.9720.0486*Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1(Dispersionparameterforbinomialfamilytakentobe1)Nulldeviance:62.3610on44degreesoffreedomResidualdeviance:6.1486on43degreesoffreedomAIC:10.149NumberofFisherScoringiterations:92023/9/513.2.模型的参数估计和检验>yp<-predict(glm.logit,data.frame(x=15))>p.fit<-exp(yp)/(1+exp(yp));p.fit#估计x=15时y=1的概率10.9665418容易看出:回归模型的回归系数在5%水平上显著,于是得回归模型为当x=15时,估计y=1的概率约为0.97,即年收入为15万元的家庭有私家车的可能性约为97%.2023/9/514.3.3对数线性模型1.模型的定义设y服从参数λ为的泊松分布,则μ=E(y)=λ,采用对数联结函数,即这个广义线性模型称为泊松对数线性模型.2023/9/515.例3.2(数据文件为eg3.2)表3.4

Breslow癫痫数据2023/9/516.例3.2(数据文件为eg3.2)这个数据是robust包中的Breslow癫痫数据(Breslow,1993).我们讨论在治疗初期的八周内,癫痫药物对癫痫发病数的影响,响应变量为八周内癫痫发病数(y),预测变量为前八周内的基础发病次数(x1),年龄(x2)和治疗条件(x3),其中治疗条件是二值变量,x3=0表示服用安慰剂,x3=1表示服用药物.根据这个数据建立泊松对数线性模型并对模型的系数进行显著性检验.2023/9/517.表3.2Breslow癫痫数据Nox1x2x3yNox1x2x3y1113101431192017211300143210301133625011331918119483601334242411156622055353130174…………………………284722053581336102976181425912371103038321282023/9/518.2.模型的参数估计和检验采用R软件中的广义线性模型过程glm()来建立泊松对数线性模型并对模型的系数进行显著性检验.程序如下:#eg3.2广义线性模型:泊松对数线性模型#打开数据文件eg3.2.xls,选取A1:E60区域,然后复制data3.2<-read.table(“clipboard”,header=T)#将eg3.2.xls数据读入到data3.2中glm.ln<-glm(y~x1+x2+x3,family=poisson(link=log),data=data3.2)#建立y关于#x1,x2,x3的泊松对数线性模型summary(glm.ln)#模型汇总,给出模型回归系数的估计和显著性检验等2023/9/519.运行以上程序可得如下结果:Call:glm(formula=y~x1+x2+x3,family=poisson(link=log),data=data3.2)DevianceResiduals:Min1QMedian3QMax-6.0569-2.0433-0.93970.792911.0061Coefficients:EstimateStd.ErrorzvaluePr(>|z|)(Intercept)1.94882590.135619114.370<2e-16***x10.02265170.000509344.476<2e-16***x20.02274010.00402405.6511.59e-08***x3-0.15270090.0478051-3.1940.0014**Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1(Dispersionparameterforpoissonfamilytakentobe1)Nulldeviance:2122.73on58degreesoffreedomResidualdeviance:559.44on55degreesoffreedomAIC:850.71NumberofFisherScoringiterations:52023/9/520.2.模型的参数估计和检验于是得回归模型:从检验结果可以看出:x1和x2的系数都显著,说明基础发病次数(x1),年龄(x2)和治疗条件(x3)对八周内癫痫发病数(y)重要影响.年龄(x2)的回归系数为0.0227,表明保持其他预测变量不变,年龄增加1岁,癫痫发病数的对数均值将相应的增加0.0227.2023/9/521.2.模型的参数估计和检验在因变量的初始尺度(癫痫发病数,而不是癫痫发病数的对数)上解释回归系数比较容易,因此,指数化系数:可以看出:保持其他预测变量不变,年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论