Poisson回归模型及其应用_第1页
Poisson回归模型及其应用_第2页
Poisson回归模型及其应用_第3页
Poisson回归模型及其应用_第4页
Poisson回归模型及其应用_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Poisson回归模型及其应用回归模型及其应用宁波大学医学院宁波大学医学院 沈其君沈其君问题提出问题提出队列研究队列研究 开放队列开放队列 固定(封闭)队列固定(封闭)队列特点:随防时间长特点:随防时间长 随访中有进有出(失随访中有进有出(失访)访) 影响因素多影响因素多 低发病率低发病率M-HM-H法和标准化法法和标准化法LogisticLogistic回归模型回归模型CoxCox回归模型回归模型PoissonPoisson回归模型回归模型Poisson回归模型的引入回归模型的引入 回归分析回归分析 研究因变量与自变量间关系 分析目的分析目的 预测与控制、因素分析与筛选、危险度估计(RR和P

2、AR) LogisticLogistic回归模型回归模型 因变量为二项分布 PoissonPoisson回归模型回归模型 因变量为Poisson分布,低发生率的(分组)计数(离散)资料(如低发病率或死亡率),自变量 可以连续型或离散型率(发生数)与因素间关系率(发生数)与因素间关系 一个实例一个实例 例例 ScottoScotto等人对美国北方城市等人对美国北方城市MM城和南城和南方方D D城城1515岁以上妇女患非黑色素皮癌状况岁以上妇女患非黑色素皮癌状况进行调查,结果见表进行调查,结果见表13-313-3,年龄每,年龄每1010岁岁一层。试用一层。试用PoissonPoisson回归模型分

3、析年龄效回归模型分析年龄效应和南北城市的差别。应和南北城市的差别。 表表 13-3 M 城城与与 D 城城妇妇女女的的非非黑黑色色素素皮皮癌癌的的资资料料 M 城城(参参考考组组) D 城城 年年龄龄(岁岁) 发发癌癌例例数数 观观察察人人数数 发发癌癌例例数数 观观察察人人数数 (j) ( dj1) ( nj1) ( dj2) ( nj2) 15 1 172675 4 181343 25 16 123065 38 146207 35 30 96216 119 121374 45 71 92051 221 111353 55 102 72159 259 83004 65 130 54722 3

4、10 55932 75 133 32185 226 29007 85 及及以以上上 40 8328 65 7538 合合计计 523 651401 1242 735758 率(发生数)与因素间关系率(发生数)与因素间关系 资料结构资料结构 对于队列研究资料,设一个变量为混杂因素对于队列研究资料,设一个变量为混杂因素(如年龄)分为(如年龄)分为J J层(可以是多个因素交叉形层(可以是多个因素交叉形成的层),另一个变量为暴露因素,分为成的层),另一个变量为暴露因素,分为K K个个水平(可以是多个因素形成的水平)。假如在水平(可以是多个因素形成的水平)。假如在第第j j层 、 第层 、 第k k个

5、暴 露 水 平 (个 暴 露 水 平 (j j= 1 , 2 ,= 1 , 2 , , ,J J; ; k k=1,2,=1,2, ,K K)观察了)观察了n njk jk例(人年),其中有例(人年),其中有d djk jk例发病(或死亡)。形成如表例发病(或死亡)。形成如表13-113-1的形式。并的形式。并可计算观察发病(死亡)率或发病密度。可计算观察发病(死亡)率或发病密度。表表 13-1 开开放放队队列列资资料料分分层层列列联联表表形形式式 暴暴露露水水平平(K) 1 k K 合合计计 nj1 dj1 hj1 njk djk hjk njK djK hjK nj. dj. hj. 1

6、n11 d11 h11 n1k d1k h1k n1K d1K h1K n1. d1. h1. j nj1 dj1 hj1 njk djk hjk njK djK hjK nj dj hj J nJ1 dJ1 hJ1 nJk dJk hJk nJK dJK hJK nJ dJ hJ 表 13-1 中的h 层层别别(j) 率(发生数)与因素间关系率(发生数)与因素间关系 资料结构资料结构 表中最后一列是第表中最后一列是第j j层的发病率或发病密层的发病率或发病密度(对暴露因素求合计)。度(对暴露因素求合计)。 表中的表中的 jk jk为第为第j j层第层第k k个暴露水平下的发病个暴露水平下的发

7、病(死亡)率或发病密度的估计值,其真(死亡)率或发病密度的估计值,其真正的发病(死亡)率或发病密度为正的发病(死亡)率或发病密度为h hjkjk,是层别因素和暴露因素的作用结果。是层别因素和暴露因素的作用结果。 h层别、因素组成设计阵层别、因素组成设计阵 对于队列研究资料,将层别和因素交叉对于队列研究资料,将层别和因素交叉分组形成列联表资料,这里的层别和因分组形成列联表资料,这里的层别和因素实际上为有序分类变量资料(等级资素实际上为有序分类变量资料(等级资料),分析中可以将层别、因素用多个料),分析中可以将层别、因素用多个0101变量表示形成设计阵(变量表示形成设计阵(design desig

8、n matrixmatrix)。为叙述方便,假定)。为叙述方便,假定J J=8=8,K K=2=2,记记i i为为8 82 2列联表格子的顺序编号,则设列联表格子的顺序编号,则设计阵为表计阵为表13-213-2的形式的形式 表表 13-2 层别、因素组成设计阵层别、因素组成设计阵 格子编号格子编号(i) j k Xi1 Xi2 Xi3 Xi4 Xi5 Xi6 Xi7 Xi8 Xi9 hi 1 1 1 1 0 0 0 0 0 0 0 0 h1 2 1 2 1 0 0 0 0 0 0 0 1 h2 3 2 1 0 1 0 0 0 0 0 0 0 h3 4 2 2 0 1 0 0 0 0 0 0 1

9、 h4 5 3 1 0 0 1 0 0 0 0 0 0 h5 6 3 2 0 0 1 0 0 0 0 0 1 h6 7 4 1 0 0 0 1 0 0 0 0 0 h7 8 4 2 0 0 0 1 0 0 0 0 1 h8 9 5 1 0 0 0 0 1 0 0 0 0 h9 10 5 2 0 0 0 0 1 0 0 0 1 h10 11 6 1 0 0 0 0 0 1 0 0 0 h11 12 6 2 0 0 0 0 0 1 0 0 1 h12 13 7 1 0 0 0 0 0 0 1 0 0 h13 14 7 2 0 0 0 0 0 0 1 0 1 h14 15 8 1 0 0 0 0 0

10、 0 0 1 0 h15 16 8 2 0 0 0 0 0 0 0 1 1 h16 表表 13-2 层别、因素组成设计阵层别、因素组成设计阵(有有截截距距项项) 格子编号格子编号(i) j k Xi1 Xi2 Xi3 Xi4 Xi5 Xi6 Xi7 Xi8 hi 1 1 1 0 0 0 0 0 0 0 0 h1 2 1 2 0 0 0 0 0 0 0 1 h2 3 2 1 1 0 0 0 0 0 0 0 h3 4 2 2 1 0 0 0 0 0 0 1 h4 5 3 1 0 1 0 0 0 0 0 0 h5 6 3 2 0 1 0 0 0 0 0 1 h6 7 4 1 0 0 1 0 0 0

11、0 0 h7 8 4 2 0 0 1 0 0 0 0 1 h8 9 5 1 0 0 0 1 0 0 0 0 h9 10 5 2 0 0 0 1 0 0 0 1 h10 11 6 1 0 0 0 0 1 0 0 0 h11 12 6 2 0 0 0 0 1 0 0 1 h12 13 7 1 0 0 0 0 0 1 0 0 h13 14 7 2 0 0 0 0 0 1 0 1 h14 15 8 1 0 0 0 0 0 0 1 0 h15 16 8 2 0 0 0 0 0 0 1 1 h16 率与协变量间的回归模型结构率与协变量间的回归模型结构 在在h hjkjk与层别因素、暴露因素间可通过几与层别

12、因素、暴露因素间可通过几种不同模型结构反映其间的关系,并通种不同模型结构反映其间的关系,并通过模型中参数来反映层别因素、暴露因过模型中参数来反映层别因素、暴露因素的效应大小。若用素的效应大小。若用 j j表示层别因素第表示层别因素第j j层的效应,层的效应, k k表示暴露因素第表示暴露因素第k k个水平的个水平的效应,则常用的表示效应,则常用的表示h hjkjk与层别、暴露因与层别、暴露因素间关系的模型常见的有两种。素间关系的模型常见的有两种。加法模型加法模型(additive model) h hjk jk与层别与层别 j j、暴露因素、暴露因素 k k间加法模型表示间加法模型表示形式为形

13、式为:hjk=jk 当设计阵表示资料结构时,率的加法模当设计阵表示资料结构时,率的加法模型为型为: hi= , p=J+K-1 参数参数 j j和和 k k可以用观察数据进行估计。对可以用观察数据进行估计。对于第一暴露水平的基准组,由于于第一暴露水平的基准组,由于 1 1=0, =0, 则则有有h hj j1 1= j j, , 或或h hi i= j j。KKJJXXXX2211乘法模型乘法模型(multiplicative model) 当加法模型不成立时,常将率作对数变换,其形式为: lnhjk=jk 或表示为: hjk=exp(jk)=exp(j)exp(k) 当资料结构以设计阵形式表

14、示时,率的乘法模型形式为: )exp(2211KKJJiXXXXh乘法模型乘法模型(multiplicative model) 上述上述h hjkjk、h hi i与与 j j、 k k间的模型形式称为乘间的模型形式称为乘法模型。当层别与因素间无交互作用时,法模型。当层别与因素间无交互作用时,以以k k=1=1为基准组(为基准组(exp(exp( 1 1)=1)=1),而),而exp(exp( k k) )就是第就是第k k个暴露水平相对于基准组个暴露水平相对于基准组的疾病相对危险度。当层别与因素间存的疾病相对危险度。当层别与因素间存在交互作用时,只能分层计算第在交互作用时,只能分层计算第k

15、k个水平个水平相对于相对于k k=1=1水平的相对危险度。水平的相对危险度。幂转换模型(幂转换模型(power model)幂模型的形式为当=1时为加法模型,由于 在=0时为log(h), 即乘法模型,当在01时为一簇模型。可根据实际数据拟拟合模型的形式。但解释上不如加 法和乘法模型简单。kjjkh/ ) 1(h非线性模型(非线性模型(nonlinear model)对于流行病学资料,在研究因素与疾病对于流行病学资料,在研究因素与疾病发生间的关系时需要鉴别其间的关系是发生间的关系时需要鉴别其间的关系是加法模型还是乘法模型。然而,从经验加法模型还是乘法模型。然而,从经验和实践的角度,肿瘤等慢性病

16、流行病学和实践的角度,肿瘤等慢性病流行病学的暴露效应很多情况都符合乘法模型。的暴露效应很多情况都符合乘法模型。除加法模型和乘法模型外,率与协变量除加法模型和乘法模型外,率与协变量间可以有非线性形式,需对研究问题深间可以有非线性形式,需对研究问题深入了解的基础上来构建非线性模型入了解的基础上来构建非线性模型。Poisson回归模型及其参数估计回归模型及其参数估计 PoissonPoisson分布条件下回归模型的似然函数分布条件下回归模型的似然函数 参数估计参数估计 模型拟合度与参数检验模型拟合度与参数检验 PoissonPoisson分布下模型的似然函数分布下模型的似然函数对于低发生(病)率的开

17、放性队列研究资料,由于di服从Poisson分布,其概率函数为:其中di是随机变量,可取值为di=1,2, 其期望发生数i=nihi( )。回归模型的似然函数为Poisson分布条件下各个格子概率函数的总概率(积)。 L()=!idiidepii!)()(11ihndiiniinidehnpiii,iX参数估计参数估计 两侧取对数,回归模型的对数似然函数两侧取对数,回归模型的对数似然函数为为: : lnL()= 对数似然函数中的未知参数可以用迭代对数似然函数中的未知参数可以用迭代重复加权最小二乘法(简称重复加权最小二乘法(简称IRLSIRLS法)估法)估计,它与通常的极大似然估计结果一致。计,

18、它与通常的极大似然估计结果一致。也可用极大似然估计法也可用极大似然估计法 ),(_),(ln(iiiiiiXhnXhnd模型拟合度与参数检验模型拟合度与参数检验 偏差统计偏差统计量量 PoissonPoisson回归模型拟合好坏用偏差统计量回归模型拟合好坏用偏差统计量(deviance)(deviance)表示,偏差统计量实际上是对表示,偏差统计量实际上是对数 似 然 比 统 计 量 , 它 是 饱 和 模 型数 似 然 比 统 计 量 , 它 是 饱 和 模 型(saturated model)(saturated model)和拟合模型对数似然值和拟合模型对数似然值差的两倍,其在差的两倍,

19、其在PoissonPoisson分布条件下的计分布条件下的计算公式为:算公式为:)()ln(22iiiiidddG模型拟合度与参数检验模型拟合度与参数检验 2 2统计量统计量 G2服从于自由度为服从于自由度为n n-p-p的的 2 2分布(分布(n n为格为格子数,子数,p p为模型中参数个数)。为模型中参数个数)。 模型的拟合度也可用每个格子的实际发模型的拟合度也可用每个格子的实际发生数与期望数的生数与期望数的 2 2统计量来表示。统计量来表示。 iiiid)(22参数(因素)检验参数(因素)检验参数检验可通过两个包含不同参数个数模参数检验可通过两个包含不同参数个数模型的偏差统计量型的偏差统

20、计量G2 2的差(的差( G2 2)和自由度)和自由度的差(的差( dfdf)来实现,当)来实现,当 G2 2时,时,P P0.05, ChiSq Intercept 0 0.0000 0.0000 0.0000 0.0000 . . AGE 1 1 -11.6579 0.4487 -12.5373 -10.7784 675.01 .0001 AGE 2 1 -9.0277 0.1413 -9.3046 -8.7508 4083.79 .0001 AGE 3 1 -7.8105 0.0905 -7.9880 -7.6331 7442.69 .0001 AGE 4 1 -7.0627 0.069

21、8 -7.1996 -6.9258 10227.8 .0001 AGE 5 1 -6.5706 0.0647 -6.6974 -6.4438 10321.5 .0001 AGE 6 1 -6.0125 0.0599 -6.1299 -5.8950 10066.2 .0001 AGE 7 1 -5.5993 0.0633 -5.7233 -5.4753 7833.04 .0001 AGE 8 1 -5.4797 0.1037 -5.6828 -5.2765 2794.67 .0001 CITY 1 1 0.8043 0.0522 0.7020 0.9066 237.34 ChiSq Interc

22、ept 1 -5.4797 0.1037 -5.6828 -5.2765 2794.67 .0001 AGE1 1 -6.1782 0.4577 -7.0753 -5.2810 182.17 .0001 AGE2 1 -3.5480 0.1675 -3.8763 -3.2197 448.76 .0001 AGE3 1 -2.3308 0.1275 -2.5807 -2.0810 334.36 .0001 AGE4 1 -1.5830 0.1138 -1.8061 -1.3599 193.38 .0001 AGE5 1 -1.0909 0.1109 -1.3083 -0.8735 96.75 .

23、0001 AGE6 1 -0.5328 0.1086 -0.7457 -0.3199 24.06 .0001 AGE7 1 -0.1196 0.1109 -0.3371 0.0978 1.16 0.2809 AGE8 0 0.0000 0.0000 0.0000 0.0000 . . CITY1 1 0.8043 0.0522 0.7020 0.9066 237.34 ChiSq AGE 266.9143 CITY 8.1950 1 258.72 ChiSq AGE 7 2561.57 .0001 CITY 1 258.72 ChiSq Intercept 1 -7.0760 0.0476 -7.1694 -6.9826 22070.7 .0001 AGE1 1 2.2883 0.0627 2.1654 2.4112 1331.64 .0001 CITY1 1 0.8031 0.0522 0.7008 0.9054 236.92 ChiSq Intercept 2790.3403 AGE1 272.6493 1 2517.69 .0001 CITY 14.3722 1 25

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论