


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、负二项回归和Poisson回归在改水降氟效果中的比照分析 楚慧珠郜艳晖邹宇华李伯灵【摘要】目的:讨论存在过度离散现象时离散数据的回归分析方法。方法:比较负二项回归和Pissn回归在改水降氟效果评价资料的分析结果和拟合优度。结果:Pissn回归低估参数估计的方差,负二项回归拟合优度较高。结论:负二项回归可用于分析存在过度离散现象的离散数据。【关键词】负二项回归;Pissn回归;过度离散;地方性氟斑牙Pissn回归常用于研究一个或多个自变量对事件发生强度的影响,这时模型要求结局变量服从Pissn分布,即事件的发生是独立的,且具有总体均数和总体方差相等的特征。但在医学研究中,很多事件的发生是非独立的
2、,如传染性疾并遗传性疾并地方性疾病等等。这种资料的特点是观察到的变异方差往往大于Pissn分布的变异,即出现过度离散现象ver-dispersin。一般来说,对此类资料可基于负二项分布,用负二项回归的方法来分析各种因素对事件发生强度的影响。本研究对广东省潮阳市的改水降氟资料,用负二项回归方法评价改水措施对降低小学生氟斑牙患病率的效果,并与Pissn回归进展比较。1材料与方法1.1调查对象和内容调查对象为广东省潮阳市13个镇67个村共27840名小学16年级在校学生。检查在校学生氟斑牙情况诊断方法采用三型九度法1,并调查各村改水年限,测定各村自来水和手压井水氟含量水氟测定方法采用氟离子电极法。1
3、.2模型理论负二项分布2是当Pissn分布中强度参数服从分布时得到的复合分布。在Pissn分布中,是一常数;在负二项分布中,是一服从分布的随机变量。因此负二项分布又称为-Pissn分布。在Pissn分布中,事件数的方差等于;但在负二项分布中,事件数的方差等于1+k),其中k称为负二项离散参数3。当k0时,说明事件发生是随机的,此时负二项分布退化为Pissn分布;当k0时,说明事件的发生不独立因此存在着聚集性。当研究多个自变量对结局变量的影响时,可利用回归分析的思想。负二项回归模型与Pissn回归模型类似,也是对事件发生强度建模:lg()=0+1x1+2x2+x式中,回归系数i表示在控制其他自变
4、量的情况下xi对事件发生强度的影响大校回归系数和离散参数可通过最大似然估计得到。模型的拟合优度可采用Pearsn2检验和Deviane残差图来评价。1.3统计分析利用SAS/STAT8.1中的PRGEND模块拟合Pissn回归和负二项回归,误差分布分别指定为Pissn分布和负二项分布(NB),连接函数用对数连接。2结果与分析以小学生的氟斑牙患病人数作为结局变量,调查人数作为偏移变量ffsetvariable。考虑的影响因素包括各村改水年限年、学生年级16年级、性别、各村自来水中氟含量g/L和手压井水氟含量(g/L)。改水年限缺乏1年者以0.5年估计。表1列出拟合负二项回归和Pissn回归的参数
5、估计结果。改水年限对小学生氟斑牙患病强度的影响有统计学意义,改水时间越长,氟斑牙患病强度越低。高年级学生与低年级学生相比,氟斑牙患病强度较高,有统计学意义。但性别因素对氟斑牙患病没有影响。此外,在居民饮水中,自来水中氟含量对氟斑牙患病强度没有影响,但手压井水中氟含量越高,小学生氟斑牙患病强度也越高,有统计学意义。负二项回归模型中离散参数k的估计值为0.2663(95%I:0.2216,0.3199),与0差异有统计学意义,提示氟斑牙的发生是不独立的,存在地方性聚集现象。表1改水降氟效果评价的负二项回归和Pissn回归模型注:*为离散参数k的95可信区间。比较负二项回归和Pissn回归参数估计结
6、果,改水年限、学生年级和手压井水氟含量的回归系数在两种模型中估计比较近似,但Pissn回归估计中相应的参数方差或标准误较负二项回归估计偏低,因此假设检验2值偏大。对自来水氟含量的回归系数,Pissn回归模型的参数估计值为-0.3405,尽管没有到达统计学意义,但参数的方向背离了专业解释。从Pearsn2拟合优度检验结果可以看到,Pissn回归有较大的Pearsn2统计量,p0.0001,拟合效果很差;而负二项回归Pearsn2统计量较小,p=0.7048,说明较好的拟合优度。图1为改水降氟资料的负二项回归和Pissn回归的Deviane残差图。可以看到,由于负二项回归可以较好的拟合模型,因此残
7、差绝对值较Pissn回归的残差绝对值小,即负二项回归残差有向0点收缩的趋势。3讨论医学研究中,许多疾病由于遗传性、传染性、地方性或其它不明原因此导致不独立,如具有家庭聚集性的乙型肝炎,本研究中的地方性氟斑牙资料等。此类资料中,常常出现经历方差大于假定模型如二项分布或Pissn分布下的方差,即表现为过度离散现象。从统计学角度上说,过度离散说明所假定分布的均数和方差的关系不正确。这时直接拟合二项分布或Pissn分布并不恰当,其后果取决于过度离散程度的轻重。一般来说,过度离散现象并不影响回归参数的估计,但会低估参数的方差协方差,如表1所示,从而导致统计推断时第一类错误增加,因此需要对参数的方差协方差予以校正。另外,表1显示自来水中氟含量的回归系数Pissn回归估计反向的原因还有待于进一步考察。尽管过度离散现象也会出如今连续性比例数据4,但更常见的还是在离散数据。在离散数据模型中,负二项分布常用于拟合非独立资料,通过估计离散参数来考察事件的聚集程度。而基于负二项分布的负二项回归更可以同时估计自变量对事件发生强度的影响和离散参数,因此
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 英语-山东省淄博市滨州市2024-2025学年度2025届高三模拟考试(淄博滨州一模)试题和答案
- (一模)萍乡市2025年高三第一次模拟考试语文试卷(含答案解析)
- 防撞护角施工方案
- 第十课 《数据可视化》教学设计 2023-2024学年浙教版(2020)初中信息技术七年级上册
- 分拣工人劳务合同范本
- 认知治疗模式
- 乡下老宅转让合同范例
- 班级社会实践活动的总结与反思计划
- 班级合作项目实施计划
- 后勤保障部服务质量提升总结计划
- 2024年郑州市公安机关招聘警务辅助人员笔试真题
- 2025年贵州贵安新区产业发展控股集团有限公司招聘笔试参考题库附带答案详解
- 2025年食用仙人掌挂面项目投资可行性研究分析报告
- 化工设计知到智慧树章节测试课后答案2024年秋浙江大学
- 2.3品味美好情感 课 件 -2024-2025学年统编版道德与法治七年级下册
- 第六节-固定收益证券知识分享
- 中国企业智能化成熟度报告(2024) -企业智能化转型进入2.0时代
- 机械制造技术基础(课程课件完整版)
- 煤矿岗位标准化作业流程
- 铁路建设项目工程试验室管理标准TB104422009
- SPSS术语中英文对照详解
评论
0/150
提交评论