




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
传染病监测数据时空分析及早期预警的统计技术研究进展
四川大学华西公共卫生学院
卫生统计学教授
李晓松
2022年9月26日昆明.第一页,共一百一十八页。随着信息技术的迅速开展,已经和正在产生大量各类公共卫生信息和数据。数据分析理论的滞后和分析技术的缺失,数据所隐含的知识并未被充分认识和利用,而这些知识可能具有潜在的巨大应用价值。.第二页,共一百一十八页。3S技术等先进技术的迅速开展和应用,为深入分析和揭示公共卫生信息数据间复杂的时间和空间关系,一方面提供了重要的根底技术平台,另一方面又产生了新的数据源。.第三页,共一百一十八页。时空分析及早期预警统计技术研究进展贝叶斯时空分析技术(BayesianDiseaseMapping)多源监测数据分析技术(MultivariateSurveillanceDataAnalysis)——贝叶斯网络和隐马尔科夫模型聚集性探测(ClusterDetection)…….第四页,共一百一十八页。贝叶斯时空分析技术BayesianDiseaseMapping.第五页,共一百一十八页。多维度多尺度多层次三个基本特征传染病数据根本要素和特征传染病数据是传染病流行过程及其相关因素关系的符号化表示。时态位置属性三个基本要素.第六页,共一百一十八页。人们所观察到的传染病流行是一系列复杂的自然与社会因素综合作用的结果。所谓传染病“流行规律〞可理解为在自然与社会多源复杂因子作用下传染病流行的时空变化及其相关因素的时空共变轨迹。.第七页,共一百一十八页。贝叶斯时空分析技术
从时间轴看,在揭示传染病发病(率)随时间发生变化的同时,揭示其在每个时点上发病(率)存在的空间变异;
从空间轴看,在揭示传染病发病(率)随区域不同而发生变化的同时,揭示在这些异质的区域上发病(率)存在的时间变异。
与此同时,还指揭示与传染病发病(率)上述时空变异所关联的各种因子及其变化。.第八页,共一百一十八页。Bayes学说是不同于经典统计(频率学派)的另一大统计学派,随着计算机技术的开展和MarkovChainMonteCarlo(MCMC)抽样算法的引入,Bayes方法得以迅速开展和广泛应用。.第九页,共一百一十八页。BayesianDiseaseMapping的优势可利用人们对于传染病流行及其相关因素的先验知识确定先验分布。由于传播特性,传染病流行常呈现出时空相关性,Bayes建模可借用邻近时空信息。.第十页,共一百一十八页。自然环境数据传染病时空数据时空建模平台基于Bayes框架时空建模的传染病流行规律多维度分析GISRS信息系统.第十一页,共一百一十八页。基于Bayes框架建模充分反映了传染病数据的根本要素与特征.第十二页,共一百一十八页。多维度属性维时间维空间维多维度、多尺度和多层次病例的基本人口学特征以及与流行相关的主要自然/社会因素.第十三页,共一百一十八页。
随时间推移,各区域疟疾发病相对危险度连续发生变化各区域间相对危险度存在差异(空间异质性)相邻区域相对危险度有相似性(空间相关性)降雨量与疟疾发病的数量关系(系数)随不同时期发生变化亚马逊河区域某州某时期疟疾发病的相对危险度变化96.196.1297.1298.12
时间系数AlineA.Nobre,AlexandraM.Schmidt,HedibertF.Lopes.Spatio-temporalmodelsformappingtheincidenceofmalariainPará.Environmetrics,2005,16:291–304..第十四页,共一百一十八页。发病(率)在各个区域的时间变异:各时点(段)的空间变异。相关因素与发病(率)的影响、以及这种影响在不同时间的变化和不同空间的变化。发病(率)的空间相关性与异质性大小及其在时间上的变异。.第十五页,共一百一十八页。多尺度:传染病流行在不同时空尺度上表现出的特征可能不同。传染病时空信息在概化和细化过程中反映出的特征渐变规律探索不同时空尺度间信息转换及不同尺度的效应.第十六页,共一百一十八页。.第十七页,共一百一十八页。在全球尺度,可发现登革热广泛流行于北纬30度和南纬20度之间。.第十八页,共一百一十八页。非洲、东南亚、西太平洋地区地区、美洲加勒比地区及欧洲局部境域.第十九页,共一百一十八页。近10年其分布有向高纬度或高海拔地区扩散趋势.第二十页,共一百一十八页。.第二十一页,共一百一十八页。.第二十二页,共一百一十八页。但如在地区尺度上如我国海南地区,它可能呈散在聚集分布而未能呈现出任何规律。.第二十三页,共一百一十八页。.第二十四页,共一百一十八页。多层次国家省地市区县乡镇街道个体.第二十五页,共一百一十八页。
个体本身特征
+
所在环境特征个体是否发生传染病.第二十六页,共一百一十八页。个体(个案数据)和环境(集合数据)因素的独立和联合效应各层次因素对传染病发病(率)的影响以及对传染病发病(率)在不同层次之间变异的影响时空模型多水平模型多水平模型.第二十七页,共一百一十八页。聚集性探测ClusterDetection.第二十八页,共一百一十八页。回忆性和前瞻性两种分析策略回忆性分析:发病模式与病因探索前瞻性分析:实时监测与早期预警.第二十九页,共一百一十八页。Kullduff前瞻性时-空扫描统计量Rogerson空间模式监测方法……前瞻性聚集性探测方法.第三十页,共一百一十八页。目前我国局部地区用于预警的方法主要是单纯时间聚集性探测方法。其主要目的是探测时间序列数据中发病例数异常增加的时点。.第三十一页,共一百一十八页。单纯时间聚集性分析的主要缺乏:未利用疫情数据中的空间信息,难以及时、准确地预警。.第三十二页,共一百一十八页。国外的研究多开始于2001年炭疽恐怖事件后,纽约、华盛顿、西雅图等地先后建立了早期预警系统试点(时-空扫描统计量和贝叶斯网络等技术)。.第三十三页,共一百一十八页。国内外预警系统研究的区别探测方法监测系统国内单纯时间聚集性探测传统监测国外时空聚集性探测症状监测.第三十四页,共一百一十八页。国内外预警系统研究的区别探测方法监测系统国内单纯时间聚集性探测传统监测国外时空聚集性探测症状监测.第三十五页,共一百一十八页。前瞻性时空扫描统计量.第三十六页,共一百一十八页。研究区域扫描窗口病例.第三十七页,共一百一十八页。.第三十八页,共一百一十八页。.第三十九页,共一百一十八页。寻找病例最多的窗口:扫描统计量S.第四十页,共一百一十八页。由于传染病的特殊性,用于传染病监测的扫描统计量,其构建更为复杂。
.第四十一页,共一百一十八页。传染病时空聚集性的特点①无法预知传染病爆发可能的规模扫描窗口的大小应当是动态变化的
.第四十二页,共一百一十八页。传染病时空聚集性的特点②某些因素造成传染病发生数在时间和空间的自然变异:如季节性应当对这些因素进行校正
.第四十三页,共一百一十八页。传染病时空聚集性的特点③人口的地理分布不均匀如:城市人口密度高于农村应对人口密度的不均匀进行校正
.第四十四页,共一百一十八页。寻找病例最多的窗口:扫描统计量S如何得到P值寻找扫描统计量的概率分布?非常复杂和困难的概率理论问题.第四十五页,共一百一十八页。新近开展的Kullduff时空扫描统计量扫描窗口大小可变对非均匀的人口密度进行校正采用蒙特卡罗随机化法进行假设检验,无需再考虑扫描统计量的概率分布
.第四十六页,共一百一十八页。扫描窗口:一定地理区域空间扫描统计量.第四十七页,共一百一十八页。扫描窗口:一定时间长度时间扫描统计量.第四十八页,共一百一十八页。时空扫描统计量一定的时间长度一定的地理区域.第四十九页,共一百一十八页。.第五十页,共一百一十八页。.第五十一页,共一百一十八页。.第五十二页,共一百一十八页。.第五十三页,共一百一十八页。.第五十四页,共一百一十八页。.第五十五页,共一百一十八页。.第五十六页,共一百一十八页。.第五十七页,共一百一十八页。.第五十八页,共一百一十八页。.第五十九页,共一百一十八页。.第六十页,共一百一十八页。.第六十一页,共一百一十八页。.第六十二页,共一百一十八页。.第六十三页,共一百一十八页。.第六十四页,共一百一十八页。.第六十五页,共一百一十八页。传染病早期预警系统与可视化平台.第六十六页,共一百一十八页。数据库网络直报系统早期预警系统框架数据获取.第六十七页,共一百一十八页。数据库探测算法采用聚集性探测算法进行数据分析网络直报系统早期预警系统框架.第六十八页,共一百一十八页。数据库探测算法地理信息系统地理编码&可视化实现网络直报系统早期预警系统框架.第六十九页,共一百一十八页。数据库探测算法地理信息系统报告早期预警系统框架网络直报系统.第七十页,共一百一十八页。GoogleEarth可视化平台GE支持的图形为三维图形,较二维图形直观,且可任意改变方位和视角进行查看。GE提供的卫星影像信息包括了山川河流等地形地貌信息,可结合上述环境信息查看聚集性探测结果。
除地理图形外,GE还可容纳预警信号的相关重要信息。GE操作十分简便,便于推广应用。.第七十一页,共一百一十八页。省级前瞻性时空聚集性探测结果图示1.第七十二页,共一百一十八页。图7.12区县级前瞻性时空聚集性探测结果图示1.第七十三页,共一百一十八页。图7.13区县级前瞻性时空聚集性探测结果图示2.第七十四页,共一百一十八页。Figure.聚集性探测结果在GoogleEarth上的平面透视图(在预警信号所在位置点击鼠标左键,即可出现预警信号的详细信息,包括时间、地域、实际发病数、预期发病数、P值).第七十五页,共一百一十八页。时空两个维度聚集性探测的优势
与单纯时间聚集性分析相比,时空聚集性分析信息更为详尽,不仅可提示有无聚集性,还可对聚集性进行空间定位。.第七十六页,共一百一十八页。时空两个维度聚集性探测的优势
时-空聚集性分析充分利用了数据中的空间信息,预警更为及时。
.第七十七页,共一百一十八页。H0:传染病无聚集性(病例随机分布)拒绝H0对应爆发?“偶然〞?信息不真实?存在聚集性.第七十八页,共一百一十八页。与散发相对散发:独立发生的病例。爆发:病例之间具有流行病学上的联系。流行病学意义上的传染病爆发.第七十九页,共一百一十八页。统计聚集性流行病学爆发是否对应?现场调查:确定病例之间的流行病学联系。实验室检查:根据病原体染色体DNA的同源程度识别病例之间的联系(更为准确)。.第八十页,共一百一十八页。聚集性的原因空间自相关其它因素.第八十一页,共一百一十八页。是否需校正空间自相关?取决于需要从数据中获取什么样的信息?.第八十二页,共一百一十八页。情况Ⅰ通过空间自回归分析确定主要影响因素:如分析发病人群的主要特征,此时需校正空间自相关。否那么可能高估危险性,使得本来没有关联的因素得到具有统计学意义的结果。.第八十三页,共一百一十八页。探测传染病爆发:勿需校正空间自相关。因为所要探测的cluster很可能是空间自相关引起的。如果对其进行校正,就发现不了重要的cluster。因此,应用于早期预警模型的时空扫描统计量无需对空间自相关进行校正。情况Ⅱ.第八十四页,共一百一十八页。多源监测数据融合分析技术
Multivariatesurveillancedataanalysis
.第八十五页,共一百一十八页。在传染病监测工作中,除病例监测和症候群监测数据外,还可通过多个渠道获得相关数据,如医院就诊数据,药店OTC药物销量数据、学校缺席人数等,多源数据融合分析技术可合并多数据源建模进行传染病的预测和早期预警。.第八十六页,共一百一十八页。贝叶斯网络
BayesianNetwork.第八十七页,共一百一十八页。贝叶斯网络是一种基于贝叶斯理论的概率推理图形化网络,即通过一些监测变量的信息来获取其他感兴趣变量概率信息的过程。目前已在众多领域获得广泛应用,是近年国外传染病预警研究领域的前沿技术之一。.第八十八页,共一百一十八页。贝叶斯网络根本原理贝叶斯网络节点:变量(season、age…)有向弧段:变量间的相互关系.第八十九页,共一百一十八页。Example:炭疽释放全局节点G,指示是否存在炭疽释放。.第九十页,共一百一十八页。Example:炭疽释放界面节点I,在图中为扩散的时间和地点.第九十一页,共一百一十八页。Example:炭疽释放个体子网络P,每个子网络对应一个个体。.第九十二页,共一百一十八页。个体子网络中包含家庭地理编码、年龄、性别、呼吸道主诉、发病时间、发病地点等个人信息。.第九十三页,共一百一十八页。Example:炭疽释放人群证据节点O,代表了特定群体的集合证据。这里O代表每个地区的非处方药物的合计销量。.第九十四页,共一百一十八页。贝叶斯网络将多个渠道获得的个体数据和集合数据以网络的形式有机地结合起来,在充分考虑变量之间复杂关系的根底上,对传染病爆发的概率进行估计。.第九十五页,共一百一十八页。贝叶斯网络建立步骤数据收集医院/社区卫生效劳中心监测资料:患者的人口学信息、发病及就诊时间、家庭住址、临床症候群等;120紧急医疗救助联系电话记录电子记录;药店监测资料:相关药物每日销售量;学校、托幼机构、养老机构监测资料:各监测点机构缺勤人数及原因。.......第九十六页,共一百一十八页。指标选择召开包括传染病应急处置专业人员、流行病学家、临床专家等症候群监测涉及的相关领域的专业人员在内的专家会议。根据不同症候群的目标传染病,整理各类症候群发生的影响因素,考虑变量间的依赖关系,相关数据的可获得性和可量化性等,选取适宜的模型指标。.第九十七页,共一百一十八页。网络结构学习利用历史数据,结合先验知识,确定适宜的贝叶斯网络拓扑结构。根据实际情况选用以下两种方法:——基于统计测试的方法——基于搜索记分的方法.第九十八页,共一百一十八页。拟建立的模型节点分为四局部:全局节点G,即地区全人群特征;界面节点I,包括传染病扩散的时间和地点;个体网络P,每个子网络对应一个个体,包括人口学信息、临床症候群等,其拓扑网络结构由专家判断确定;人群证据节点O,包括非处方药物的销量、120紧急医疗救助联系电话记录、机构缺勤人数等。.第九十九页,共一百一十八页。网络参数确定在给定贝叶斯网络拓扑结构的情况下,确定各节点处的条件概率密度。贝叶斯网络的参数学习通过专家知识和训练样本学习来确定。参数估计方法:极大似然估计、极大后验概率和期望极大化算法。当后验概率超过界值可能是一次爆发。.第一百页,共一百一十八页。网络结构和参数的优化采用AMOC(activitymonitoringoperatingcharacteristic)曲线衡量模型的假阳性率,计算传染病出现爆发时间和模型预警时间的差值,并通过评价结果对模型结构进行优化。.第一百零一页,共一百一十八页。隐马尔科夫模型
HiddenMarkovModels,HMMs
themegallery.第一百零二页,共一百一十八页。隐马尔科夫模型隐马尔科夫模型(HMMs)是在Markov模型的根底上开展起来的统计模型。themegallery.第一百零三页,共一百一十八页。假定HMMs的状态(传染病状态)是不可直接监测的,监测到的只是与之对应的一些监测值(如OTC销售量、急诊量和学校缺勤数等),因而称之为“隐〞马尔科夫模型。.第一百零四页,共一百一十八页。隐马尔科夫模型底层:Markov链模型描述状态之间的转换themegallery.第一百零五页,共一百一十八页。隐马尔科夫模型上层:随机模型,描述状态与监测值的统计对应关系。themegallery.第一百零六页,共一百一十八页。隐马尔科夫模型HMMs建模是从历史数据中获取信息,将隐含的规律转化为实际的模型参数,利用历史信息并根据相似性原理来比较识别未知样本。themegallery.第一百零七页,共一百一十八页。隐马尔科夫模型国外在进入21世纪后,将其运用于流感样病例、脊髓灰质炎以及医院感染等监测资料预测疾病状态。themegallery.第一百零八页,共一百一十八页。隐马尔科夫模型结构图qt为t时刻的隐状态(传染病爆发的有无).第一百零九页,共一百一十八页。隐马尔科夫模型结构图Ot为t时刻观察到的监测资料(如OT
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗设备付款合同范例
- 与演员合同范本
- 别墅电梯采购合同范本
- 乙方出资建房合同范本
- 出售工地用车合同范本
- 劳务派遣施工合同范本
- 医疗营销合同范本
- 北京园林公司合同范本
- 代理推广合作合同范本
- 医院棉被订购合同范例
- DB12-T 3034-2023 建筑消防设施检测服务规范
- 销售人员岗位职责培训
- 小学生日常行为规范实施方案
- 2024-2025学年九年级化学人教版上册检测试卷(1-4单元)
- 2024年辽宁省鞍山岫岩满族自治县事业单位招聘(150人)历年高频难、易错点500题模拟试题附带答案详解
- DBJ46-070-2024 海南省民用建筑外门窗工程技术标准
- 金属冶炼安全生产实务注册安全工程师考试(初级)试题与参考答案
- 2024年高职高考语文必背古诗
- 护理质控护士竞聘
- 医学课件炎症性肠病4
- 2024年4月自考00263外国法制史试题及答案
评论
0/150
提交评论