香港mems短期流行预测方法的应用_第1页
香港mems短期流行预测方法的应用_第2页
香港mems短期流行预测方法的应用_第3页
香港mems短期流行预测方法的应用_第4页
香港mems短期流行预测方法的应用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

香港mems短期流行预测方法的应用

严重的急性呼吸综合征(ss)是新世界首次在世界范围内传播的传染病,平均死亡率为11%。SARS流行虽然结束了,但是其阴影并未完全消失,禽流感目前正在亚洲多个国家流行,因此,研究SARS流行规律,预测感染人数的变化趋势,有着重要的医学意义和社会价值,也可以为将来可能发生的新病毒性传染病的预防与控制提供参考。以往的研究主要是通过数学模型描述SARS的传播过程,分析感染人数的变化规律及预测流行的高峰期及结束期等。研究方法包括确定性微分方程、系统动力学模型、基于统计学和随机过程进行建模等。但是这些研究大都只是采用一种方法,没有联合几种方法对流行数据进行预测,并从中选出较好的预测流行的方法。本研究同时采用数理统计学与系统工程学方法,包括曲线拟合、Gamma分布、时间序列和灰色动态GM(1,1)模型等13种方法,对每日病例数进行预测,通过比较预测效果选出较好的预测方法,为今后预测SARS感染人数的变化规律及其预防控制提供依据。1材料和方法1.1全球“香港旅行”的发现香港每日SARS病例数据来源于香港卫生署提供的每日SARS疫情通报。SARS在香港的流行始于2003年3月11日。世界卫生组织于流行第74天(2003年5月23日)撤消对香港的旅行警告,因此,我们把流行第74天定义为流行结束。但是,在流行第75天至第93天期间,每天仍发现0~4例病例。香港从流行第94天(2003年6月12日)开始再没有新增病例出现。1.2基于时间序列的方法由于各段流行曲线的平稳度不同,其预测的难易程度也不同,因此,流行第1天至第73天被分为三段:上升段(流行第1天至第32天,即2003年3月11日至2003年4月11日)、上升高峰段(流行第1天至第59天,即2003年3月11日至2003年5月8日)和全段(流行第1天至第73天,即2003年3月11日至2003年5月22日)。以这3个时间段的每天累计病例数为X,分别对这3个时段的未来两周的病例数(Y)进行预测,即分别预测流行高峰期、下降期和终末期的每天累计病例数。使用预测误差、95%可信区间(CI)和配对t检验对不同方法的预测效果进行评价。预测病例平均数不超过实际病例平均数的95%CI、预测误差最小和配对t检验P>0.053项中有2项者,其预测效果属较佳。预测误差=[|实际病例数-预测病例数|/=[|实际病例数−预测病例数|/实际病例数]×100%。总体均数的95%可信区间=ˉX±1.96×Sˉx=X¯¯¯±1.96×Sx¯。曲线拟合:我们对这三个时间段的日累计病例数分别与流行天数拟合直线方程、二次方程、三次方程、对数曲线、复合曲线、生长曲线、S形曲线、指数方程、反函数曲线、幂曲线和γ分布等11种模型,求出它们各个时间段的方程系数、预测的日累计病例数和预测误差。从上述3个时段中选出3种预测效果比较好的方法对流行全程(流行第2天至第87天)进行日累计病例数和日发病数的预测及评价。时间序列自归回综合移动平均模型(ARIMA):首先定义时间变量,然后对数据进行平稳化处理,使原序列满足平稳可逆的要求。差分是平稳化处理的一种方法,先进行一次差分,再对一次差分作自相关图,观察数据是否平稳了。如果还不平稳,就进行二次差分,直到数据达到平稳化要求为止。接着进行ARIMA模型的识别,为目标序列定阶,获得几个粗模型;对上述得到的粗模型进行参数估计及假设检验,做模型诊断;分别预测日累计病例数和发病数,求出各自的预测误差。灰色系统动态(新陈代谢)模型:灰色动态GM(1,1)模型是一个变量的一阶微分方程,是灰色理论的重要组成部分。其根据过去的信息,经数据列的生成,建立可预测数学模型。具体方法是首先将原始数列作累加生成处理,然后建立GM(1,1)新陈代谢模型进行预测。动态(新陈代谢)模型预测方法是假设原流行数列有7d的实际病例数,每次预测未来1d的病例数;在预测第8天的病例数后,去掉数列的第1个数(第1天的实际病例数),在数列末端增加1个新的数(第8天的实际病例数),维持原数列7个数不变;接着预测第9天的病例数,依次类推。日累计病例数和发病数预测通过SPSS13.0forwindows和DPS6.05软件完成,实际病例数与预测病例数的比较采用配对t检验。2结果2.1时间序列、灰色模型、分布预测误差流行高峰期各种预测方法的日累计病例数预测结果见表1。预测平均数落在总体均数的95%可信区间内的方法有时间序列、灰色模型、γ分布、三次曲线和二次曲线;预测误差最小的前3位依次为时间序列(0,1,1)、灰色模型和γ分布,其预测误差中位数分别为0.29%、1.05%和1.11%;预测误差中位数最大的是复合曲线,为40.20%。13种方法中,时间序列对香港SARS流行高峰期(第33天至第46天)日累计病例数的预测效果是最佳的。2.2预测误差1.1表1显示了流行下降期各种预测方法的日累计病例数预测结果。13种方法中,预测平均数落在总体均数95%可信区间内的只有γ分布和灰色模型;预测误差中位数最小的是γ分布、灰色模型和时间序列(0,1,1),其预测误差中位数分别为0.02%、0.12%和0.70%;预测误差中位数最大的是指数曲线,为83.17%。13种模型中,γ分布对香港SARS流行下降期(第60天至第73天)日累计病例数的预测效果是最好的。2.3预测误差的类型预测平均数落在总体均数95%可信区间内的只有灰色模型,其预测误差中位数也最小,为0.03%(见表1)。预测误差中位数比较小的还有对数曲线(1.28%)和二次曲线(3.16%);预测误差最大的是指数曲线(267.70%)。13种预测方法中,灰色模型对香港SARS流行终末期(第74天至第87天)日累计病例数的预测效果是最理想的。2.4预测误差的1/1和3种模型预测效果比较采用上述3个时段预测效果比较好的3种方法:γ曲线、时间序列和灰色模型,分别对流行全程进行每日累计病例数和每日发病数进行预测及评价(见表2)。在每日累计病例数预测方面,预测平均数落在总体均数95%可信区间范围内的有灰色模型和时间序列;灰色模型预测误差中位数最小,为0.16%(图1);时间序列预测误差中位数居中,为0.59%(图2);γ曲线预测误差中位数最大,为0.78%,决定系数R2=0.955(图3)。但是,3种模型的预测病例数分别与相应的实际病例数存在着差异(配对t-test,均P<0.01)。经综合评估发现,3种模型中灰色模型对日累计病例数的预测效果相对比较好,平均预测精度>98%。在日发病数预测方面,预测均数落在总体均数95%可信区间范围内的有γ曲线、时间序列和灰色模型(见表2)。γ曲线的预测误差中位数为0.27%;R2=0.661;预测发病数与实际发病数差异无统计学意义(配对t=1.424,P>0.05)。时间序列的预测误差中位数为3.09%;预测发病数与实际发病数差异无统计学意义(配对t=0.001,P>0.05)(图4)。灰色模型的预测误差中位数为0;预测发病数也与实际发病数相同(配对t=1.377,P>0.05)。通过综合考虑每种模型预测误差的中位数、平均数和标准差大小对3种模型的预测效果进行评价。灰色模型的预测误差中位数虽然最小,但标准差高达57.10%,似乎不是预测日发病数的首选方法。γ曲线和时间序列的预测误差中位数、平均数和标准差都比较小,是预测日发病数的理想方法,平均预测精度分别>97%和>89%。3基于灰色模型的香港ss预测现有的预测方法约300种,常用的预测技术有回归预测、时间序列预测、灰色预测、概率模型预测等方法,可以分为统计型、连续型和递推型3大类。在研究SARS感染人数的变化规律及预测流行的高峰期及结束期方面,必须选择合适的预测方法,因此,对不同方法的预测效果进行评价显得尤其重要。传染病发展的一个显著特点是病例数随时间而变化,病例有明显的时间先后顺序,关键是病例之间▲预测病例数平均数不超过实际病例数平均数的95%可信区间;△日发病实际数与预测病例数差异无统计学意义(均P>0.05)不相互独立。时间序列分析的特色在于逐次的观测值通常是不独立的,而且分析时必须考虑数据的顺序时间。其研究的不是变量间的因果关系,而是重点考察变量在时间方面的发展变化规律,并为之建立数学模型。ARIMA模型是时间序列建模中最重要、最常用和最复杂的手段。在我们的研究中,ARIMA模型对香港SARS日发病数的预测效果比较好;从图形来看,预测发病数与实际发病数非常吻合(图4);另外,其对日累计病例数的预测效果也不错。日发病数数列和流行高峰期数列相对波动较大,比较难于预测。日发病数数列和流行高峰期数列的较佳预测方法都是时间序列,平均预测精度>89%,提示ARIMA模型适宜用于波动较大数列的预测。由于传染病流行过程受干预措施等众多因素的影响,时间序列分析假定病例数仅与时间有关显然是不够的。传播动力学模型则考虑了预防措施等因素对流行过程的影响。系统行为数列往往是没有规律的,是随机变化的灰色量,采用统计方法进行预测需要大量数据,且可以解决的问题比较少,难于处理非典型过程的资料。此外,回归分析对新数据与老数据一视同仁;只注重过去数据的拟合,不注重外推性。灰色预测可以克服这些缺点。灰色系统(graysystem)是指部分信息已知,部分信息未知的系统。灰色系统理论认为杂乱无章的原始数据后面必然隐藏着某种规律。灰色预测是先用数据处理的方法,将杂乱无章的原始数据(灰色量)整理成规律性较强的生成数列再作研究。SARS是一个新发传染病,很多流行影响因素尚不了解,因此,适合于使用灰色系统理论进行研究。每天的SARS病例数是一个受众多因素影响的灰色量。这些因素间的关系难于准确描述,它们对SARS流行的作用更是无法精确定量计算。由于灰色量的大小是众多影响因素的反映,从这个灰色量出发进行预测,就不需要各个影响因素的数据,而可以从病例数时间序列本身挖掘有用信息,寻找内在规律,建立模型预测未来。灰色预测数列的长度不同,其预测效果也不同;利用邻近预测值的前7个数进行预测,预测值能更好地反映原数列的波动规律,每补充一个新数据,便去掉一个最老的数据,因为老数据的信息意义将随时间推移而降低。因此,采用固定的7个数数列进行动态的灰色预测可以提高预测精度。我们应用灰色新陈代谢模型对香港SARS的流行进行预测,结果理想。与日发病数相比,日累计病例数数列波动比较平稳;流行终末期数列相对波动也比较小,均较易预测。日累计病例数和流行终末期的最佳预测方法都是灰色模型,平均预测精度>86%,提示灰色模型适宜用于比较平稳数列的预测。传染病的发展是一个动态的过程,一般来说要经历一个“上升-高峰-回落-终末”的过程,因而传染病的发病数与时间的关系,从图形来看是一个曲线。γ分布兼有指数分布和幂分布的特点,因而适用性较广。香港社区病例数的时间分布就呈典型的γ分布。我们发现,γ模型的SARS病例预测病例数与实际病例数吻合程度也比较理想,其平均预测精度>88%(图3)。有关传染病流行的过程必须考虑本身的流行特征,简单的曲线拟合过程能解释复杂的流行过程,对于病例趋势的预测需考虑外界的干预措施而不仅仅是趋势外推。我们认为曲线拟合结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论