




已阅读5页,还剩80页未读, 继续免费阅读
(管理科学与工程专业论文)支持向量机回归在传染病预测中的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
i 苏州大学学位论文使用授权声明 i i i ii i ii l l li ii ii i i i iil y 17 3 2 0 0 3 本人完全了解苏州大学关于收集、保存和使用学位论文的规定, 即:学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸 质论文的内容相一致。苏州大学有权向国家图书馆、中国社科院文献 信息情报中心、中国科学技术信息研究所( 含万方数据电子出版社) 、 中国学术期刊( 光盘版) 电子杂志社送交本学位论文的复印件和电子 文档,允许论文被查阅和借阅,可以采用影印、缩印或其他复制手段 保存和汇编学位论文,可以将学位论文的全部或部分内容编入有关数 据库进行检索。 涉密论文口 本学位论文属 在年一月解密后适用本规定。 非涉密论文口 ,) 论文作者签名:2 2垄蔓:日期:丝也:五:鳖 论文作者签名: ! 么竺是: 日期:丝f 望:c ! :签 导师签名:日期:丝! ! :丕:涩 支持向量机同归在传染病预测中的应用研究摘要 支持向量机回归在传染病发病率预测中的应用研究 摘要 传染病对人类的威胁是长期而严峻的。预测可以及早发现疾病的流行趋势,为及 时、准确地开展传染病的预警奠定了基础,对传染病的控制工作也意义重大。 受多种因素的影响,传染病发病率样本不仅采集困难,而且总是呈现出不规则、 混沌等非线性特征。而传统的传染病预测模型大多以线性模型为主,难以进行理想的 非线性拟和,故迫切需要建立新的预测模型来开展科学预测研究。考虑到支持向量机 ( s v m ) 具有小样本、稀疏性、以及非线性拟合能力强等方面的优势,本文将支持向量 机回归( s v r ) 引入传染病预测,以期开发出一种性能更加优越的传染病预测模型,为 疾病预测工作提供新的技术手段。 首先,本文综述了传染病预测和s v m 的研究现状,以及一些有代表性的传染病 数学模型。在对统计学习理论以及相关的优化理论进行回顾的基础上,从四个方面详 细描述了s v r 模型的基础知识,并指出了s v m 的优缺点。 然后,本文针对s v m 在实际应用中的三点困难,设计了n s v r 预测模型,目的 是获得更高的学习性能和预测精度。该模型的设计思路涉及三个主要方面:( 1 ) 数据 预处理:c c 方法进行相空间重构;( 2 ) 核函数的选择:采用混合核函数的非线性组合 方式;( 3 ) 参数的优化:改进了基本的p s o 算法。在详细描述了n s v r 预测模型建模 流程的基础上,通过仿真实验证明了该模型的有效性。 最后,考虑到求和自回归移动平均( a r i m a ) 模型在处理线性问题上的优势以及 s v r 在处理非线性问题上的优势,本文借助组合预测的思想提出了一个新的组合预 测模型a r i m a n s v r ,目的是在提高模型鲁棒性的同时,进一步提高模型的泛化能 力。在a r i m a n s v r 组合预测模型建模流程的基础上,通过仿真实验证明了该组合 模型的有效性。 关键字:传染病、预测、支持向量机、支持向量机回归、求和自回归移动平均模型 作者:力琼 导师:伏玉琛 r e s e a r c ho ns u p p o r tv e c t o rr e g r e s s i o ni np r e d i c t i o no f t t 、 i n t e c t l 0 u su i s e a s e s a b s t r a c t t h et h r e a tt oh u m a nf r o mi n f e c t i o u sd i s e a s e sh a sb e e nt o u g hf o ral o n gt i m e f o r e c a s t i n gc a i ld e t e c tt h ei n f e c t i o u sd i s e a s e se p i d e m i c 仃e n d s ,e s t a b l i s hf o u n d a t i o nf o r e a r l yw a r n i n ga n db es i g n i f i c a n tf o ri n f e c t i o u sd i s e a s e sc o n t r 0 1 a f f e c t e db ym a n yf a c t o r s ,t h ee p i d e m i ci n c i d e n c es a m p l e sa r ed i 伍c u l tt oc o l l e c t ,a n d a l w a y sp r e s e n ti r r e g u l a r , c h a o t i ca n do t h e rn o n l i n e a rc h a r a c t e r i s t i c s h o w e v e r , m o s to ft h e t r a d i t i o n a lp r e d i c t i o nm o d e l sa r el i n e a r , w h i c ha r ei n a p p r o p r i a t ef o rn o n l i n e a rf i t t i n g t h u s , i t sa l lu r g e n tn e e dt o s t u d yn e wm o d e l sf o ri n f e c t i o u sd i s e a s e sf o r e c a s t i n g t a k i n gt h e a d v a n t a g e so ft h es u p p o r tv e c t o rm a c h i n e ( s v m ) i n t oa c c o u n t ,s u c ha ss m a l ls a m p l e s , s p a r s e ,g o o dn o n l i n e a rf i t t i n ga b i l i t ya n ds oo n ,t h i st h e s i si n t r o d u c e st h es u p p o r tv e c t o r r e g r e s s i o n ( s v r ) i n t ot h ee p i d e m i cp r e d i c t i o n ,w h i c ha i m st oe s t a b l i s hs u p e r i o rf o r e c a s t i n g m o d e l sa n dp r o v i d en e wt e c h n o l o g i c a lm e a n sf o rd i s e a s e sp r e d i c t i o n f i r s t l y , t h i st h e s i ss u m m a r i z e st h ec u r r e n ts t u d yo fi n f e c t i o u sp r e d i c t i o na n ds v m , a n do u t l i n e ss o m er e p r e s e n t a t i v ee p i d e m i cm a t h e m a t i c a lm o d e l s w i t ha no v e r v i e wo nt h e s t a t i s t i c a ll e a r n i n gt h e o r ya n dt h er e l a t e d o p t i m i z a t i o nt h e o r y , w ee x p o u n dt h eb a s i c k n o w l e d g eo fs v r m o d e la n dp o i n to u tt h ea d v a n t a g e sa n dd i s a d v a n t a g e so fs v m s e c o n d l y , t h i st h e s i sd e s i g n st h en s v rp r e d i c t i o nm o d e li na l l u s i o nt ot h ed i f f i c u l t i e s i np r a c t i c a la p p l i c a t i o no fs v m ,w h i c ha i m st oa c h i e v eah i g h e rp e r f o r m a n c ea n d p r e d i c t i o na c c u r a c y t h ed e s i g n e di d e a sr e l a t et ot h r e em a i nf a c e t s :( 1 ) d a t ap r e p r o c e s s i n g : p h a s es p a c er e c o n s t r u c t i o nb yc - cm e t h o d ;( 2 ) t h ec h o i c eo fk e r n e lf u n c t i o n :a d o p tt h e n o n l i n e a rc o m b i n a t i o no fm i x e dk e r n e lf u n c t i o n ;( 3 ) p a r a m e t e r so p t i m i z a t i o n :i m p r o v et h e b a s i cp s oa l g o r i t h m o nt h eb a s i so f d e s c r i b i n gt h em o d e l i n gp r o c e s so fn s v rp r e d i c t i o n m o d e l ,t h er e s u l to nt h ee m u l a t i o n a le x p e r i m e n ts h o w st h a tt h em o d e li se f f e c t i v e f i n a l l y , t h i st h e s i sp r o p o s e san e wc o m b i n a t i o nf o r e c a s t i n gm o d e la r i m a - n s v r w i t ht h ei d e ao fc o m b i n e dp r e d i c t i o n i nr e l a t e dt ot h ea d v a n t a g e so ft h ea u t o r e g r e s s i v e i n t e g r a t e dm o v i n ga v e r a g e ( a r o m a ) m o d e li nd e a l i n g 晰t l ll i n e a rp r o b l e m sa n ds v ri n d e a l i n gw i mn o n l i n e a rp r o b l e m s w h i c ha i m st of u r t h e ri m p r o v et h er o b u s t n e s sa n dt h e g e n e r a l i z a t i o na b i l i t y o nt h eb a s i so ft h em o d e l i n gp r o c e s so ft h i sc o m b i n e dp r e d i c t i o n m o d e l ,t h er e s u l to nt h ee m u l a t i o n a le x p e r i m e n ts h o w st h a tt h em o d e li se f f e c t i v e k e y w o r d s :i n f e c t i o u sd i s e a s e ,p r e d i c t i o n ,s v m ,s v r , a r i m am o d e l w r i t t e nb yl iq i o n g s u p e r v i s e db yf uy u c h e n i i 目录 第1 章绪论1 1 1 研究背景1 1 2 传染病预测发展现状2 1 3 支持向量机的提出及研究现状3 1 4 研究意义6 1 5 主要内容及论文组织结构6 第2 章传染病预测模型概述8 2 1 时间序列模型8 2 1 1 微分方程模型8 2 1 2 余弦模型1 0 2 2m a r k o v 模型1 1 2 3 灰色预测模型1 2 2 4 人工神经网络模型1 3 2 5 传染病预测数学模型存在的问题及研究趋势1 4 2 6 本章小结1 5 第3 章支持向量机回归理论基础1 6 3 1 统计学习理论核心内容概述1 6 3 1 1 期望风险和经验风险1 7 3 1 2v c 维1 8 3 1 3 结构风险最小化准则1 9 3 1 4 支持向量机原理2 0 3 2 优化理论2 l 3 3 支持向量机回归模型2 2 3 3 1 损失函数2 2 3 3 2 核函数2 3 3 3 3 支持向量机回归原理2 4 3 3 4 支持向量机回归算法步骤2 8 3 4 支持向量机的特点2 8 3 5 本章小结2 9 第4 章基于n s v r 预测模型的传染病预测3 0 4 1n s v r 预测模型的设计思路3 0 4 1 1 相空间重构3 1 4 1 2 核函数的种类3 3 4 1 3 核函数的组合形式3 4 4 1 4 参数的分析及选择3 7 4 1 5 基于改进p s o 算法的参数选择3 8 4 2n s v r 预测模型的构建4 3 4 2 1n s v r 预测模型建模流程4 3 4 2 2n s v r 预测模型架构图4 4 4 2 3 模型的性能评价标准:4 5 4 3 预测仿真实例4 6 4 3 1 数据预处理4 6 4 3 2 实验过程4 8 4 3 3 结果分析5 4 4 4 本章小结5 4 第5 章基于a r i m a n s v r 预测模型的传染病预测5 5 5 1a r i m a 基本理论5 5 5 1 1 自回归移动平均( a r m a ) 模型5 5 5 1 2 求和自回归移动平均( a r i m a ) 模型5 8 5 1 - 3 季节性模型5 9 5 1 4 模型辨识的基本原则6 0 5 2a m a n s v r 预测模型6 1 5 2 1a r i m a 时间序列预测的建模流程6 l 5 2 2a 刚m a - n s v r 预测模型的建模流程6 2 5 2 3a r i m a n s v r 预测模型架构图6 2 5 3 预测仿真实例6 3 5 3 1a r i m a 模型预测6 3 5 3 2n s v r 模型预测6 6 5 3 3a 砒m a n s v r 模型组合预测6 7 5 3 4 结果分析:6 9 5 4 本章小结6 9 第6 章总结与展望7 0 6 1 总结7 0 6 2 展望7 l 参考文献7 2 攻读硕士学位期间公开发表的论文与科研项目7 7 致谢7 8 一一一一一一一 支持向量机同归存传染病预测中的应用研究第1 章绪论 第1 章绪论 一直以来,传染病都是一种严重危害人类健康的疾病,特别是近几年,其危害程 度愈演愈烈,影响范围越来越大。对传染病的预防和控制是全球卫生工作的突出重点, 已经受到了全世界的关注。自从被引入医学领域,预测技术就得到了广泛地应用,传 染病预测作为其应用的重要内容之一,受到了越来越多的重视。因此,针对传染病的 特点,采用有效的方法建立预测模型有着重要的实际意义。本文旨在对具有良好泛化 能力的支持向量机技术在传染病预测中的应用进行研究。 1 1 研究背景 传染病是由各种病原微生物和寄生虫引起的能在人与人或人与动物之间相互传 播的感染性疾病。根据世界卫生组织的报告,目前,受到传染病威胁的人口约占全球 人口的一半,每年有将近2 0 0 0 万人死于各种传染病,占全世界每年死亡人口的一半。 随着社会的发展以及科学技术的进步,人们的生活水平有了很大的改善,医疗卫生行 业的发展也使得许多传染病得到了控制。但随着环境污染越来越严重,以及人们生活 方式的转变,不但一些旧的传染病死灰复燃,而且新的传染病也不断涌现。 传染病的流行是不分国界的。从公元6 0 0 年1 7 2 2 年间,爆发过四次的黑死病, 每一次都在欧洲大规模流行。从1 9 8 1 年发现首例艾滋病至今全世界已有2 5 0 0 余万人 死亡,涉及了1 9 3 个国家和地区。1 9 9 0 年前苏联发生的白喉流行,波及东欧1 5 个国 家,病例患者超过1 0 万人。2 0 0 3 年我国爆发的非典型性肺炎恶性传染病,对我国的 旅游、交通和服务行业的发展造成了严重影响,并波及全球2 8 个国家。2 0 0 9 年爆发 的甲型流感,在全球造成超过1 万人死亡,让全世界都陷入了恐慌,也让我们又一次 深刻体会到了传染病的危害何其强大,而全球的卫生防疫及监测系统又一次受到了严 重地冲击。残酷的现实一直在告诫我们:人类正面临着各种传染病长期而又严峻的威 胁,对传染病的防治及控制策略的研究- n 也不能松懈,传染病的预测预警工作仍需 进一步完善。 由于传染病每一次盛行都给人类生存和国计民生造成威胁,人类与传染病的斗争 第l 章绪论 支持向量机回归在传染病预测中的戍用研究 将是长期的,所以对传染病传播趋势的研究也就越来越迫切。传染病预测就是根据传 染病的发生、发展规律及有关因素,用分析判断、数学模型等方法对可能发生的传染 病的发生、发展和流行趋势作出预测的一种方法,是制定预防和控制传染病长远或近 期应对策略的前提【l 】。准确的预测各种传染病的发病率,将会极大地推动传染病的预 警工作。只有通过预测的帮助,才能尽早发现传染病的异常,及时对其传播机理作出 预警,通过专家的调研核实,尽早发现异常早做处理。可见,传染病预测是卫生防疫 及监测部门制定预警决策的重要步骤之一,并发挥着越来越重要的作用。正因为传染 病预测是制定传染病预警决策的基础性工作,所以对传染病预测方法的研究具有极其 重要的价值和实际意义。 随着信息论、控制论、系统论、非线性理论、统计学习理论和人工智能技术的空 前发展,也为传染病预测开辟了新思路。在智能领域的技术中,人工神经网络( a r t i f i c i a l n e u r a ln e t w o r k ,a n n ) 就得到了广泛的应用。虽然a n n 克服了传统参数估计方法的困 难,并可以以任意精度逼近非线性函数,但其网络结构的确定和参数的选取仍需依赖 先验知识,模型的建立需要大量的样本,而过学习、易陷入局部极小值以及训练速度 慢是其致命的缺陷。建立在统计学习理论( s t a t i s t i c a ll e a r n i n gt h e o r y , s l t ) 基础之上的 支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) ,作为一种新的机器学习方法,它具有严格 完备的数学理论,并引入了结构风险最小化原则,极大的提高了模型的泛化能力,解 决了陷入局部极小值、过学习的问题。虽然s v m 相较于其他的机器学习方法起步较 晚,但是诸多的优点使得s v m 很快就成为了机器学习的研究热点,其应用领域也在 不断扩大,故本文将s v r ( s v m 在回归领域的应用) 引入传染病发病率的预测。s v r 在传染病预测中的应用将突破传统传染病数学模型的局限性,为传染病学理论研究注 入新活力,为传染病预测提供了一种新的分析方法。 1 2 传染病预测发展现状 我国在传染病预测方法的研究上起步较晚,直到2 0 世纪8 0 年代以后才得以快速 发展,并成为疾病监测工作的热点。传染病的病种多种多样,现阶段对传染病的预测 主要是根据不同疾病、从不同层次,采用不同方法进行的。目前,传染病预测的方法 有很多,可以划分成定性预测、定量预测以及综合预测三类。 定性预测主要是基于经验和判断运用逻辑思维对预测对象作定性分析,具体来说 2二 支持向量机回归在传染病预测中的应用研究第1 章绪论 就是针对当地传染病发生、发展规律及相关因素的具体分析,判断该传染病流行的趋 势与强度,并不单纯依赖于系统数据。定性预测主要包括比数图法、德尔菲法、流行 控制图法、主观概率法等,目前,流行比数图法与控制图法是国外正在应用的传染病 预警的基本方法。近年来,作为新兴的高科技技术,遥感技术和地理信息系统也被用 于一些传染病的预测上,并取得了很好的效果【2 】【3 】。 定量预测是依据历史数据,借助数学手段,根据建立的数学模型预测出传染病发 病率的方法。其精度和可靠性依赖于数据的准确性和模型的科学性。主要有线性回归 预测、马尔可夫链、时间序列分析、灰色预测法等,以及近年来得到迅速发展的神经 网络预测法。其中,时间序列分析和灰色预测法最为重要。 综合预测可以是不同预测方法的结合,如定性预测和定量预测相结合,也可以是 同一种预测方法的不同预测模型的结合,如a r i m a g i 心烈。前者在实际运用中使用 更多,但第二种方法可以运用于第一种综合预测方法中。综合预测法可以取长补短, 在实际预测中,可以以定量预测为主,预测出结果,以定性预测为辅,对预测结果进 行修正。综合预测克服了单一预测方法的笼统性,使预测结果更加精确1 4 j ,并体现了 未来预测方法的发展趋势。 传统的预测方法能较好的处理线性关系,对非线性关系的处理并不理想。但在实 际生活中,时间序列问题往往是线性关系和非线性关系的综合体,随着近年来智能技 术在预测领域的广泛应用,这问题得到了很好的解决。神经网络就被用在了传染病 的预测中。但是神经网络在小样本下的预测效果并不能尽如人意,而且算法本身存在 着难以克服的缺陷。 1 3 支持向量机的提出及研究现状 s v m 是v a p n i k 领导的研究小组于2 0 世纪9 0 年代提出的种机器学习新方法1 5 j , 它建立在统计学习理论之上,而统计学习理论本身又是专门研究小样本下机器学习规 律的理论,因此,s v m 就具有了在有限信息的情况下取得最优推广能力的理论基础。 建立在统计学习理论的v c 维理论和结构风险最小化原则基础之上的s v m ,通过核 函数将低维空间的输入向量映射到高维的特征空间,实现线性可分,并将高维空间进 行的点积运算转换为低维空间的核函数运算,有效地克服了维数灾难的难题。s v m 的本质是求解凸二次规划问题,因此能够保证得到全局最优解,避免陷入局部极小值, 第1 章绪论支持向量机同归在传染病预测中的应用研究 解决了过学习的问题。 基于其完善的理论基础及良好的特性,s v m 一经提出就受到了高度的关注,在 理论和应用方面都取得了一系列令人瞩目的成果。s v m 最初主要被用于模式识别等 分类问题中,可称为支持向量机分类( s u p p o r t v e c t o rc l a s s i f i c a t i o n ,s v c ) ,当其应用于 回归领域的时候,可称为支持向量机回归( s u p p o r tv e c t o rr e g r e s s i o n ,s v r ) 。分类和回 归也是s v m 主要解决的两类问题。目前,国外对s v c 的研究和应用已经日趋成熟, 并取得了丰富的研究成果,s v r 则仍有很大的发展空间;国内对s v m 的研究则起 步较晚,才刚刚发展起来。对s v m 的研究主要涉及以下几个方面: ( 1 ) 训练算法的研究 s v m 中的优化问题具备一些非常好的特性,需要设计出针对这些特性的新算法。 主要有三种基本的求解算法:选块算法是由c o r t e s 和v a p n i k 于1 9 9 5 年提出的【6 】, 其基本思想是:由于决策函数只由支持向量决定,故对于选定的工作样本集进行训练, 通过某种迭代方式逐步剔除非支持向量,以支持向量构成“块”,计算其相应的 l a g r a n g e 乘子。但如果支持向量数目比较多时,随着迭代次数的增多,工作集的扩大, 算法就会变得复杂。分解算法是由o s u n a 等人于1 9 9 7 年提出的【7 】,与选块算法的 不同点在于它固定工作集,每次向工作集加入一个新的样本点,就要舍去工作集中另 一个样本点,目的就是每次只针对很小的训练子集求解。序列最小最优化是p l a t t 于1 9 9 8 年提出的【8 】,它选取两个样本做工作集,每次迭代只需调整两个样本点,是 分解算法的特殊情况,与普通的分解算法相比,它可能需要较多的迭代步骤,但是计 算量非常少,收敛速度快。 ( 2 ) 模型选择的研究 s v m 模型的学习性能取决于核函数及参数在具体应用中的选择,模型的选择其 实就是核函数及其参数的选择。 引入领域知识,构造不同的核函数以适用于不同的应用领域是最理想的方式。但 是核函数的构造比较困难,目前主要集中在构造具有某种特性但是普适的核函数。其 选择以实际应用的效果而定。 参数选择也是机器学习中的一个重要的问题,因为它决定了一个模型学习性能的 好坏。s v m 最常采用试凑法和格点法这两种参数选择方法,但它们都以大量实验为 基础的,不仅速度慢而且结果也不一定最优。近年来,一些智能优化算法被用于s v m 4 支持向量机回归在传染病预测中的廊用研究 第l 章绪论 的参数选择,在速度和精度方面都取得的了较理想的效果。文献【9 】将遗传算法用于 了s v m 的参数选择,文献 1 0 1 将蚁群算法用于了s v m 的参数选择,文献 1 1 1 将免疫 算法用于了s v m 的参数选择,文献【1 2 】将粒予群算法( p a r t i c l es w a r mo p t i m i z a t i o n a l g o r i t h m ,p s o ) 用于了s v m 的参数选择。 ( 3 ) 与其它机器学习方法的融合 不同方法相结合以互补短缺是一种惯常的做法。如,由于结构上的相似性,s v m 被用于径向基神经网络中心的选取【1 3 】;最小二乘支持向量机与递归神经网络相结合, 提出了一种新的最小二乘支持向量机学习神经网络【1 4 】。 ( 4 ) s v r 的研究 损失函数是s v r 的重要特点,不同的损失函数会得到不同的s v r 。不敏感损 失函数、h u b e r 损失函数以及二次损失函数等是最常用的损失函数,而唯一具有稀疏 性的损失函数就是不敏感损失函数,这也是e - s v r 最流行的原因。针对e - s v r 中 难选择的问题,v s v r 被提出【6 】,它可以自动计算的值。最小二乘支持向量机回归 将二次规划的求解转变为求解二次方程组,加快了收敛速度。 ( 5 ) s v c 的研究 s v m 已经由最初的求解两类分类问题推广到了求解多类问题”】,主要有一一区 分模式和逐一鉴别模式两种方案。 ( 6 ) 应用研究 虽然s v m 一经提出就成为了研究的热点,但对其应用方面的研究相较于理论方 面研究还比较滞后。随着s v m 在理论上的不断完善,其应用研究逐渐成为各国研究 的热点。在模式识别领域,s v m 被用于手写体数字识别、人脸检测、语音识别、 图像处理、遥感图像分析、文本字体识别、三维物体识别等方面,并取得了一定的成 果。在回归领域,主要是用于时间序列的预测、非线性建模与预测等方面,表现出 了极好的性能。在工业领域,s v m 被用于故障诊断、非线性控制等方面,拓宽了 其应用领域。在医学领域,主要被用于疾病诊断、医学图像的检测、蛋白质序列分 析等方面,同样取得了很好的效果。 总体而言,不仅s v r 在应用方面的研究远远少于s v c ,而且s v m 在医学领域 的应用大多也是针对s v c 的,s v r 在该领域的应用还比较少,再加上s v r 还没有被 用于传染病的预测,因此有很大的应用前景。 第1 章绪论 1 4 研究意义 支持向量机同归在传染病预测中的应用研究 传染病的预测是复杂的,再加上病种多样,相同的预测模型对不同的疾病在预测 效果上会有差异,因此,应尝试多种的方法。就目前传染病预测的发展趋势来看,找 到具有更高精度的预测模型,乃至更为通用的预测模型尤为迫切。 以统计学习理论中的v c 维理论和结构风险最小化原理为基础的s v m ,解决了 小样本、过学习、维数灾难等问题,不但有良好的分类精度,在回归方面也具有优秀 的泛化能力,在非线性拟合方面具有其他方法无法比拟的优势,并在许多领域中起了 越来越重要的作用。鉴于传统方法的局限性和s v m 的优越性,本文将s v r 引入到传 染病的预测中,以期找到更具鲁棒性更优秀的传染病预测模型。 本文的研究丰富和拓展了当前的传染病预测方法的研究内容,为传染病预警决策 的制定提供了更科学的参考依据,在理论和现实上都具有一定的意义。 1 5 主要内容及论文组织结构 本文就s v r 在传染病预测中的应用进行了研究。主要内容包括:概述了现有的 传染病预测数学模型;论述了s v r 的核心理论:提出了一种改进p s o s v r 混合核函 数非线性拟合预测模型n s v r ,并将其用于传染病的预测;将提出的n s v r 预测模型 与a r i m a 进行组合,用于传染病的预测。对于两种模型,采用真实数据分别进行了 仿真实验,并取得了非常好的效果。 本文其余章节的结构安排如下: 第二章:传染病预测模型概述 该章通过对传染病动力学中的一些典型的数学模型的介绍,对传染病预测的数学 模型进行了概述,并对传染病预测数学模型存在的问题及研究趋势分别进行了总结。 第三章:支持向量机回归理论基础 该章首先介绍了统计学习理论的核心内容以及s v m 算法涉及到的优化理论;然 后在此基础上介绍了s v r 模型的相关知识,对s v r 中的损失函数、核函数、回归原 理以及算法步骤进行了详细的描述;最后对s v m 的优缺点进行了总结。 第四章:基于n s v r 预测模型的传染病预测 该章首先从数据预处理、核函数的选择、参数的优化三个主要方面介绍了n s v r 6 支持向量机回归在传染病预测中的府吁j 研究 第l 章绪论 预测模型的设计思路;然后对n s v r 预测模型的建模流程进行了详细的描述,并给 出了模型的整体架构图、模型的性能评价标准;最后,通过仿真实验,给出了n s v r 预测模型在传染病预测中的应用实例,并对实验结果进行了分析。 第五章:基于a r i m a - n s v r 预测模型的传染病预测 该章首先对求和自回归移动平均( a r i m a ) 模型的相关理论知识进行了介绍;然后 对a r i m a 模型、a r i m a n s v r 组合预测模型的建模流程进行了详细的描述,并给 出了a r i m a - n s v r 预测模型的整体架构图;最后,通过仿真实验,给出了a r i m a 模型、a r i m a - n s v r 预测模型在传染病预测中的应用的实例,并对实验结果进行了 分析。 第六章:总结与展望 该章是对全文研究工作的总结,并对今后进一步的研究工作进行了探讨和展望。 第2 章传染病预测模型概述 支持向量机同归在传染病预测中的应用研究 第2 章传染病预测模型概述 传染病动力学是对传染病进行理论性定性分析和定量研究的一种重要方法。它通 过建立能够反映传染病动力学特性的数学模型,经过对模型动力学性态的定性、定量 分析和数值模拟,显示疾病的发展过程,揭示疾病的流行规律,预测疾病的变化发展 趋势,为制定防治决策提供理论基础和数量依据1 1 6 1 。因此,数学模型在传染病的理论 性研究中发挥着非常重要的作用。 传染病数学模型的构建主要是对疾病的流行趋势进行预测。数学模型通过假设、 变量、参数将传染病的特征及其联系直观的揭示出来。通过建立合适的模型,可以帮 助发现传染病的流行趋势,以便对传染病及时进行预警,减少危害。近年来随着传染 病的广泛流行和传播,出现了大量的用数学理论和方法研究流行病发展传播规律的文 献。第一章已经对传染病的预测方法进行了简单的介绍,本章主要是对几种典型的数 学模型进行综述。 2 1 时间序列模型 时间序列模型可以直接通过历史数据快速预测,也正因为如此,该类模型只适合 于受被预测变量的相关因素影响较小的数据。下面将主要针对其中的微分方程模型、 余弦模型做介绍。 2 1 1 微分方程模型 从2 0 世纪4 0 年代被受到重视以来,微分方程模型至今仍具有非常重要的学术地 位。下面以s i r 和s e i r 仓室模型为例对微分方程模型做介绍。 1 s i r 仓室模型 s i r 传染病模型是由k e r m a c k 与m c k e n d r i c k 等人于1 9 2 7 年提出的【1 7 】。所谓仓 室模型,就是根据传染病的传播特点,将总种群分为若干个子种群。假定某地区的人 v i 数是常数,s i r 模型将总人v 1 分为三类,每一类对应一个仓室:( 1 ) 易感者类( s ) , 其数量记为s ( o ,表示t 时刻未染病但有可能被传染的人数;( 2 ) 染病者类( i ) ,其数量 8 支持向量机回归在传染病预测中的应用研究 第2 章传染病预测模型概述 记为删,表示f 时刻已被感染并且具有传染力的人数;( 3 ) 恢复者类( r ) ,其数量记为 尺似,表示f 时刻已从传染病中获得免疫并恢复正常的人数,即从染病者类中移出的 人数。该模型主要基于以下几点假设: ( 1 ) 始终保持人口是一个常数,即不考虑人口的出生、死亡、流动等种群动力因素; ( 2 ) 个体获得免疫是永久的,意味着个体一旦获得免疫,他们就永远不会被再感染; ( 3 ) 染病者只要接触易感者就必定具有一定的传染力,易感者被感染的速度与易感 者与染病者数量的乘积呈正比,假设该比例系数为; ( 4 ) 恢复者的增长速度与染病者的数量成正比,假设该比例系数为7 。 在以上四个基本假设条件下,s i r 模型的微分方程为: i d s d t = 一j | b s i a 7 a t = f l s l 一r 1 j ( 2 1 ) 【a r a t = f l 其中,初值s ( o ) = s 。,1 ( 0 ) = i 。,r ( o ) = r 。,以仃= p i t 表示传染期接触率,解得: i = ( s 。+ i o ) 一s + 古l n 蚤。 虽然s i r 模型比较简单粗糙,但是可以通过对s i r 模型的分析以及解的性态来初 步研究传染病的流行规律。很多研究人员对s i r 模型做了推广,如,考虑传染病的潜 伏期,在三类人群中增加一类,感染而未发病者的s e i r 模型;考虑患病后可以治愈, 但恢复者不具有免疫力的s i s 模型等。 2 s e i r 仓室模型 s e i r 模型是s i r 仓室模型的一个扩展模型。它在s i r 模型的基础上,增加了一 个人群的分类:潜伏者类( e ) ,即已感染但处于潜伏期的未发病者。因此,s e i r 模型 同时具有四类人群,也即四个仓室:易感者类( s ) 、潜伏者类( e ) 、染病者类( i ) 和恢复 者类( r ) 。s e i r 模型的微分方程为: a s a t = 一_ b s i d e d t = p s i a e a l a t = o t e - g i ( 2 - 2 ) d r a t = 碑 其中,口为从潜伏者到发病者转移的概率。如果不考虑s i r 模型的第一条假设条件, 即增加人群的流动性,则得到的s e i r 模型的微分方程为【1 8 】: 9 第2 章传染病预测模型概述支持向量机【口】归在传染病预测中的应用研究 d s d t = 一p s i d s s d e d r = p s i a e d ,e i r - - - d i f 圣t :e y i dtil(2-3) d r d t = 其中,为单位时间易感者产生率,蟊,噍,d 1 分别为se 和州| 勺死亡率。 上述模型抓住了流行病传播的一些基本动力学法则,因此给出的结果往往符合实 际,但其描述的都是传染病的自然发展过程,并没有考虑到人类患病后会采取措施进 行隔离或者治疗等因素,故使用这些模型时要注意应用条件的限制。 2 1 2 余弦模型 余弦模型分析是对周期现象进行研究的简单模型,可分析角度、生物节律和时间 成周期性的变量,因此余弦模型常用于传染病季节变化规律的研究。 余弦曲线可用四个参数表示:( 1 ) 中值m 是所有数据的平均值,相当于曲线的 中线;( 2 ) 振幅彳:表示曲线振荡高于或低于中线的程度;( 3 ) 峰值位相时:表示曲线 达到最高时的相角度;( 4 ) 角频率c o :与周期丁的关系国= 2 x t 。曲线方程以余弦函 数表示为1 9 1 : r = m + ac o s ( o ) f f 一矽)( 2 4 ) 其中,j 为自变量,通常是有一定周期的时间。通过三角函数变换,式( 2 4 ) 可演变为: r = m + x c o s 缈t + y s i n t( 2 - 5 ) 其中,参数x = 4c o s ,参数y = 4s i n 矽。将式( 2 5 ) 的三角函数改用系数表示为: z = m + c ,x + s ,y ( 2 6 ) 其中,e = c o s o ) ,s j = s i n t ot ,式( 2 6 ) 中的参数是线性的,故为线性回归方程。为 了使余弦模型能够更好的对数据进行拟合,常将多个余弦曲线进行叠加,通式为: z = m + a ic o s ( o ) t i 一办) + a 2c o s ( 2 0 ) f ,一改) + + a kc o s ( k o ) f 。一九) ( 2 7 ) 其中,a ic o s ( o ) ,一办) ,a 2c o s ( 2 c o ,f 一疵) ,a c o s ( k o ) f f 一矽等称为第1 ,2 ,k 谐量, 一般用到第二谐量就能得到较满意的拟合效果。含第二谐量三角函数的余弦方程为: r = m + a lc o s ( o ) 一办) + a 2c o s ( 2 0 ) f ,一欢)( 2 8 ) 将式( 2 8 ) 也改用系数表示,得到含第二谐量的余弦模型为: r = m + c l ,x l + s l ,一+ c 2 j x 2 + s 2 ,匕( 2 - 9 ) l o 支持向量机回归在传染病预测中的应用研究 第2 章传染病预测模型概述 其中,x j = a ,c o s 矽j ,= a js i n j ,c j ,= c o s ( r i o ) t , ,s j , = s i n ( j c o ) t ,= l ,2 ,式 ( 2 9 ) 用最小二乘法得到方程组为: 玎m + ( 刚+ ( s ,) y ;+ ( c :,) x :+ ( 蚴匕= : 瓮z二霉麓(删ecbsl肿)yi+(eclc。lt)zxzc s e cs 嚣ss 翥絮p ( s ,) m + (。,) x 。+ ( s :) k + (:,) x :+ ( 。,:。)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 英国寿险合同协议
- 西梅采购合同协议
- 销售药膏合同协议
- 石材正规合同协议
- 藤茶渠道合同协议
- 收购芹菜合同协议
- 污泥清运合同协议
- 租船押金合同协议
- 长期生产合同协议
- 正式转让合同协议
- 测试工程师季度述职报告
- XX文化产业投资公司二零二五年度股东退股及文化创意协议
- 跟着电影去旅游知到智慧树章节测试课后答案2024年秋山东大学(威海)
- 2024上海市招聘社区工作者考试题及参考答案
- 2021年高考物理试卷(江苏)(解析卷)
- 第六单元《组合图形的面积》(教学设计)-人教版五年级数学上册
- 地理-北京市朝阳区2024-2025学年高三第一学期期末质量检测考试试题和答案
- 2024年度高中报名辅导中介服务合同
- 【MOOC】信号与系统-哈尔滨工业大学 中国大学慕课MOOC答案
- 145完整版本.现代安全管理的六大管理体系
- 19《牧场之国》第二课时说课稿-2023-2024学年五年级下册语文统编版
评论
0/150
提交评论