医药信息分析与决策回归分析课件_第1页
医药信息分析与决策回归分析课件_第2页
医药信息分析与决策回归分析课件_第3页
医药信息分析与决策回归分析课件_第4页
医药信息分析与决策回归分析课件_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医药信息分析与决策第二章回归分析本章要点一、概述二、回归分析三、时间序列分析四、MicrosoftSQLServer2005实践回归分析与时间序列分析2*一、概述现实生活中的许多现象之间存在着相互依赖、相互制约的关系,这些关系在量上主要有两种类型:确定性关系非确定性关系3*二、回归分析编号NO体重(kg)肺活量(ml)编号NO体重(kg)肺活量(ml)编号NO体重(kg)肺活量(ml)160.145081156.9541812155.114238260.3844691257.2240972253.244523359.7443981355.9640632360.14516458.0440681457.8743342460.54473559.6743391556.8743012559.044297659.4443931655.9741412659.014123758.743891756.0739052759.74216859.7543061855.2839432859.064077960.543951955.7941952959.1242871058.7244622054.5640393054.2142015体重与肺活量之间有何关系,这里面的人都正常吗?如何处理?*回归分析6*回归分析7*二、回归分析

一元线性回归9*二、回归分析

最小二乘法10最小二乘法*二、回归分析

最小二乘法最小二乘法:拟合回归模型的原则是寻求代表性最好的模型是一个随机变量;的均值为零,即;在每一个时期中,的方差为常量,即各个相互独立;与自变量无关。11*二、回归分析

最小二乘法利用EXCEL计算:单击菜单栏中“工具”→“加载宏”命令,选择相应的“分析工具库”和“分析工具库–VBA函数”复选框,单击“确定”按钮,完成加载。13*二、回归分析

最小二乘法利用EXCEL计算:单击“工具”→“数据分析”命令,选中“回归”选项,单击“确定”按钮。14Y=760.25+60.18x*15*二、回归分析

假设检验回归系数显著性检验检验假设:检验统计量:检验规则:给定显著性水平α,若,则回归系数显著。17*二、回归分析

假设检验回归模型的显著性检验检验假设:回归方程不显著回归方程显著检验统计量:检验规则:给定显著性水平,若,则回归系数显著。18*二、回归分析

假设检验检验之间是否存在自相关关系当时,如果,认为存在正自相关;如果,认为无自相关;当时,如果,认为存在负自相关;如果,认为无自相关;如果,不能确定是否自相关;当D.W.值在2左右时,模型不存在一阶自相关。19*二、回归分析

非线性回归分析非线性回归分析*21三、时间序列分析TimeSeriesAtimeseriesisasequenceofdatavaluesforavariableY1,Y2,…,Ynthatareseparatedbyequaltimeintervals.Ytisthenotationforthevalueoftimeseriesattimet.回归分析中,如果自变量是时间变量,则将按时间顺序产生和排列的离散型观测数据序列()(t=1,2,…,T)称作时间序列,t通常用年、月、季或天来计量。根据时间序列,揭示相应系统的内在统计特性和发展规律的统计方法,就称时间序列分析。*22三、时间序列分析Example:NumberofpeopleemployedatInternationalSystemsCorporationfor20quarters.QuarterFiveYearsAgoFourYearsAgoThreeYearsAgoTwoYearsAgoLastYear1st1501601751802002nd1751902002202503rd4504604804955204th140145160180190*23三、时间序列分析Example:NumberofpeopleemployedatInternationalSystemsCorporationfor20quarters.*25三、时间序列分析Example:thefollowingdataindicatethenumberofmergersthattookplaceinanindustryovera19-yearperiod.*26三、时间序列分析FourComponentsofTimeSeriesTrends(长期趋势):Trendsintimeseriesarethelong-termmovementsoftheseriesthatcanbecharacterizedbysteadyoronlyslightlyvariableratesofchange.*29三、时间序列分析FourComponentsofTimeSeriesSeasonalvariations(季节变):Seasonalvariationsinatimeseriesarethosevariationsthatoccurratherpredictablyataparticulartimeeachyear.*30三、时间序列分析FourComponentsofTimeSeriesCyclicalvariations(周期变化):Cyclicalvariationsaremovementsinatimeseriesthatarerecurrentbutthatoccurincyclesoflongerthanayear.*31三、时间序列分析FourComponentsofTimeSeriesIrregularvariations(不规则变化):Irregularvariationsconstitutetheclassoftimeseriesmovementsthatdonotfitintotheotherthreecategories.*32三、时间序列分析ClassicalTimeSeriesModel(1)MultiplicativeTimeSeriesModel Y=T×S×C×I(2)AdditiveTimeSeriesModel Y=T+S+C+I(3)MixedTimeSeriesModel Y=T×S+C×I*331.趋势外推法趋势外推法(Trendextrapolation)是根据过去和现在的发展趋势推断未来的一类方法的总称。基本原理是回归分析,即以时间为自变量,以时间系列为因变量进行回归分析。*342.移动平均法对于平稳型时间数列可取最近n期数值的算术平均作为后期的预测值。其基本原理是:首先选择一个固定的时间周期n,将最近n期的数据加以平均作为下一期的预测值。*352.移动平均法移动平均方法具有以下的特点:1.当时间序列的波动较大时,最近期的观察值应该赋予最大的权数,较远时期的观察值赋予的权数应该依次递减;当时间序列的波动不是很大时,对各期的观察值应赋予近似相等的权数。只使用最近期的数据,在每次计算移动平均值时,移动的间隔都为固定的k;2.主要适合对较为平稳的时间序列进行预测;3.移动间隔和权数的选择是该方法的关键。*363.指数平滑法它是加权平均的一种特殊形式,观察值距离预测时期越久远,权数变得越小,且呈现指数下降趋势,因此称为指数平滑。指数平滑法根据平滑的次数包括一次指数平滑、二次指数平滑、三次指数平滑等.用的最多的是一次平滑法,下面对一次平滑进行介绍。*373.指数平滑法指数平滑法具有以下的特点:不同的会对预测结果产生不同的影响,阻尼系数也是如此;在实际应用中,当时间序列有较大的随机波动时,宜选用较大的值(如0.9),以便能很快跟上近期的变化;当时间序列比较平稳时,宜选用较小的;选择平滑系数时,还应考虑预测误差。确定时,可尝试选择几个进行预测,然后找出预测误差最小的那个作为最后的值。*38例:某市某一恶性疾病死亡率统计数据表年度死亡率年度死亡率年度死亡率199045.12199659.71200265.5199151.56199755.5200358.69199259.21199859.11200464.79199356.68199964.93200569.11199442.71200058.63200661.37199561.15200165.41200772.82*39某市某一恶性疾病死亡率*403.指数平滑法据此预测2008年该病的死亡率,以便做出相应的预防措施。

*414.随机时间序列分析随机时间序列分析是指仅用它的过去值及随机扰动项所建立起来的模型进行分析,即描述序列{xt}某一时刻t和前p个时刻序列值之间的相互关系的分析方法,一般的p阶自回归过程AR(p)为:*424.随机时间序列分析建立具体的时间序列模型时,需解决如下三个问题:1)模型的具体形式。2)时序变量的滞后期。3)随机扰动项的结构。例如,取线性方程、一期滞后以及白噪声随机扰动项,模型将是一个1阶自回归过程:*434.随机时间序列分析*44四、MicrosoftSQLServer2005实践回归分析与时间序列分析1.建立数据库2.导入数据3.建立数据挖掘模型4.数据挖掘查看器45*北京市SARS传播部分统计数据表日期已确诊病例累计现有疑似病例死亡累计治愈出院累计日期已确诊病例累计现有疑似病例死亡累计治愈出院累计4月20日33940218335月23日246511791605824月21日48261025435月24日249011341636674月22日58866628465月25日249911051677044月23日69378235555月26日250410691687474月24日77486339645月27日251210051728284月25日87795442735月28日25149411758664月26日988109348765月29日25178031769284月27日1114125556785月30日252076017710064月28日1199127559785月31日252174718110874月29日1347135866836月1日252273918111244月30日1440140875906月2日252273418111575月1日15531415821006月3日252272418111895月2日16361468911096月4日252271818112635月3日17411493961156月5日252271618113215月4日180315371001186月6日252271318314035月5日189715101031216月7日252366818314465月6日196015231071346月8日252255018415435月7日204915141101416月9日252245118416535月8日213614861121526月10日252235118617475月9日217714251141686月11日252325718618215月10日222713971161756月12日252315518718765月11日226514111201866月13日25227118719445月12日230413781292086月14日252241891994

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论