版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二十二章第二十二章 常用统计预测方法常用统计预测方法第一节第一节 概概 述述 一、基本任务和意义 统计预测(统计预测(forecasting)应用最广泛的预测方法,对大量的数据资料进行统计分析,以求得比较准确的预测结果的理论和方法。 统计预测的作用w为管理决策提高科学依据;w为制定政策、编制计划和检查政策、计划的执行情况提供科学依据;w为统计工作的本身发展开拓了一个新的领域。w局限性:不能过多外延,影响预测的主观、客观因素较多。 二、统计预测的分类w按预测方法分:定性预测与定量预测w按预测时间分:短期预测:月、季、1年 中期预测:35年 长期预测:510年或以上1、定性预测w依据预测者的直观
2、判断能力对预测事件的未来状况进行直观判断的方法。w主要是对未来状况作性质上的预测,而不着重考虑其量的变化。w主要有:头脑风暴法、特尔菲法特尔菲法delphidelphi(专(专家调查法)、家调查法)、主观概率法、交叉概率法等。德尔菲法delphiw这是由美国兰德公司和道格拉斯公司协作发展的一种专家预测方法。它通过寄发调查表的形式征求专家的意见:专家在提出意见后以不记名的方式反馈回来;组织者将得到的初步结果进行综合整理,然后反馈给各位专家,请他们重新考虑后再次提出意见;经过几轮的匿名反馈过程,专家意见基本趋向一致;组织者依此得出预测结果。 2、定量预测方法 根据历史数据可统计资料,运用数学或其它
3、分析的方法所建立的模型计算预测对象在未来可能表现的数量。w(1)时间序列法时间序列法: 确定性时间序列预测,如移动平均法(一、二次),指数平滑法(一 、二、三次),季节周期法 随机性时间序列预测,如平稳时间序列预测(arma,arima等), 回归预测(线性、非线性、自回归预测等) 马尔柯夫(markov)预测 系统动力学(sd)预测w(2)模糊预测模糊预测w(3)灰色系统预测灰色系统预测 三、预测步骤确定预测目标确定预测目标数据收集与预处理数据收集与预处理预测方法选择与评价预测方法选择与评价建立预测模型建立预测模型利用预测模型作预测计算利用预测模型作预测计算结果分析与检验评价结果分析与检验评
4、价满意否满意否结束结束ny 预测结果的检验评价w相互检验:使用不同预测方法对同一对象进行预测,比较各自的预测误差。w对比检验:用预测结果与别人的预测结果进行比较。w专家检验:通过专家对结果的咨询,来评价其准确度。第二节 指数平滑方法时间序列时间序列定义:一组按时间先后顺序排列的数定义:一组按时间先后顺序排列的数据序列称为时间序列,用符号据序列称为时间序列,用符号y1,y2,yt表示,此中表示,此中t称为时间序列的长度。称为时间序列的长度。w分析要求:序列的平稳分析要求:序列的平稳 即:即:1.均数不随时间变化(差分)均数不随时间变化(差分) 2.方差不随时间变化(对数和平方差不随时间变化(对数
5、和平方根转换)方根转换) 3.无周期性变化;(季节差分)无周期性变化;(季节差分) 4.自相关系数只与时间间隔有关,自相关系数只与时间间隔有关,于所处的时间无关。于所处的时间无关。 指数平滑方法 利用本期实际数与本期预测数。以平滑系数加权计算指数平滑平均数,作为下期预测数。一般适用于短期和近期预测。1、一次指数平滑w 第t时刻的实际值w 第t时刻的预测值w 平滑系数,0 1反复递推得,ty 1111tttyyy 1ty 1111111111tttttyyyyy 值的选择w 值实际上是t期实际值和预测值的比例分配。其确定,是指数平滑法预测的关键。w数据呈水平波动发展,于其无关;w长期趋势比较稳定
6、,取较小值0.050.20;w呈迅速明显变动趋势,取较大值0.30.7w或者选取不同值,分别预测,根据结果选取符合实际的 值。 初始值的估计w当数据较多的时候,初始值的影响被逐步平滑而降低到最小,此时可以用第一个数据代替。w当数据较少时,初始值的影响较大,可以取最初几个实际值的平均值作为初始值的估计值。 11y2、多次指数平滑预测w二次指数平滑预测:对于有明显线性趋势的时间序列,对一次平滑值再作一次指数平滑。w三次指数平滑预测:出现曲线趋势。w各自的预测模型如下: 线性趋势 曲线趋势2ttt ltttt lyablyabl c l例w某公司1992年1季度到2000年4季度的销售资料,请用指数
7、平滑法分析预测将来4个季度的销售额dateq3 2000q1 2000q3 1999q1 1999q3 1998q1 1998q3 1997q1 1997q3 1996q1 1996q3 1995q1 1995q3 1994q1 1994q3 1993q1 1993q3 1992q1 1992销售额(万)11010090807060504030预测结果dateq3 2001q1 2001q3 2000q1 2000q3 1999q1 1999q3 1998q1 1998q3 1997q1 1997q3 1996q1 1996q3 1995q1 1995q3 1994q1 1994q3 1993
8、q1 1993q3 1992q1 199211010090807060504030销售额(万)fit for sales from exsmooth, mod_5 lm a 优缺点w只要知道本期的实际值和预测值就可以预测下一个时间的数值了w只适用于随时间的消逝呈指数下降的数据w平滑参数的确定没有很好的判断原则。w初始值的确定,如果数据点少,初始值对预测值的影响较大,违背了指数衰减的假设了。一般数据点大于40,初始值就影响不大。w适用于呈水平发展的序列,如有上升、下降和季节变化的,可以通过差分使得数据平稳化。w时间序列的预测一般不能太超前。 第三节第三节 arima预测方法预测方法 (autor
9、egressive integrated moving average)w 一、预测模型一、预测模型 自回归模型(ar) 滑动平均模型(ma) 自回归滑动平均模型(arima) 该方法包含三个过程:自回归、滑动平均和差分求和。1、自回归模型(ar)wyt与自己过去值的线性回归。wyt=1yt-1+2yt-2+ + pyt-p+et 式中: 1, 2, , p 是自回归系数;et 是随机项或称误差项又称白噪声;p 是自回归阶数。w若p1,则模型为 yt= 1yt-1+et 2、滑动平均模型(ma)t期观测值yt被描述为过去误差e(et:t时期的误差)的线性回归。其模型形式为:yt=et-1et-
10、1-2et-2-qet-q 式中: 是移动平均系数,q 是滑动平均的阶数。 若q=1,模型为 yt=et-1et-13、自回归滑动平均模型(arima)其模型为自回归模型与滑动平均模型的组合:yt=1yt-1+2yt-2+ + pyt-p+et 1et-1-2et-2- -qet-q w若p=1,q=1,则模型为:wyt= 1yt-1+et-1et-1 运用的前提条件w待分析的时间序列已经是由一个待分析的时间序列已经是由一个零均值零均值的的平稳平稳随机随机过程产生,平稳表明其折线图无明显的上升或下降过程产生,平稳表明其折线图无明显的上升或下降趋势。趋势。w非零均值、不平稳序列处理方法:非零均值
11、、不平稳序列处理方法: 1、零均值化处理:、零均值化处理: 2、对零均值非平稳序列进行差分、对零均值非平稳序列进行差分: 滞后滞后1项一阶差分:项一阶差分: 滞后滞后1项二阶差分:项二阶差分: 滞后滞后k项一阶差分:项一阶差分: . 3、对数或平方根转换、对数或平方根转换ttyyx1tttyyy21tttyyyttt kyyyy1,y2,y3, ,yt一阶差分一阶差分(t1):y2 (y2-y1) ,y3 (y3-y2),y4 (y4-y3),yt (yt-yt-1), 二阶差分二阶差分(t2): 2 2y3 ( ( y3 - - y2 ),),2 2y4 ( ( y4 y3 ), ), 2
12、2yt ( ( yt - - yt-1 ) ) . 预测的三个阶段1、模型的识别 identification:主要通过自相关函数acf、偏自相关函数pacf和ccf分析系列的随机性、平稳性、季节性,把握模型的大致方向,为模型定阶,提供粗的模型。2、参数估计和模型诊断estimation and diagno-stic:对提供的粗模型进行参数估计和假设检验,作模型的诊断。3、预测 forecasting:模型应用价值的体现。arima: 自回归的阶为自回归的阶为p,差分次数为,差分次数为d,滑动平均的阶为滑动平均的阶为q 二、二、 arima自相关分析自相关分析wn 是时间序列的观测值数目;是
13、时间序列的观测值数目; 是是n 个样本数据的个样本数据的平均值;平均值;yt 是时间序列在是时间序列在t 时刻的值;时刻的值;yt+k 是时间是时间序列与序列与t 时刻相隔时刻相隔k 期的值。期的值。rk 的取值范围是的取值范围是w1,1,它代表相差,它代表相差k个时期两项数据个时期两项数据系列系列之之间的相关程度。间的相关程度。12211n ktt ktkn kn ktt kttyyyyryyyy1. 自相关分析自相关分析y自相关系数自相关系数yt :y1,y2,y3, , yn-k, , yn-2, yn-1, ynyt+1 (k=1) :y2, y3,y4, ,ynyt+2 (k=2)
14、:y3, y4,y5, ,yn .yt+k :y1+k, y2+k,y3+k, ,ynw 由随机数字构成的序列,其各阶自相关由随机数字构成的序列,其各阶自相关系数应该是系数应该是0。当序列诸项之间没有相关时,。当序列诸项之间没有相关时,样本自相关系数的抽样分布近似于以样本自相关系数的抽样分布近似于以0为均值为均值的正态分布。这样,可以建立序列自相关系的正态分布。这样,可以建立序列自相关系数的随机区间。将时间系列的自相关系数与数的随机区间。将时间系列的自相关系数与偏自相关系数绘制成图,并在图上标出随机偏自相关系数绘制成图,并在图上标出随机区间就是自相关分析图,它可以用来分析时区间就是自相关分析图
15、,它可以用来分析时间序列的随机性、平稳性、季节性特性。间序列的随机性、平稳性、季节性特性。2. 偏自相关系数w时间序列yt 与yt-k 之间的相关是与中间各项yt-1,yt-2, ,yt-k+1 的相关结合在一起的,为了排除中间诸项因素的影响,只观察yt 与yt-k之间的相关,需要计算偏自相关系数。在时间序列中,偏自相关是在给定了yt-1, yt-2 ,yt-k+1 的条件下,yt 与yt-k 之间的条件相 关。w偏自相关和自相关系数被用来共同识别合适的arimr模型。 三、三、arima的计算步骤的计算步骤1. 识别识别 通过序列图、自相关分析对平稳性、季节通过序列图、自相关分析对平稳性、季
16、节性进行识别。短时滞性进行识别。短时滞acf为正且大,随为正且大,随lag增加增加而缓慢下降,而缓慢下降,有上升或下降趋势有上升或下降趋势;l12时时lag=12,24, acf最大,最大,无趋势有季节性无趋势有季节性; acf摆动在时滞摆动在时滞12,24,有峰值,有峰值,有趋势的有趋势的季节性。季节性。 proc arima; identify var=x(k); /*对滞后对滞后k项作一阶差分项作一阶差分*/proc arima; identify var=x(1,1); /*对滞后对滞后1项作二阶差分项作二阶差分*/2、模型诊断w残差序列的分析: 其自相关和偏自相关不应与0有显著的差异
17、。残差是随机的,是白噪声。w拟合优度的检验: aic 和 sbc 其值越低,模型越好。w根据选中的模型,进行参数的粗略估计,然后用sas软件进行分析比较,选择最佳的模型。例例223:某医院:某医院90.101.12逐月门诊量数据:逐月门诊量数据:w112 118 132 129 121 135 148 148 136 119 104 118w115 126 141 135 125 149 170 170 158 133 114 140w145 150 178 163 172 178 199 199 184 162 146 166w171 180 193 181 183 218 230 242
18、109 191 172 194w196 196 236 235 229 243 264 272 237 211 180 201w204 188 235 227 234 264 302 293 259 229 203 229w242 233 267 269 270 315 364 347 312 274 237 278w284 277 317 313 318 374 413 405 355 306 271 306w315 301 356 348 355 422 465 467 404 347 305 336w340 318 362 348 363 435 491 505 404 359 310
19、337w360 342 406 396 420 472 458 559 463 407 362 405w417 391 419 461 472 535 622 606 508 461 390 432data ar;date=intnx(month,31dec1989d,_n_);input x;cards;112 118 132 129 121 135 148 148 136 119 104 118115 126 141 135 125 149 170 170 158 133 114 140145 150 178 163 172 178 199 199 184 162 146 166171 1
20、80 193 181 183 218 230 242 109 191 172 194196 196 236 235 229 243 264 272 237 211 180 201204 188 235 227 234 264 302 293 259 229 203 229242 233 267 269 270 315 364 347 312 274 237 278284 277 317 313 318 374 413 405 355 306 271 306315 301 356 348 355 422 465 467 404 347 305 336340 318 362 348 363 435
21、 491 505 404 359 310 337360 342 406 396 420 472 458 559 463 407 362 405417 391 419 461 472 535 622 606 508 461 390 432;proc print data=ar;proc gplot data=ar;第一步:对平稳性、季节性的识别第一步:对平稳性、季节性的识别plot x*date /*date为横轴,为横轴,x为纵轴为纵轴*/vaxis=axis1 /*变量轴记为变量轴记为axis1*/haxis=axis2 /*时间轴记为时间轴记为axis2*/href=31dec1989d
22、to 1jan02d by year;symbol i=join v=c h=0.5 l=1 font=swissb;axis1 order=(100 to 650 by 50);axis2 order=(31dec1989d to 1jan02d by year);run;data ar1;date=intnx(month,31dec1989d,_n_);input x;cards;112 118 132 129 121 135 148 148 136 119 104 118417 391 419 461 472 535 622 606 508 461 390 432;run;data ar
23、2;set ar1;xlog=log(x);run; /*取对数,消除振幅变大趋势取对数,消除振幅变大趋势*/proc arima data=ar2; /*调用调用arima过程过程*/identify var=xlog(1,12) /*对变量对变量xlog进行滞后进行滞后1项、项、12项共项共2次差次差 分,使系列平稳分,使系列平稳*/ nlag=15; /*计算自相关的滞后数为计算自相关的滞后数为15,大于,大于p+d+q,小于小于n,默认默认 值为值为24*/*/ run;w autocorrelationslag covariance correlation -1 9 8 7 6 5
24、4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 std error 0 0.017435 1.00000 | |*| 0 1 -0.0083475 -.47877 | *| . | 0.087370 2 0.00049442 0.02836 | . |* . | 0.105514 3 -0.0018747 -.10752 | . *| . | 0.105572 4 0.0012192 0.06993 | . |* . | 0.106405 5 0.00056013 0.03213 | . |* . | 0.106755 6 0.00097085 0.05568 | . |* . |
25、 0.106829 7 -0.0023892 -.13703 | .*| . | 0.107050 8 0.00016580 0.00951 | . | . | 0.108381 9 0.0012098 0.06939 | . |* . | 0.10838710 -0.0001744 -.01001 | . | . | 0.10872611 0.0034000 0.19501 | . |* | 0.10873312 -0.0081267 -.46611 | *| . | 0.11137113 0.0039737 0.22791 | . |* | 0.12538114 -0.0000820 -.
26、00470 | . | . | 0.12850415 0.0017610 0.10101 | . |* . | 0.128506w . marks two standard errorsacf在在 lag=1、12时其时其值大,值大,选选ma阶数为阶数为1、12w inverse autocorrelations lag correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1w 1 0.72768 | . |* |w 2 0.51555 | . |* |w 3 0.36419 | . |* |w 4 0.25820 | . |* |w 5
27、0.21269 | . |* |w 6 0.17373 | . |* |w 7 0.18386 | . |* |w 8 0.16782 | . |* |w 9 0.18360 | . |* |w 10 0.21946 | . |* |w 11 0.26616 | . |* |w 12 0.32391 | . |* |w 13 0.18256 | . |* |w 14 0.08070 | . |*. |w 15 0.01955 | . | . |iacf在在 lag=1、12时其值大,时其值大,选选ar阶数为阶数为1、12w partial autocorrelationsw lag corre
28、lation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1w 1 -0.47877 | *| . |w 2 -0.26060 | *| . |w 3 -0.29951 | *| . |w 4 -0.20526 | *| . |w 5 -0.09406 | .*| . |w 6 0.04898 | . |* . |w 7 -0.07396 | . *| . | w 8 -0.11844 | .*| . |w 9 -0.02010 | . | . |w 10 -0.02542 | . *| . |w 11 0.30690 | . |* |w 12 -0.26
29、980 | *| . |w 13 -0.19225 | *| . |w 14 -0.13264 | *| . |w 15 -0.05070 | . *| . |pacf在在 lag=1、12时时其值大,选其值大,选ar阶数为阶数为1、12w autocorrelation check for white noise to chi- pr lag square df chisq -autocorrelations-6 33.65 6 .0001 -0.479 0.028 -0.108 0.070 0.032 0.05612 74.33 12 .0001 -0.137 0.010 0.069 -0
30、.010 0.195 -0.466p |t| lagmu 0.0004856 0.0005636 0.86 0.3905 0ma1,1 0.75055 0.08158 9.20 .0001 1ma2,1 0.83332 0.07743 10.76 0.05,系数为系数为0,丢弃这两项,丢弃这两项data ar1;input x;cards;112 118 132 129 121 135 148 148 136 119 104 118;run;data ar2;set ar1;xlog=log(x);run; proc arima data=ar2;identify var=xlog(1,12)
31、 nlag=15;estimate q=(1)(12) ;第三步:确定模型进行预测第三步:确定模型进行预测forecast lean=12 /*向前预测的次数为向前预测的次数为12*/interval=month /*按月对总体均数作区间估计按月对总体均数作区间估计*/out=foxxlog;run;/*将运行结果存入数据集将运行结果存入数据集foxxlog*/proc print data=foxxlog; /*输出数据集输出数据集foxxlog*/run;run;conditional least squares estimation standard approxparameter es
32、timate error t value pr |t| lagmu 0.0004486 0.0005787 0.78 0.4397 0ma1,1 0.72660 0.06081 11.95 .0001 1ma2,1 0.81285 0.06010 13.52 lag square df chisq -autocorrelations-6 1.28 4 0.8641 0.023 0.022 -0.054 -0.017 0.062 -0.03512 4.88 10 0.8988 -0.127 -0.057 0.029 0.048 0.051 0.01618 11.53 16 0.7753 0.073 0.081 0.074 -0.073 0.124 -0.07824 15.60 22 0.8354 -0.040 -0.081 -0.018 0.056 0.116 0.016w forecasts for variable xlogw obs for
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建省永春三中2025届生物高二上期末复习检测试题含解析
- 四年级数学(三位数乘两位数)计算题专项练习及答案
- 四年级数学(上)计算题专项练习及答案汇编
- 三年级数学五千以内加减混合两步运算题评价试题试题大全附答案
- 举一反三系列高考高中数学同步及复习资料人教A版必修2专题8.4 立体图形的直观图(重难点题型检测)(含答案及解析)
- 大学生三下乡暑假实践心得范文5篇2020
- 《安全教育》心得体会范本锦集六篇
- 100以内整数除法计算过关自测练习题带答案
- 职工管理制度重要性(50篇)
- 银行员工年终工作总结范文5篇
- 密封件常用失效形式之斯特封篇
- 机房搬迁方案计划
- 回旋钻钻孔灌注桩施工方案
- 房地产评估工作方案
- 苏教版小学数学六年级上册《解决问题的策略—假设》优质教学设计
- 张琼-《中国少数民族音乐——绚烂多姿的苗族飞歌》案例分析
- 自习室创业项目计划书
- SAP项目用户操作手册CO月结
- §9.10多面体欧拉定理的发现
- 适合打印的 五十音图表
- A3常见问题分析及服务技巧
评论
0/150
提交评论