一元线性回归分析预测法的基本数学模型为1_第1页
一元线性回归分析预测法的基本数学模型为1_第2页
一元线性回归分析预测法的基本数学模型为1_第3页
一元线性回归分析预测法的基本数学模型为1_第4页
一元线性回归分析预测法的基本数学模型为1_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、元线性回归分析预测法的基本数学模型为:?=a +bx此式又称为一元线性回归方程式中:x为自变量;?为因变量,线性回归分析估计值,或预测值;a, b为待定回归参数;a为回归直线的截距;b为回归直线的斜率。一元线性回归分析模型的几何图形如图 所示。图 直线回归分析模型的几何图形(三)一元线性回归分析预测法参数 a, b的确定一元线性回归分析预测法用最小二乘法求回归方程的参数假设有n期的历史观察资料:t123nxtxix 2X3XnytViV2y 3-Vn用最小二乘法求回归参数的基本原则是,对于确定的方程,要使观察值y与估计值的偏差的平方和最小。由此方法可求出:b=nx xy -xv ynq x2/

2、x)2(6-1)(6-2)只需将历史资料自变量x和对应的因变量y的数据代入上面的两式,即可求 得回归参数a, b(四)一元线性回归分析预测法模型的建立将利用历史资料数据和参数公式(6-1 )和(6-2 )求得的a, b值,代入一(6-3)元回归方程式,既可得预测模型:? 二 a bx此时虽已求除预测模型,但不能将预测模型直接用于实际预测, 还必须对模 型进行检验。(五)一元线性回归分析预测法预测模型的检验对预测模型的检验主要包括以下几个方面:1、回归标准差检验。一般情况下,从观察值 y与估计值?的对比来看,回 归直线上的各点(估计值)同对应的观察期各点(观察值)之间,均存在着一定 的离差,即观

3、察值曲线上各点的y值均偏离回归直线。离差越大,拟合程度越差。 因而需要测定估计值的标准差,而回归标准差s就是用来估计y值在回归直线两 侧的离差程度,以便在进行实际预测时为预测值建立一个置信区间范围。回归标准差的计算公式为:' yt -?t 2SyJn-k(6-4)式中:Sy为回归标准差;y为因变量第t期的观察值;P为因变量第t期的估计值;n为观察期的个数;k为自由度,为变量的个数(包括因变量和自变量)。S y值越小,表明回归直线拟合越好。S y值越小,说明回归方程能解释的总 离差部分越大,也意味着x与y之间的相关程度越高。判断回归标准差能否通过检验,常常采用以下公式:Syy X100%

4、(6-5)式中:Sy为回归标准差;y为因变量观察值的平均值。若依此式计算出的值小于15%,即为预测模型通过了回归标准差检验。2、相关系数检验。相关系数是描述两个变量x与y之间线性关系密切程度 的一个数量指标。在一元线性回归分析预测法中,相关系数只对一个自变量与一 个因变量进行相关程度分析,所以又称为单相关系数相关系数r的基本公式为:' (x X)(y y)r=r=(6-6 )(6-7)二(x -x)2(y -y)2n'E xy -<n£ x2 -(£ x)2 ;'n£ y2 - y)2式中:x为自变量的观察值;y为因变量的观察值; 为

5、自变量观察值的平均值; xZ: yy为因变量观察值的平均值;n为观察期的个数。通过数学证明我们可以发现相关系数 r具有这样的性质:0& r &1, r的值 反映了 x与y之间的内在联系,可以得出以下结论:其中:若r越接近0, x与y的线性相关程度越小;若r越接近1 , x与y的线性相关程度越大。(1)当r=0时,回归直线方程中b=0 ,回归直线平行于x轴,说明y取值 与x无关,二者之间无线性相关关系。此时称y与x毫无线性关系。在通常情况 下,这时三点的分布是不规则的。(2)当r= ±1时,所有的散点完全在回归直线上。 此时称y与x完全线性 相关。当r=1时,称完全正相

6、关;当r=-1时,称完全负相关。附录一相关系数检验表n-20.100.050.020.010.00110.987690.996920.9995070.9998770.999998820.900000.950000.980000.990000.9990030.80540.87830.934330.958730.9911640.72938.81140.88220.917200.9740650.66940.75450.83290.87450.9507460.62150.70670.78870.83430.9249370.58220.66640.74980.79770.898280.54940.631

7、90.71550.76460.872190.52140.60210.68510.73480.8471100.49730.57600.65810.70790.8233110.47620.55290.63390.68350.8010120.45750.53240.61200.66140.7800130.44090.51390.59230.64110.7603140.42590.49730.57420.62260.7420150.41240.48210.55770.60550.7246160.40000.46830.54250.58970.7084170.38870.45550.52850.5751

8、0.6932180.37830.44380.51550.56140.6787190.36870.43290.50340.54870.6652200.35980.44270.49210.53680.6524250.32330.38090.44510.48690.5974300.29600.34940.40930.44870.5541350.27460.32460.38100.41820.5189400.25730.30440.35780.39320.4896450.24280.28750.33840.37210.4648500.23060.27320.32180.53410.4433600.21

9、080.25000.29480.32480.4078700.19540.23190.27370.30170.3799800.18290.21720.25650.28300.3568900.17260.20500.24220.26730.33751000.16380.19460.23010.25400.3211注:表中给出了满足 PW "r0?="的的数值。其中n-2是自由度相关系数的值到底取多大,才可以确定 y与x之间具有线性关系呢?一般情况下,当r R.8时,认为y与x高度线性相关;当0.5/r <0.8 时,认为y与x中度线性相关;当0.3< r <0

10、.5时,认为y与x低度相关;当 r <0.3时,认为y与x不相关。(六)预测并确定置信区间在上述检验通过以后,将已判断除的未来的自变量x的值代入预测模型,就 可计算出预测值。由于实际计算中难免出现误差,预测值不可能是一个确定值,而应该是一个 范围或区间,一般要求实际值位于这个区间范围的可靠程度应达到95%以上。若给定可靠度1-口,可以证明y0的预测区间为:(?0 -QS。,?。+熔)(6-8)22n其中:So=Sy11 :-' Xi i =1n n 2nq Xii 1".4(n-2)式中:22 ,可由t分布表查得;Xo为预测点X值;Sy是估计标准差,其计算公式见(6-4

11、);Xi为统计数据。利用公式(6-8)来确定预测区间,在计算上颇为麻烦,在实际应用中可以做一些简化。事实上,预测值?0的可靠度为68.27%时的预测区间为:(?0- Sy, ?0+S y)预测值?0的可靠度为95.45%时的预测区间为:(?0- 2S y , y0+2S y)预测值?0的可靠度为99.73%时的预测区间为:(?0- 3S y , y0+3S y)预测区间的长度直接关系到预测的准确性。 显然,预测区间越长,精度越差,反之则越好。例:某地区居民的收入与社会商品零售总额近 10年的统计资料如表17-2所示。表17-2社会商品零售总额与居民收入统计资料单位:亿元厅p居民收入冏品零售总额

12、厅P居民收入冏品零售总额164566107882706071251023776681431184827091651365927810189155讨论社会商品零售总额与居民收入的关系。并以此预测下一年居民收入达到 213亿元时的社会商品零售总额。解:第一步,因为预测目标是社会商品零售总额, 所以令社会商品零售总额 为V,居民收入为x。依据统计资料,做出散点图。见图 17-3图17-3统计资料散点图第二步,建立数学模型。从图17-3可见,y与x呈线性关系,故设预测模型 为:? = a bx第三步,估计参数a, bo为了便于计算,列出计算表,如表 17-4所示表17-4线性回归计算表厅PXiVi为V

13、i2Xi2Vi1645635844096313627060420049003600377665082592943564827057406724490059278717684646084610788941611449774471251021275015625104048143118168742044913924916513622440272251849610189155292953572124025合计111492911655714058296669将所得数字代入公式(8-2 )和(8-3)可得nx xy-' xv y 10 116557 1114 929b=2=nx x -,x) 10

14、 140582 - 1114=13066.4/16482.4=0.792711a=-Z y-b -Z x =929/10-0.7927 X 1114/10=4.593 nn由此,得回归预测方程式:y?=4.593+0.7927x这个模型表明:居民的平均收入每增加1元,平均就有约0.79元用于商品消 费。第四步,进行相关性检验。首先,求相关系数nx xy - % xx yr=qn£ x2 -e x)24nZ y2 -e y)2=0.9997显然,y与x具有高度线性相关性。其次,再用估计标准差验证。因为估计标准差咨(yt - ?t 2y2 -aS V -b£ xiYiSy= '= 'n - k -n - 296669 -4.593 929 -0.7927 116557=0.95981

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论