统计原理演示文稿5(15)_第1页
统计原理演示文稿5(15)_第2页
统计原理演示文稿5(15)_第3页
统计原理演示文稿5(15)_第4页
统计原理演示文稿5(15)_第5页
已阅读5页,还剩111页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第五章统计数据关系的分析统计数据关系的分析2 5.1相关分析相关分析3 变量间的关系可以分为两类:函数关系和相关关系。4 相关关系是研究变量间的相关关系的。5相关分析方法: 提出统计指标来描述变量间的相关关系。6相关的分类:a.有正相关和负相关之分。正相关:变量的增减性一致;负相关:变量的增减性相反。b.有直线相关和曲线相关之分。7例:从某大学男生中随机抽取10名,测得其身高,体重数值如下(米,公斤):(1.71,65),(1.63,63),(1.84,70),(1.90,75),(1.58,60),(1.60,55),(1.75,64),(1.78,69),(1.80,65),(1.64,

2、58)考察体重与身高的关系.8画散点图 : X-身高, Y-体重在坐标平面上描出点(Xi,Yi) , i=1,2n0204060801.51.61.71.81.92xy9定义:设样本为(Xi,Yi) i=1,2, ,n称为X与Y的样本相关系数.niYniYniXniXniYXniYiXr122122110 1. 为1时Y与X是完全的直线关系2. 为0时Y与X没有一点直线关系3. 接近1时Y与X的直线关系越强 4. 接近0时Y与X的直线关系越弱1rrrrr11 r的等级分类:1. 0r0.3, 微弱相关;2. 0.3r0.5, 低度相关;3.0.50.8 , 高度相关。12 4179012nii

3、Y9088.024 .6410417902723.1107935.294 .64723.11088.1114r7935.29, 4 .64,723. 1,88.1114121niiiniiXYXYX135.2 回归分析回归分析5.2.1一元线性回归分析一元线性回归分析14 回归分析也是研究变量间的相关关系的。15回归分析方法: 先提出一个模型把变量联系起来,然后把它加工成方程,此方程经检验有效后可用来预报。16一.一元线性回归模型:Y=a+bX+其中Y为可观测随机变量,X为可观测非随机变量,为不可观测随机变量,a,b是常数。17 任务是找a,b的估计代入后去除. =a+bXY18 二.参数a,

4、b的估计19Yi=a+bXi+i, ,i =1,2n . Q(a,b)=使Q(a,b)达到最小的a,b的值称为a,b的最小二乘估计,这时称 =a+bX 为一元线性回归方程,它的图象称为回归直线。ibXaiYniiiniiibXaYYY1212Y20XbYaXnXYXnYXbniiniii;1221问题的解为:21对前例: 7935.29,4 .64,723.1,88.1114121niiiniiXYXYX6 .491221niiniiiXnXYXnYXb6 .216 .49723. 14 .64XbYa22 因此所求的一元线性回归方程为: = -21.06+49.6XY23三.一元线性回归方程

5、的有效性检验24记SSY= 称为总偏差平方和 SSR= 称为回归平方和 SSE= 称为误差平方和niYiY12niYiY12niiYiY1225定理:下面分解式成立 SSY=SSR+SSE2610SSYSSR1. 比值为1时Y与X是完全的直线关系2. 比值为0时Y与X没有一点直线关系3. 比值接近1时Y与X的直线关系越强 4. 比值接近0时Y与X的直线关系越弱27定理:2rSSYSSR28四.预测:设回归方程为: =a+bX经检验有效后可应用它进行预测.当X=x0时,Y0的预测值为:Y00bxaY295.2.2多元线性回归分析多元线性回归分析30k元线性回归模型:Y=b0+b1X1+bkXk+

6、31样本为:(Yi,Xi1,Xi2, ,Xik) i=1,2, ,n 32Q(b0,b1, ,bn)=使Q(b0,b1, ,bn)达到最小的 b0,b1, ,bn 的值依次称为b0,b1, ,bn 的最小二乘估计.niikXkbiXbiXbbiY122211033这时称 =b0+b1X1+bkXkk元线性回归方程. Y34记其中 是bi的最小二乘估计,i=0,1,2, ,k knknnkknbbbbXXXXXXXXXXYYYY,111,1021222211121121ib35最小二乘估计的表达式.1YXXXb365.2.3可线性化模型的回归可线性化模型的回归分析分析371.一元曲线回归模型例:

7、双曲线回归模型为:Y=a+b +X138令 原模型可化为: Y=a+b + 应用数据 i=1,2, ,n求得回归方程 =a+b XX1XYXiYiXiYiX,1,39由此可得双曲线回归方程: =a+bYX1402.多项式回归模型:Y=令则原模型化为k元线性回归模型:kkXbXbXbb2210kkXXXXXX,221kkXbXbbY11041设样本为:(Xi,Yi), i=1,2, ,n由 可以得到X1,X2, ,Xk的取值,从而可求得b0,b1, ,bk的最小二乘估计.iiXX42k元线性回归方程: =b0+b1X1+bkXk等量代换得k阶多项式回归方程:YkkXbXbXbbY2210435.

8、3. 动态数列分析44概念回忆: 按时间次序排列的数据序列.也称动态数列或时间数列.45 5.3.1动态数列的影响因素动态数列的影响因素46 一. 时间序列的构成要素 时间序列各项指标数值的不同,是由许多因素共同作用的结果。影响因素归纳起来大体有四类。47一、长期趋势(T)。指现象在一段较长的时间内发展水平持续的沿着一个方向,逐渐向上或向下变动或保持平稳的趋势。48例如粮食生产由于种植方法的不断改良、日益发达的农田水利等因素的影响,从较长时间来看,总趋势是持续增加,向上发展的.认识和掌握事物的长期趋势,可以把握事物发展变化的基本特点。49二、季节变动二、季节变动(S)。指现象受季。指现象受季节

9、性因素影响而发生的变动。节性因素影响而发生的变动。其变动的特点是,在一年或更其变动的特点是,在一年或更短的时间内使现象呈周期性重短的时间内使现象呈周期性重复的变化。引起季节变动的原复的变化。引起季节变动的原因既有自然因素,也有人为因因既有自然因素,也有人为因素,如气候条件、节假日以及素,如气候条件、节假日以及风俗习惯等等。认识和掌握季风俗习惯等等。认识和掌握季节变动,对管理部门作决策有节变动,对管理部门作决策有重要的作用重要的作用.50三、循环变动(C)。指现象发生周期比较长的涨落起伏的变动.通常周期少则三年,一般在五年以上.51四. 不规则变动(R)。指除了受以上各种变动的影响以外,还受偶然

10、因素或不明原因而引起的变动.其变化无规则可循.52二.时间序列模型 设X表示指标值,T,S,C,R分别表示四种构成因素.称X=f(T,S,C,R)为时间序列模型.535.3.2动态数列模型动态数列模型(两种常见的时间序列模型)54 加法模型 X=T+S+C+R其中T取非负值,S,C取值可正可负,要求它们的平均值为0.55 当时间序列指标值是年度数据,这时不能考虑S, 当时间序列指标值只有若干年(10年)的月份或季度数据,这时不能考虑C.有下面特例: X= T+S+R; X= T+C+R;56乘法模型 X=TSCR这时T,S,C均取非负值, 要求平均值为1.特例: X= TSR; X= TCR;

11、57模型的选择先介绍时间序列图设时间序列为: 时间 t1,t2,tn指标值 x1,x2,xn在坐标平面上描点(ti,xi),i=1,2,n,依次用线连接这些点就是时间序列图.58 若时间序列图夹在两条平行线之间,可选用加法模型; 若时间序列图夹在两条喇叭型线之间,可选用乘法模型.595.3.3动态数列的直观动态数列的直观预报法预报法60 直观预报法中简单易用的是建立方程进行预报。61方法. 设指标值用X表示,时间用t表示.建立数学模型 X=f(t)来预测,它是一种简单的方法。62 根据现象发展的表现形态的不同,可分为直线模型和曲线模型。可以画散点图选择。63设时间序列为:时间 t1,t2,tn

12、指标值x1,x2,xn在坐标平面上描点(ti,xi),i=1,2,n,这些点组成的图就是散点图.64 若散点分布在一条直线附近可选用直线方程; 若散点分布在一条曲线附近可选用曲线方程.65例例4.5.1 根据某地1995年2000年粮食产量的资料,试预测2001年该地粮食产量。表:某地1995年2000年粮食产量的资料年 份时间代码粮食产量(万吨)1995185.61996291.01997396.119984101.219995107.020006112.26667解: t=21, X=593.1, =91, Xt=2168.9 2t23.8062132. 561 .59332. 56216

13、9162169169 .2168222t bXat nttXnXtb68所求的直线趋势方程为: =80.23+5.32tX69 有了趋势方程可以进行预则.在本例中若要预测2002年该地的粮食产量,把2002年对应的时间代码t=8代入即可得到预则值. =80.23+5.328 =122.79(万吨)X705.3.4加法模型与乘法加法模型与乘法模型的预报方法模型的预报方法71一.时间序列各种因素的测定72(一)长期趋势的测定 长期趋势是时间数列的主要构成要素之一,它是指现象在较长时期内持续发展变化的一种趋向或状态。73 通过对现象发展的长期趋势的测定与分析,可以掌握其活动的规律性,并对未来的发展趋

14、势作出推断.此外,测定长期趋势的目的之一,也是为了将其从时间数列中予以消除,以便观察与测定其他各影响因素。74 长期趋势的分析方法:为了体现这种趋势的状态和走句,需要把波动修匀.长期趋势的测定方法有多种,这里只介绍几种常用的方法。751.随手描绘法 画出时间序列图,由图的走向大致可以看出长期趋势是否存在.762.时期扩大法 通过扩大原时间数列的时间间隔,构造一个新的时间数列来体现是否存在长期趋势.773.移动平均法 移动平均法是测定长期趋势的一种比较简单、有效的常用方法。78 从时间数列的第一项开始从时间数列的第一项开始,按一定项数按一定项数.求序时平均数求序时平均数,逐项逐项移动,得出一个由

15、移动平均数移动,得出一个由移动平均数构成的时间数列,由这些平均构成的时间数列,由这些平均数形成的新的时间数列对原时数形成的新的时间数列对原时间数列的波动起到一定修匀作间数列的波动起到一定修匀作用,削弱了原数列中短期偶然用,削弱了原数列中短期偶然因素的影响,从而呈现出现象因素的影响,从而呈现出现象发展的长期趋势。发展的长期趋势。79按K项移动的计算公式:kXXXXk211kXXXXk 1322kXXXXkiiii1180 移动平均法根据资料的特点及研究的具体任务,选择移动平均的项数.81 奇数项移动平均的所得值应放在中间一项对应的位置上,偶数项移动平均的所得值应放在中间二项位置中间,它须要移正平

16、均,即再作一次二项移动平均,才得到最后的趋势值。8283 被移动平均的项数越多,对原数列的修匀作用就越大,但得到的新动态数列项数越少.844.数学模型法. 设指标值用X表示,时间用t表示.建立数学模型 X=f(t)来测定长期趋势,是应用较广的一种方法.85 现象发展的长期趋势根据其表现形态的不同,可分为直线趋势和曲线趋势。可以画散点图选择.86设时间序列为:时间 t1,t2,tn指标值x1,x2,xn在坐标平面上描点(ti,xi),i=1,2,n,这些点组成的图就是散点图.87 若散点分布在一条直线附近可选用直线方程; 若散点分布在一条曲线附近可选用曲线方程.88A.直线趋势方程 =a+bt其

17、中a,b可由下面计算公式得到:Xt bXat nttXnXtb,2289用上述公式来计算的方法称为最小二乘法.其中时间t可选时间代码, t=1,2,n来代替原来时间t1,t2,tn,这样计算简单,不影响问题的讨论.90例 .根据某地19952000年粮食产量的资料应用最小二乘法建立直线趋势方程.91 年 份 时间代码粮食产量(万吨) 1995 1 85.6 1996 2 91.0 1997 3 96.1 1998 4 101.2 1999 5 107.0 2000 6 112.292B.曲线趋势方程93(二二)季节变动分析季节变动分析 常见的方法有按月常见的方法有按月(或季或季)平均法和移动平

18、均趋势剔除法平均法和移动平均趋势剔除法. 主要是计算季节比率主要是计算季节比率 (也称季节也称季节指数指数)来反映季节变动来反映季节变动.季节比率季节比率高受季节变动影响处于高峰高受季节变动影响处于高峰;季季节比率小受季节变动影响处于节比率小受季节变动影响处于低潮低潮.94前提条件:要有若干年的分期(如月或季度)资料.(一) 按月(或季)平均法季节比率=同月(或同季度)平均数除以所有月(或季度)平均数.可用下式表示: 一般N=4或12NiXXSii, 2 , 1,95 注:对乘法模型当SiN时,要计算调整的季节比率:i=1,2,NNjjiiSNSS196例.某地区鸡蛋产量资料如下:(单位:吨)

19、97 1月 2月 3月 4月 5月 6月1996年 39 63 232 302 2682011997年 49 93 240 327 2972491998年 49 120 250 350 320 290 合 计 137 276 722 979 885 7407月8月9月10月 11月 12月1996年 136 88 56 42 44 481997年 145 84 64 63 63 651998年 150 80 72 80 80 63 合 计 431 252 192 185 187 17698试根据上表资料,采用按月平均法计算1,4,7三个月的季节比率,并回答这几个月的季节比率说明什么问题.99解

20、:36个月鸡蛋总产量=51622 36个月鸡蛋总月平均数 =516236=143.39 再计算三年同月平均数:1月 1373=45.674月 9793=326.337月 4313=143.671001,4,7月的季节比率分别为:S1=45.67143.43=31.85%S4=326.33143.39=227.58%S7=143.67143.39=100.19%计算结果表明1月的季节比率为31.85%处于淡季; 4月的季节比率为227.58 %处于旺季;7月的季节比率为100.19%处于不淡不旺季.101(二二) 移动平均趋势剔除法移动平均趋势剔除法 该方法的基本思想是先将时该方法的基本思想是先

21、将时间数列中的长期趋势予以消除,间数列中的长期趋势予以消除,然后再计算季节比率来测定季节然后再计算季节比率来测定季节变动。其中数列中的长期趋势值变动。其中数列中的长期趋势值可采用移动平均法求得。称为移可采用移动平均法求得。称为移动平均趋势剔除法动平均趋势剔除法.此方法比按月此方法比按月(季季)平均法精细平均法精细.102下面介绍此方法. 假定时间数列模型为:X=TSR103 可将移动平均趋势剔除法测定可将移动平均趋势剔除法测定季节变动的步骤概括如下:季节变动的步骤概括如下:(1)根据各年的月(季)资料,计)根据各年的月(季)资料,计算算12项(或项(或4项)移动平均趋势值项)移动平均趋势值T;

22、(2)将各实际值除以相应的趋势值,)将各实际值除以相应的趋势值,即得即得XT=SR;(3)将)将SR重新按月(季)排列,重新按月(季)排列,求得同月(同季)平均数作为季节求得同月(同季)平均数作为季节比率比率Si。104二. 加法模型和乘法模型的加法模型和乘法模型的预报预报若用上面模型: X=TSR预报公式为: iSTX105 若要用过去若要用过去,现在资料预报现在资料预报将来某时刻的指标值将来某时刻的指标值.先可以计先可以计算趋势值数列算趋势值数列(ti,Ti),利用此数列利用此数列给出将来某时刻给出将来某时刻T的估计值的估计值,再再用移动平均趋势剔除法计算得用移动平均趋势剔除法计算得季节比率季节比率Si . 这样再用预报公式这样再用预报公式可得预报值可得预报值.106例.某地区记录的4年中为某类商品登的广告

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论