![《管理统计学》第八章课件_第1页](http://file4.renrendoc.com/view/3bbc434e52d0b62d0c1b22e06f671927/3bbc434e52d0b62d0c1b22e06f6719271.gif)
![《管理统计学》第八章课件_第2页](http://file4.renrendoc.com/view/3bbc434e52d0b62d0c1b22e06f671927/3bbc434e52d0b62d0c1b22e06f6719272.gif)
![《管理统计学》第八章课件_第3页](http://file4.renrendoc.com/view/3bbc434e52d0b62d0c1b22e06f671927/3bbc434e52d0b62d0c1b22e06f6719273.gif)
![《管理统计学》第八章课件_第4页](http://file4.renrendoc.com/view/3bbc434e52d0b62d0c1b22e06f671927/3bbc434e52d0b62d0c1b22e06f6719274.gif)
![《管理统计学》第八章课件_第5页](http://file4.renrendoc.com/view/3bbc434e52d0b62d0c1b22e06f671927/3bbc434e52d0b62d0c1b22e06f6719275.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 相关分析与回归分析 第一节 相关分析第二节 简单回归分析第三节 多重线性回归分析第四节 时间序列分析第1页,共87页。相关分析总体相关与样本相关偏相关距离相关品质相关交叉列联表分析第2页,共87页。相关分析变量之间的相关关系确定型的关系函数关系不确定型的关系相关关系 相关分析是研究变量之间不确定关系的统计方法。 其中最为常见的是两个或多个随机变量之间的线性相关关系。相关关系的内容有第3页,共87页。(一)按相关程度划分完全相关不完全相关不相关(二)按相关方向划分正相关:同方向变动负相关:反方向变动(三)按相关形式划分线性相关非线性相关(四)按变量多少划分单相关:两变量间的相关复相关偏相
2、关(五)按相关性质划分真实相关虚假相关第4页,共87页。Kendalls tua-b 相关系数二、普通相关系数的种类及计算总体相关系数(一)积矩相关系数样本相关系数(参数相关)(二)等级相关系数等级相关系数适用于顺序级和刻度级的配对样本。(非参数相关)Spearman相关系数(三)偏相关系数(四)复相关系数第5页,共87页。1.总体相关系数2.样本相关系数积矩相关系数适用于等间隔测度的数据或比例数据之间的线性关系的密切程度。第6页,共87页。图中,普通相关系数的几何解释与即,表示向量一组角的余弦就是配对样本的相关系数。的模。样本,可以视为一个向量。第7页,共87页。相关系数为0的两个随机变量,
3、不相关,但不一定相互独立。 相关系数为0的两个服从正态分布的随机变量,一定相互独立。 相互独立的随机变量间的相关系数,必然为0。普通相关系数的取值范围样本相关系数也是区间-1,1之间的一个量。第8页,共87页。普通相关系数的直观散点图设有配对样本观察值与则其直观散点图中,标是()。每个点的平面坐散点图 散点图(Graphs Scatter)第9页,共87页。积矩相关系数的检验检验的种类偏相关系数的检验相关系数异于零的显著性检验积矩相关系数的检验式中,是样本容量,是简单相关系数(Pearson)检验统计量等级相关系数的检验这是一个双尾检验问题设定假设:第10页,共87页。练习,某企业产品广告费和
4、销售收入资料如下,判断广告费和销售收入之间关系密切程度如何?310284066117140404序号广告费(万元)销售收入(百万元)1234567357811131461124569103792549641211691966331416253681100263合计第11页,共87页。 普通相关分析的SPSS的实现过程:Analyze菜单Correlate项中选择Bivariate命令。第12页,共87页。Flag Significant Correlation:是否用星号标明输出结果的显著性。Means and Standard Deviations:输出所选变量的均值、标准差和样本个数。Cr
5、oss Product Deviations and Covariances:输出平方和及协方差。第13页,共87页。第14页,共87页。第15页,共87页。第16页,共87页。回归分析一元回归多元回归全部强行进入回归逐步回归第17页,共87页。 回归:揭示出不确定数量关系的内在数量变化规律,并通过一定的表达式描述数量之间的这种内在关系的方法。不确定性的函数关系回归的涵义数据之间的关系 函数确定性的函数关系回归方程第18页,共87页。回归分析的任务(1)通过分析大量的样本数据,确定变量之间的统计关系,并以数学表达式形式给出;(2)对确定的数学关系式的可信度进行统计检验,找出对某一特定变量影响较
6、为显著的变量和不显著的变量;(3)利用确定的数学关系式,根据自变量预测或控制因变量的取值,并找出这种预测或控制的精确度。 第19页,共87页。回归分析时变量的设定回归分析的被解释变量必须是刻度级的,如果是顺序级的,要用Numeric型的来表示。如果被解释变量是名义级的,将用Logistic回归等方法处理。解释变量可以是刻度级、顺序级、名义级的变量,不论是什么级别的数据,都必须用Numeric型的来表示。第20页,共87页。一元线性回归分析一元线性回归模型的求解一元线性回归模型的SPSS实现一元线性回归模型的设定一元线性回归模型的检验第21页,共87页。样本回归模型:样本回归直线:第22页,共8
7、7页。一元线性回归模型的求解最小平方法第23页,共87页。回归方程的显著性检验线性回归方程的检验回归系数的显著性检验回归效果的检验第24页,共87页。回归方程的显著性检验F检验:回归方程不显著:回归方程显著:总离差平方和:剩余平方和/残差平方和:回归离差平方和第25页,共87页。若全部观测值都落在回归直线上,则 判定相关系数越接近1,表明回归平方和占总离差平方和的比例越大,用x的变动解释y 值变动的部分就越多,回归的效果就越好。回归效果的检验判定相关系数检验若x完全无助于解释y的变动,则 F检验校正的判定系数第26页,共87页。 统计量 中不含有自由度。所谓校正的判定系数是指“考虑了自由度的判
8、定系数 ”。其定义如下:剔除了自由度的影响。校正的判定系数Adjusted第27页,共87页。式中:回归效果的检验F检验:样本容量:自变量的个数(含常数项):判定系数第28页,共87页。回归系数的显著性检验T检验成立,即当时显著异于0。针对回归系数的统计量的显著性检验决定了相应的变量能否作为解释变量进入回归方程。 第29页,共87页。回归系数的显著性检验T检验成立,即当时显著异于0。针对回归系数的统计量的显著性检验决定了相应的变量能否作为解释变量进入回归方程。 第30页,共87页。 SPSS的实现:Analyze菜单Regression项中选择Linear命令。第31页,共87页。Enter:
9、强行进入法,即所选自变量全部进入模型。Remove:强制剔除法,即建立回归方程时,根据设定的条件从回归方程中剔除部分自变量。Backward:向后剔除法,根据Option对话框中设定的判据,先建立全模型,然后根据设置的判据,每次剔除一个使方差分析中的F值最小的自变量,直到回归方程中不再含有不符合判据的自变量为止。Forward:向前选择法。 Stepwise:逐步进入法,根据Option对话框中设定的判据及方差分析结果,选择符合判据的自变量与因变量相关程度最高的进入回归方程。依据Forward选入自变量,依据Backward将模型中F值最小且符合剔除判据的变量剔除,重复。Method处下拉菜单
10、,共有5个选项:第32页,共87页。 WLS选项是存在异方差时,利用加权最小二乘法替代普通最小二乘法估计回归模型参数。通过WLS可以选定一个变量作为加权变量。 在实际问题中,如果无法自行确定权重变量,可以用SPSS的权重估计来实现。第33页,共87页。Descriptives:输出自变量和因变量的均值、标准差相关系数矩阵及单侧检验概率。Estimates:输出与回归系数相关统计量。有:回归系数、回归系数的标准误差、标准回归系数、T统计量和相应的相伴概率、各自变量的容忍度。Confidence intervals:输出每一个非标准化回归系数95%的可信区间。Covariance matix:输出
11、方程中各自变量间的相关系数矩阵及各变量的协方差矩阵。Model fit:输出判定系数、调整的判定系数、回归方程的标准误差,F检验的ANOVA方差分析表。R squared change:当回归方程中引入或剔除一个自变量后,判定系数、F值产生的变化。第34页,共87页。Casewise diagnostics:输出标准化残差绝对值3的样本数据点的相关信息,包括:标准化残差、观测值预测值、最小(最大)预测值、残差、最小(最大)残差以及它们的均值和标准差。 Outliers outside standard devistion:设置奇异值的判据,默认3倍的标准差。 All case:输出所有样本数据
12、有关残差值。Part and partial correlation:输出方程中各自变量与因变量之间的简单相关系数、偏相关系数与部分相关系数。Collinearity diagnostics:多重共线性分析,输出各自变量的容限度、方差膨胀因子、最小容忍度、特征值、条件指标及方差比例等。Durbin-Watson:输出Durbin-watson检验值。第35页,共87页。 Plots对话框用来检验残差序列的正态性、随机性和是否存在异方差现象。Produce all partial plots:输出每一个自变量残差相对于因变量残差的散布图。* ZPRED选项:标准化预测值。* ZRESID选项:标
13、准化残差。* DRESID选项:剔除残差。* ADJPRED选项:修正后预测值。* SRESID选项:t分析残差。* SDRESID选项:t分析剔除残差。第36页,共87页。Mahalanobis:保存Mahalanobis距离Cooks:保存Cook距离Leverage values:保存中心点杠杆值Individual:保存一个观测量上限与下限的预测区间。Studentized:标准化残差Deleted:剔除残差Studentized deleted:标准化剔除残差DfBeta(s):因排除一个特定的观察值所引起的回归系数的变化。若该值2,则被排除的观测值有可能是影响点。DfFit:因排除
14、一个特定的观测值所引起的观测值的变化。第37页,共87页。 Use probalitlity of F:以回归系数显著性检验中各自变量的F统计量的相伴概率作为自变量是否引入模型或者从模型中剔除的标准。实际应用中,应使Entry值小于Remove值,否则,自变量一进入方程就会被立即剔除。 Use F value:以回归系数显著性检验中的各自变量的F统计量作为自变量进入模型或者从模型中剔除的标准。 Include constant in equationF:表示回归方程中将包含常数项。第38页,共87页。第39页,共87页。第40页,共87页。练习,某企业产品广告费和销售收入资料如下,判断广告费和
15、销售收入之间关系密切程度如何?310284066117140404序号广告费(万元)销售收入(百万元)1234567357811131461124569103792549641211691966331416253681100263合计第41页,共87页。多元线性回归分析一个被解释变量(因变量),的线性模型,多个解释变量(自变量)多元回归的种类全部强行进入回归:所有自变量全部进入回归模型逐步回归:所有的自变量依次进入回归模型多元回归方程为第42页,共87页。回归方程的显著性检验多元线性回归的检验与估计二、多元线性回归三、回归系数的显著性检验四、回归分析的置信区间五、标准回归系数回归效果的检验回归
16、系数总体均值方程的检验第43页,共87页。多元回归的SPSS处理第44页,共87页。第45页,共87页。第46页,共87页。按数列中所排列指标的表现形式不同分为:绝对数数列相对数数列平均数数列(平均指标数列)(相对指标数列)时点数列时期数列时间数列分析(总量指标列)第47页,共87页。 时间序列的基本构成要素 年份国内生产总值(亿元)年份国内生产总值(亿元)19971998199920002001200248 19860 79471 17778 97384 40289 6772003 20042005200620072008 99 215 109 655 120 333 135 823 159
17、 878 182 321要素一:时间t要素二:指标数值a第48页,共87页。影响时间数列变动的因素可分解为:(1)长期趋势(T)(2)季节变动(S)(3)循环变动(C) (4)不规则变动(I)可解释的变动不可解释的变动第49页,共87页。长期趋势( )现象在较长时期内受某种根本性因素作用而形成的总的变动趋势季节变动( )现象在一年内随着季节的变化而发生的有规律的周期性变动循环变动( ) 现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动不规则变动( )是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型第50页,共87页。 时间序列的分解分析 (一)时间数列的组
18、合模型1 加法模型:Y=T+S+C+I计量单位相同的总量指标对长期趋势产生的或正或负的偏差2 乘法模型:Y=TSCI计量单位相同的总量指标对原数列指标增加或减少的百分比常用模型第51页,共87页。(二)移动平均法 1、定义:对时间数列的各项数值,按照一定的时距进行逐期移动,计算出一系列序时平均数,形成一个派生的平均数时间数列,以此削弱不规则变动的影响,显示出原数列的长期趋势。2、移动平均法的步骤(1)确定移动时距一般应选择奇数项进行移动平均;若原数列呈周期变动,应选择现象的变动周期作为移动的时距长度。第52页,共87页。(2)计算各移动平均值,并将其编制成时间数列奇数项移动平均:原数列移动平均
19、新数列第53页,共87页。偶数项移动平均:移动平均新数列原数列第54页,共87页。月 份总产值三项移动平均四项移动平均二项移动平均1234567891011112506473542546585547570576569610583615507.00520.33557.67559.33567.33564.33571.67585.00587.33602.67506.75536.50555.00562.00569.50565.50581.25584.50594.25526.63545.75558.50565.75567.50573.38582.88589.38移动平均数计算表 例:第55页,共87页。
20、(三)最小平方法 1、含义:最小平方法是通过时间序列的变动分析,建立定量分析数学模型,配合一条较为理想的趋势线来测定数列变化的趋势。 直线趋势方程:曲线趋势方程:第56页,共87页。(1) 原数列的实际值与趋势值的离差平方和为最小,即(2) 原数列的实际值与趋势值的离差之和等于零,即2、最小平方法配合趋势线时必须满足的两点要求:3、判断趋势类型的方法(1)绘制散点图(2)分析数据特征当数据的一阶差分趋近于一常数时,可以配合直线方程当数据的二阶差分趋近于一常数时,可以配合二次曲线方程当数据的环比发展速度趋近于一常数时,可配合指数曲线方程第57页,共87页。4、直线趋势利用最小平方法配合趋势直线,
21、要求原数列的实际数值与趋势直线上的趋势值的离差平方和为最小,即: 第58页,共87页。将上述两式分别展开并进行整理后,可得到如下标准方程式: 解上述标准方程即可得到的a、b数值 第59页,共87页。【例】已知我国19962008年GDP资料(单位:亿元)如下, 拟合直线趋势方程。年份tGDP (y) tyt219961997199819992000200120022003200420052006200720081234567891011121335 33449 19860 79471 17778 97384 40289 67799 215109 655120 333135 823159 878
22、182 32135 334693961823822847083948655064126277397937209868951203330149405319185362370173149162536496481100121144169合计91127578010894543819第60页,共87页。解:第61页,共87页。求解a、b的简捷方法取时间数列中间项为原点0123-1-2-30 1234567第62页,共87页。当t = 0时,有N为奇数时,令t = ,-3,-2,-1,0,1,2,3, N为偶数时,令t = ,-5,-3,-1,1,3,5, 第63页,共87页。年份ttGDP (y) ty
23、t2199619971998199920002001200220032004200520062007200812345678910111213-6-5-4-3-2-1012345635 33449 19860 79471 17778 97384 40289 67799 215109 655120 333135 823159 878182 321-212004-240990-243176-213531-157946-8440209921521931036099954329279939010939263625169410149162536合计91012757801964083182第64页,共87
24、页。5. 曲线趋势(1)抛物线 抛物线趋势方程为: 采用最小平方法分别对a、b、c求偏导,并进行整理后得如下标准方程组:第65页,共87页。例:某企业2003-2008年工业总产值及有关计算资料如下表所示 年份工业总产值(万元)ytt2 t4tyt2y 200320042005200620072008164017401862200521712359-5-3-113525911925625811181625-8200-5220-1862200565131179541000156601862200519539589751640.151735.891861.632005.372171.112358.
25、85合计117770701414503113904111777.0第66页,共87页。解:第67页,共87页。代入简化后的方程组得: 第68页,共87页。2004年趋势值 将 的各项取值代入上述趋势方程,便可计算出各期趋势值:2003年趋势值:其他年份依次类推。第69页,共87页。指数曲线趋势方程为:(2)指数曲线求解指数曲线方程中 的数值,通常先将指数曲线化为直线,然后再利用最小平方法 将指数曲线趋势方程两边分别求对数得: 设 。则上述方程变化为如下方程:第70页,共87页。采用最小平方法确定的标准方程组如下:解方程组求得 数值后,再查反对数表即可得到 的数值第71页,共87页。例:某厂20
26、03-2008年棉布产量及计算资料如下表所示: 年份棉布产量(万米)20032004200520062007200814.8518.2822.8428.4035.4643.79-5-3-1135259119251.171 71.262 01.358 71.453 31.549 71.641 4-5.858 5-3.786 0-1.358 71.453 34.649 18.207 015.1218.6222.9528.2734.8342.92合计163.620708.436 83.306 2162.71第72页,共87页。将上述资料代入简化后的标准方程组得:8.436 8=6A 3.306 2=
27、70B解得:A=1.406 1,B=0.004 72查反对数表得:则由此而确定的指数曲线趋势方程为:将 的各项取值代入所确定的指数曲线趋势方程,便可得到各期的趋势值:2003年趋势值: 2004年趋势值 其他年份依次类推。第73页,共87页。季节变动的概念和测定(一)季节变动的概念季节变动是指社会经济现象在一定时间长度内由于受自然与社会因素的影响而发生的具有周期性、规律性的重复变动。 (二)季节变动的测定方法 1. 按月(季)平均法1)定义:按月(季)平均法是对原时间序列资料不作处理,直接根据历年的周期数据加以平均(给出的资料是月度资料就按月平均,是季度资料就按季平均),并与总平均数对比,求出
28、有关的季节比率,借以反映现象在各期的变动程度 。第74页,共87页。(3) 若干年内每月(季)的数字总计,求总的月(季)平均数,即:(4) 将若干内同月(季)平均数与总月(季)平均数对比,求各月(季)的季节比率,即:(5) 调整季节比率。计算季节比率时,若是月度资料,各月季节比率之和应等于1200%;若是季度资料,各季季节比率之和应等于400%。若根据时间序列资料计算的结果不等,就应进行调整。 第75页,共87页。2)按月(季)平均法求季节比率的步骤: (1) 分别就每年各月(季)的数字加总,求各该年的月(季)平均数,即:(2) 各年同月(季)数字加总,求若干年内同月(季)的平均数,即: 第7
29、6页,共87页。首先,计算调整系数,公式为: 其次,计算调整后的季节比率,公式为:第77页,共87页。第一年第二年第三年第四年第五年五年合计季平均数季节比率(%)(1)(2)(3)(4)(5)(6)(7)(8)一季度二季度三季度四季度186122032415190819212343251519861834215420981799183720252304196520732414233916979526111391167096251905.22227.82334192590.81106.19111.2591.75四季合计83878764788581318793419608392400.00年平均数
30、2096.721911 971.252 032.752 198.252098例:某旅店客房出租按月平均法测定的季节变动 第78页,共87页。2. 移动平均趋势剔除法1)含义:移动平均趋势剔除法是先对时间序列计算移动平均,剔除长期趋势的影响,再测定季节变动。 2)步骤 (1) 根据各年的月(季)资料(y)采用移动平均法求趋势值(T),月份资料按十二项移动平均,季度资料按四项移动平均;(2) 将实际数y与趋势值T对比,即y/T;(3) 将y/T按月(季)排列,再按月(季)求平均季节比率; (4) 调整季节比率。第79页,共87页。年份季别出租客房数y四个季度移动总数四季的移动平均数趋势值T(1)(
31、2)(3)(4)(5)(6)第一年第二年第三年第四年第五年1234123412341234123418612203241519081921234325141986183421542098179918372025230419652073241423391967838784478587868687648677848880727885788877597965813183678756879187932096.752111.752146.752171.502191.002169.752122.002018.001971.251972.001939.751991.252032.752091.752189.002197.752198.252104.252129.252159.1252181.252180.3752145.87520701994.625
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 盲人推拿培训教程课件
- 电动自行车消防安全培训
- 2024年金川集团广西金川有色金属有限公司技能操作人员社会招聘笔试参考题库附带答案详解
- 储蓄存款基础知识
- 2025-2030年户外运动鞋垫舒适款行业跨境出海战略研究报告
- 2025-2030年口红环保成型工艺行业跨境出海战略研究报告
- 2025-2030年新型餐具材料行业跨境出海战略研究报告
- 2025-2030年推拿手法力度标准化设备行业深度调研及发展战略咨询报告
- 2025-2030年手指灵活度训练器行业跨境出海战略研究报告
- 2025-2030年历史文化遗址缆车行业跨境出海战略研究报告
- SYT 0447-2014《 埋地钢制管道环氧煤沥青防腐层技术标准》
- 【全】小学一年级下册科学教学设计广东版粤教版
- 电梯结构与原理-第2版-全套课件
- 心理学在员工培训与发展中的应用研究
- XX医院按病种付费(DIP)工作实施方案(按病种分值付费(DIP)实施工作流程)
- IEC-62368-1-差异分享解读
- 双溪漂流可行性报告
- 力士乐工程机械液压培训资料(共7篇)课件
- 英语单词词根
- 问题学生转化策略课件
- GMP附录计算机化系统整体及条款解读
评论
0/150
提交评论