第8章 回归分析ppt课件_第1页
第8章 回归分析ppt课件_第2页
第8章 回归分析ppt课件_第3页
第8章 回归分析ppt课件_第4页
第8章 回归分析ppt课件_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS 19(中文版)统计分析实用教程 电子工业出版社1第八章回归分析SPSS 19(中文版)统计分析实用教程 电子工业出版社2主要内容主要内容8.1 回归分析概述回归分析概述8.2 线性回归分析线性回归分析8.3 曲线估计曲线估计8.4 二元二元Logistic回归分析回归分析SPSS 19(中文版)统计分析实用教程 电子工业出版社38.1 回归分析概述回归分析概述1 1确定性关系与非确定性关系确定性关系与非确定性关系 变量与变量之间的关系分为确定性关系和非变量与变量之间的关系分为确定性关系和非确定性关系,函数表达确定性关系。研讨变量间的非确定性关系,函数表达确定性关系。研讨变量间的非确定

2、性关系,构造变量间阅历公式的数理统计方法称确定性关系,构造变量间阅历公式的数理统计方法称为回归分析。为回归分析。2 2回归分析根本概念回归分析根本概念 回归分析是指经过提供变量之间的数学表达回归分析是指经过提供变量之间的数学表达式来定量描画变量间相关关系的数学过程,这一数学式来定量描画变量间相关关系的数学过程,这一数学表达式通常称为阅历公式。我们不仅可以利用概率统表达式通常称为阅历公式。我们不仅可以利用概率统计知识,对这个阅历公式的有效性进展断定,同时还计知识,对这个阅历公式的有效性进展断定,同时还可以利用这个阅历公式,根据自变量的取值预测因变可以利用这个阅历公式,根据自变量的取值预测因变量的

3、取值。假设是多个要素作为自变量的时候,还可量的取值。假设是多个要素作为自变量的时候,还可以经过要素分析,找出哪些自变量对因变量的影响是以经过要素分析,找出哪些自变量对因变量的影响是显著的,哪些是不显著的。显著的,哪些是不显著的。SPSS 19(中文版)统计分析实用教程 电子工业出版社43 3回归分析的普通步骤回归分析的普通步骤第第1 1步步 确定回归方程中的因变量和自变量。确定回归方程中的因变量和自变量。第第2 2步步 确定回归模型。确定回归模型。第第3 3步步 建立回归方程。建立回归方程。第第4 4步步 对回归方程进展各种检验。对回归方程进展各种检验。拟合优度检验拟合优度检验回归方程的显著性

4、检验回归方程的显著性检验回归系数的显著性检验回归系数的显著性检验第第5 5步步 利用回归方程进展预测。利用回归方程进展预测。8.1 回归分析概述回归分析概述SPSS 19(中文版)统计分析实用教程 电子工业出版社5主要内容主要内容8.1 回归分析概述回归分析概述8.2 线性回归分析线性回归分析8.3 曲线估计曲线估计8.4 二元二元Logistic回归分析回归分析SPSS 19(中文版)统计分析实用教程 电子工业出版社68.2线性回归分析线性回归分析8.2.1 根本概念及统计原理根本概念及统计原理1.根本概念根本概念 线性回归假设因变量与自变量之间为线性线性回归假设因变量与自变量之间为线性关系

5、,用一定的线性回归模型来拟合因变量和关系,用一定的线性回归模型来拟合因变量和自变量的数据,并经过确定模型参数来得到回自变量的数据,并经过确定模型参数来得到回归方程。根据自变量的多少,线性回归可有不归方程。根据自变量的多少,线性回归可有不同的划分。当自变量只需一个时,称为一元线同的划分。当自变量只需一个时,称为一元线性回归,当自变量有多个时,称为多元线性回性回归,当自变量有多个时,称为多元线性回归。归。SPSS 19(中文版)统计分析实用教程 电子工业出版社78.2线性回归分析线性回归分析(2) (2) 统计原理统计原理 一元回归方程和多元回归方程一元回归方程和多元回归方程01( )E yx一元

6、线性和多元线性回归分析的中心义务就是估计其中的参数。01 122( )ppE yxxxSPSS 19(中文版)统计分析实用教程 电子工业出版社88.2线性回归分析线性回归分析8.2.2 SPSS实例分析实例分析【例【例8-1】现有】现有1992年年-2019年国家财政收入和年国家财政收入和国内消费总值的数据如下表所示,请研讨国家国内消费总值的数据如下表所示,请研讨国家财政收入和国内消费总值之间的线性关系。财政收入和国内消费总值之间的线性关系。年份国内生产总值(单位:亿元)财政收入(单位:亿元)年份国内生产总值(单位:亿元)财政收入(单位:亿元)199226923.53483.372000992

7、14.613395.23199335333.94348.952019109655.216386.04199448197.95218.102019120332.718903.64201960793.76242.202019135822.821715.25201971176.67407.992019159878.326396.47201978973.08651.142019183867.931649.29201984402.39875.952019210871.038760.20201989677.111444.08SPSS 19(中文版)统计分析实用教程 电子工业出版社98.2 线性回归分析线性

8、回归分析第第1步步 分析:这是一个因变量和一个自变量之间的问题,故应分析:这是一个因变量和一个自变量之间的问题,故应该思索用一元线性回归处理。该思索用一元线性回归处理。第第2步步 数据组织:定义三个变量,分别为数据组织:定义三个变量,分别为“year年份、年份、“x国内消费总值、国内消费总值、“y财政收入。财政收入。第第3步步 作散点图,察看两个变量的相关性:依次选择菜单作散点图,察看两个变量的相关性:依次选择菜单“图图形形旧对话框旧对话框散点散点/点状点状简单分布,并将简单分布,并将“国内消费总值国内消费总值作为作为x轴,轴,“财政收入作为财政收入作为y轴,得到如下所示图形。轴,得到如下所示

9、图形。可以看出两变量具有较强可以看出两变量具有较强的线性关系,可以用一元的线性关系,可以用一元线性回归来拟合两变量。线性回归来拟合两变量。SPSS 19(中文版)统计分析实用教程 电子工业出版社108.2 线性回归分析线性回归分析第第4步步 一元线性回归分析设置:一元线性回归分析设置:选择菜单选择菜单“分析分析回归回归线性,翻开线性,翻开“线性回归对话框,线性回归对话框,将变量将变量“财政收入作为因变量财政收入作为因变量 ,“国内消费总值作为自变国内消费总值作为自变量。量。翻开翻开“统计量对话框,选上统计量对话框,选上“估计和估计和“模型拟合度。模型拟合度。单击单击“绘制绘制T按钮,翻开按钮,

10、翻开“线性回归:图对话框,线性回归:图对话框,选用选用DEPENDENT作为作为y轴,轴,*ZPRED为为x轴作图。并且选择轴作图。并且选择“直方图和直方图和“正态概率图正态概率图 作相应的保管选项设置,如预测值、残差和间隔作相应的保管选项设置,如预测值、残差和间隔 等。等。SPSS 19(中文版)统计分析实用教程 电子工业出版社118.2 线性回归分析线性回归分析第第5步步 主要结果及分析:主要结果及分析:变量输入和移去表变量输入和移去表表中显示回归模型编号、进入模型的变量、移出模型的变量和变量的挑选方法。可以看出,进入模型的自变量为“国内消费总值 。 模型综述表 R=0.989,阐明自变量

11、与因变量之间的相关性很强。R方(R2) =0.979,阐明自变量“国内消费总值可以解释因变量“财政收入的97.9%的差别性。 模型输入的变量移去的变量方法1国内生产总值.输入a. 已输入所有请求的变量。 b. 因变量: 财政收入。模型RR 方调整 R 方 标准估计的误差1.989a.979.9771621.66312a. 预测变量:(常量),国内生产总值。b. 因变量:财政收入。SPSS 19(中文版)统计分析实用教程 电子工业出版社128.2 线性回归分析线性回归分析方差分析表表中显示因变量的方差来源、方差平方和、自在度、均方、F检验统计量的观测值和显著性程度。方差来源有回归、残差。从表中可

12、以看出,F统计量的观测值为592.25,显著性概率为0.000,即检验假设“H0:回归系数B = 0成立的概率为0.000,从而应回绝原假设,阐明因变量和自变量的线性关系是非常显著的,可建立线性模型。模型平方和df均方FSig.1回归1.557E911.557E9 592.250残差34187286.770132629791.290总计1.592E914a. 预测变量:(常量),国内生产总值。b. 因变量:财政收入。SPSS 19(中文版)统计分析实用教程 电子工业出版社138.2 线性回归分析线性回归分析回归系数表表中显示回归模型的常数项、非规范化的回归系数B值及其规范误差、规范化的回归系数

13、值、统计量t值以及显著性程度Sig.。从表中可看出,回归模型的常数项为-4993.281,自变量“国内消费总值的回归系数为0.197。因此,可以得出回归方程:财政收入=-4993.281 + 0.197 国内消费总值。模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-4993.281919.356-5.431.000国内生产总值.197.008.98924.336.000回归系数的显著性程度为0.000,明显小于0.05,故应回绝T检验的原假设,这也阐明了回归系数的显著性,阐明建立线性模型是恰当的。SPSS 19(中文版)统计分析实用教程 电子工业出版社14主要内容主要内容8.1

14、回归分析概述回归分析概述8.2 线性回归分析线性回归分析8.3 曲线估计曲线估计8.4 二元二元Logistic回归分析回归分析SPSS 19(中文版)统计分析实用教程 电子工业出版社158.3 曲线估计曲线估计8.3.1 根本概念及统计原理根本概念及统计原理(1) 根本概念根本概念 曲线估计曲线拟合、曲线回归那么是研曲线估计曲线拟合、曲线回归那么是研讨两变量间非线性关系的一种方法,选定一种讨两变量间非线性关系的一种方法,选定一种用方程表达的曲线,使得实践数据与实际数据用方程表达的曲线,使得实践数据与实际数据之间的差别尽能够地小。假设曲线选择得好,之间的差别尽能够地小。假设曲线选择得好,那么可

15、以提示因变量与自变量的内在关系,并那么可以提示因变量与自变量的内在关系,并对因变量的预测有一定的意义。对因变量的预测有一定的意义。 在曲线估计中,需求处理两个问题:一是选在曲线估计中,需求处理两个问题:一是选用哪种实际模型,即用哪种方程来拟合观测值用哪种实际模型,即用哪种方程来拟合观测值;二是当模型确定后,如何选择适宜的参数,;二是当模型确定后,如何选择适宜的参数,使得实际数据和实践数据的差别最小。使得实际数据和实践数据的差别最小。SPSS 19(中文版)统计分析实用教程 电子工业出版社168.3 曲线估计曲线估计(2) 统计原理 在曲线估计中,有很多的数学模型,选用哪一种方式的回归方程才干最

16、好地表示出一种曲线的关系往往不是一个简单的问题,可以用数学方程来表示的各种曲线的数目几乎是没有限量的。在能够的方程之间,以吻合度而论,也许存在着许多吻合得同样好的曲线方程。因此,在对曲线的方式的选择上,对采取什么方式需求有一定的实际,这些实际是由问题本质决议的。(3) 分析步骤首先,在不能明确终究哪种模型更接近样本数据时,可在上述多种可选择的模型中选择几种模型;其次,SPSS自动完成模型参数的估计,并输出回归方程显著性检验的F值和概率p值、决议系数R2等统计量;最后,以断定系数为主要根据选择其中的最优模型,并进展预测分析等。SPSS 19(中文版)统计分析实用教程 电子工业出版社178.3 曲

17、线估计曲线估计8.3.2 SPSS实例分析实例分析【例【例8-3】 表表8.16是是19892019年国家保费收入与年国家保费收入与国内消费总值的数据,试研讨保费收入与国内消费国内消费总值的数据,试研讨保费收入与国内消费总值的关系。总值的关系。年度保费收入国民生产总值年度保费收入国民生产总值19804.64517.81991239.721662.519817.84860.3199237826651.9198210.35301.8199352534560.5198313.25957.41994630466701984207206.7201968357494.9198533.18989.12019

18、77666850.5198645.810201.42019108073142.7198771.0411954.520191247.376967.21988109.514922.320191393.2280579.41989142.616917.820001595.988228.11990178.518598.420192109.3694346.4SPSS 19(中文版)统计分析实用教程 电子工业出版社188.3 曲线估计曲线估计第第1步步 分析:先用散点图的方式进展分析,看终究能否具有一分析:先用散点图的方式进展分析,看终究能否具有一元线性关系,假设具有一元线性关系,那么用一元线性回归分元线性

19、关系,假设具有一元线性关系,那么用一元线性回归分析,否那么采用曲线估计求解。析,否那么采用曲线估计求解。第第2步步 数据组织:定义为三个变量,分别是数据组织:定义为三个变量,分别是“year年度、年度、“y保费收入和保费收入和“x国内消费总值,输入数据并保管国内消费总值,输入数据并保管。第第3步步 作散点图初步断定变量的分布趋势:作散点图初步断定变量的分布趋势:保费收入y随国内消费总值x的提高而逐渐提高,而且当国内消费总值到达一定程度后,保费收入的增幅更加明显。因此用线性回归模型表示x,y的关系是不恰当的。于是应找拟合效果好的模型。SPSS 19(中文版)统计分析实用教程 电子工业出版社198

20、.3 曲线估计曲线估计第第4步步 进展曲线估计:依次选择菜单进展曲线估计:依次选择菜单“分析分析回归回归曲线估计曲线估计,将一切模型全部选上,看哪种模型拟合效果更好,将一切模型全部选上,看哪种模型拟合效果更好(主要看决主要看决议系数议系数R2),其一切模型的拟合优度,其一切模型的拟合优度R2如下表所示。如下表所示。模型名称R Square(R2)直线(Linear)0.941二次曲线(Quadratic)0.973复合曲线(Compound)0.789生长曲线(Growth)0.789对数曲线(Logarithmic)0.772三次曲线(Cubic)0.990S曲线(S)0.946指数曲线(E

21、xponential)0.789逆函数(Inverse)0.481幂函数(Power)0.972逻辑函数(Logistic)0.789从决议系数R方即R2来看,三次曲线效果最好由于其R2值最大,并且方差分析的显著性程度Sig.为0。故重新进展上面的过程,只选“三次曲线Cubic一种模型。 SPSS 19(中文版)统计分析实用教程 电子工业出版社208.3 曲线估计曲线估计第第5步步 结果与分析。结果与分析。三次曲线模型拟合效果的检验表三次曲线模型拟合效果的检验表复相关系数R = 0.995,R2 = 0.990,经校正后的R平方值为0.989。故可判别保费收入与国内消费总值之间有较显著的三次曲

22、线关系 方差分析表 相伴概率Sig.=0.000阐明模型具有显著的统计学意义。 RR方调整R方估计值的标准误.995.990.98964.883自变量为 国内生产总值。平方和df均方FSig.回归7800612.55932600204.186 617.659.000残差75775.960184209.776总计7876388.51821自变量为 国内生产总值。SPSS 19(中文版)统计分析实用教程 电子工业出版社218.3 曲线估计曲线估计回归系数表从表中可知因变量与自变量的三次回归模型为:y=-166.430+0.029x-5.364E-7x2+5.022E-12x3未标准化系数标准化系数

23、tSig.B标准误Beta内民生产总值.029.0051.5065.836.000国内生产总值 * 2-5.364E-7.000-2.554-4.277.000国内生产总值 * 35.022E-12.0002.093.(常数)-166.43045.399-3.666.002SPSS 19(中文版)统计分析实用教程 电子工业出版社229.2 曲线估计曲线估计拟合效果图从图形上看出其拟合效果非常好。SPSS 19(中文版)统计分析实用教程 电子工业出版社238.3 曲线估计曲线估计SPSS 19(中文版)统计分析实用教程 电子工业出版社24主要内容主要内容8.1 回归分析概述回归分析概述8.2 线

24、性回归分析线性回归分析8.3 曲线估计曲线估计8.4 二元二元Logistic回归分析回归分析SPSS 19(中文版)统计分析实用教程 电子工业出版社258.4.1 根本概念及统计原理根本概念及统计原理1根本概念根本概念 Logistic回归分析就是针对因变量是定回归分析就是针对因变量是定性变量的回归分析。根据因变量取值类别数性变量的回归分析。根据因变量取值类别数量不同,量不同,Logistic回归分析又分为二元回归分析又分为二元Logistic回归分析和多元回归分析和多元Logistic回归分析。回归分析。二元二元Logistic回归模型中因变量只可以取两回归模型中因变量只可以取两个值个值1

25、和和0虚拟因变量,而多元虚拟因变量,而多元Logistic回归模型中因变量可取多个值。回归模型中因变量可取多个值。8.4 二元二元Logistic回归分析回归分析SPSS 19(中文版)统计分析实用教程 电子工业出版社262统计原理统计原理logit变换变换 8.4 二元二元Logistic回归分析回归分析Logistic回归模型logit( )ln(/1)ppp12ln(,)1kpg xxxpLogistic回归模型01 1ln1kkpxxp01 101 1exp()1exp()kkkkxxpxxSPSS 19(中文版)统计分析实用教程 电子工业出版社273统计检验统计检验 与线性回归一样,

26、拟合时也要思索模型能否适宜与线性回归一样,拟合时也要思索模型能否适宜、哪些变量该保管、拟合效果如何等问题。线性回、哪些变量该保管、拟合效果如何等问题。线性回归中常用的是决议系数归中常用的是决议系数R2,T检验、检验、F检验等工具在检验等工具在这里均不再适用。在这里均不再适用。在Logistic回归中常用的检验有回归中常用的检验有-2对数似然检验对数似然检验-2 loglikelihood, -2LL、Hosmer和和Lemeshow的拟合优度检验、的拟合优度检验、Wald检验检验等。等。 8.4 二元二元Logistic回归分析回归分析SPSS 19(中文版)统计分析实用教程 电子工业出版社2

27、88.4.2 SPSS实例分析实例分析【例【例8-4】 诊断发现运营不良的金融企业是诊断发现运营不良的金融企业是审计核对的一项重要功能,审计核对的分类审计核对的一项重要功能,审计核对的分类失败会导致灾难性的后果。下表列出了失败会导致灾难性的后果。下表列出了66家家公司的部分运营财务比率,其中公司的部分运营财务比率,其中33家在家在2年后年后破产破产Y = 0,另外,另外33家在同期坚持偿付才家在同期坚持偿付才干干Y = 1。请用变量。请用变量X1未分配利润未分配利润/总总资产、资产、X2税前利润税前利润/总资产和总资产和X3销销售额售额/总资产拟合一个总资产拟合一个Logistic回归模型。回

28、归模型。 8.4 二元二元Logistic回归分析回归分析X1X2X3YX1X2X3YX1X2X3YX1X2X3Y-62.8-89.51.704316.41.31-27.96.31.3031.415.71.913.3-3.51.1047161.91-48.26.81.6021.5-14.411-120.8-103.22.50-3.342.71-49.2-17.20.308.55.81.51-18.1-28.81.103520.81.91-19.2-36.70.8040.65.81.81-3.8-50.60.9046.712.60.91-18.1-6.50.9034.626.41.81-61.2

29、-56.21.7020.812.52.41-98-20.81.7019.926.72.31-20.3-17.4103323.61.51-129-14.21.3017.412.61.31-194.5-25.80.5026.110.42.11-4-15.82.1054.714.61.7120.8-4.31068.613.81.61-8.7-36.32.8053.520.61.11-106.1-22.91.5037.333.43.51-59.2-12.82.1035.926.421-39.4-35.71.205923.15.51-13.1-17.60.9039.430.51.91-164.1-17.

30、71.3049.623.81.91-381.61.2053.17.11.91-308.9-65.80.8012.571.81-57.90.70.8039.813.81.217.2-22.62037.334.11.51-8.8-9.10.9059.5721-118.3-34.21.5035.34.20.91-64.7-40.1016.320.411-185.9-2806.7049.525.12.61-11.44.80.90-34.6-19.43.4018.113.54121.7-7.81.61SPSS 19(中文版)统计分析实用教程 电子工业出版社29第第1 1步步 分析:共有分析:共有3 3个

31、自变量,均是定量数据类型,而因变个自变量,均是定量数据类型,而因变量是定性的,取值有两种形状量是定性的,取值有两种形状0 0和和1 1,这是一个典型的可,这是一个典型的可用二元用二元LogisticLogistic回归处理的问题。回归处理的问题。 第第2 2步步 数据组织:定义三个自变量数据组织:定义三个自变量X1X1,X2X2和和X3X3,再定义因变,再定义因变量量Y Y,输入数据并保管。,输入数据并保管。 第第3 3步步 二元二元LogisticLogistic回归分析设置:回归分析设置: 设置过程详见教材设置过程详见教材p195-197p195-197 第第4 4步步 主要结果及分析:主

32、要结果及分析:数据的根本信息表数据的根本信息表8.4 二元二元Logistic回归分析回归分析未加权的案例aN百分比选定案例包括在分析中66100.0缺失案例0.0总计66100.0未选定的案例0.0总计66100.0a. 如果权重有效,请参见分类表以获得案例总数。给出了数据进入模型的记录数 SPSS 19(中文版)统计分析实用教程 电子工业出版社30模型系数的检验结果模型系数的检验结果8.4 二元二元Logistic回归分析回归分析其中常数项系数为0.000,其相伴概率为1,可见常数项不显著。X1,X2和X3的相伴概率分别是0.000,0.000和0.094,假设以5%为置信的话,X1和X2的系数经过了检验,即这两个变量是显著的。BS.E,WalsdfSig.Exp (B)步骤 0常量.000.246.00011.0001.000得分dfSig.步骤 0变量X131.6211.000X219.3581.000X32.8001.094总统计量37.6133.000SPSS 19(中文版)统计分析实用教程 电子工业出版社31模型全局检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论