拟合优度PPT精品文档_第1页
拟合优度PPT精品文档_第2页
拟合优度PPT精品文档_第3页
拟合优度PPT精品文档_第4页
拟合优度PPT精品文档_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.1拟合优度(或称判定系数、决定系数)n目的:企图构造一个不含单位,可以相互进行比较,而且能直观判断拟合优劣的指标。n拟合优度的定义:n意义:拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。n取值范围:0-1211rssesstssrssesstsstssessrsstsstssr .2拟合优度(或称判定系数、决定系数)n判定系数只是说明列入模型的所有解释变量对应变量的联合的影响程度,不说明模型中单个解释变量的影响程度。n对时间序列数据,判定系数达到0.9以上是很平常的;但是,对截面数据而言,能够有0.5就不错了。.3判定系数达到多少

2、为宜?n没有一个统一的明确界限值;n若建模的目的是预测应变量值,一般需考虑有较高的判定系数。n若建模的目的是结构分析,就不能只追求高的判定系数,而是要得到总体回归系数的可信任的估计量。判定系数高并不一定每个回归系数都可信任;.44.3 判定系数和相关系数的关系:(1)联系n数值上,判定系数等于应变量与解释变量之间简单相关系数的平方:2222222222222222()()()()()iiiiiiiiiiiiiyxx yxryyxyx yrxy.5判定系数和相关系数的关系:(2)区别判定系数相关系数就模型而言就两个变量而言说明解释变量对应变量的解释程度度量两个变量线性依存程度。度量不对称的因果关

3、系度量不含因果关系的对称相关关系取值:0,1取值:1,1.6样本判定系数(样本判定系数(determinants of coefficient)r2随机项随机项的方差的方差2的最小二乘估计量的最小二乘估计量222()11iiiyyessrssrtsstssy2222isn拟合优度评价(或称判定系数、决定系数)(或称判定系数、决定系数).7r2的其他表示方法221121()niiniixry2212211()()()niiinniiiix yrxy2212211()()()niiinniiiiy yryy22121niiniiyry.8相关系数n计算方法与样本判定系数密切相关,就是其平方根,只是

4、符号要小心。n含义有所不同:样本判定系数是判断回归方程与样本观测值拟合优度的一个数量指标,隐含的前提条件是x和y具有因果关系。相关系数是判断两个随机变量线性相关的密切程度,不考虑因果关系。12211niiinniiiix yrxy .9注意英文缩写的含义ntss:total square sum / 总离差平方和nrss:regression square sum / 回归平方和residual square sum / 残差平方和nesserror square sum / 误差平方和(残差平方和)explain square sum / 解释平方和(回归平方和).10假设检验的概念n定义:

5、称对任何一个随机变量未知的分布类型或参数的假设为统计假设,简称假设。检验该假设是否正确称为假设检验。n统计假设,如 h0: p=0.5 (称为原假设) h1: p 0.5 (称为备择假设) .11“小概率原理”在假设检验中的应用n数理统计学中的“小概率原理”认为:概率很小的事件在一次抽样试验中几乎是不可能发生的。n在h0成立的条件下,统计量落在拒绝域为一个小概率事件,因此,在一次抽样试验中,依据小概率原理,是不会发生的。n要是小概率事件(“统计量落在拒绝域” )居然发生了。那么,只能是提出的假设h0发生了错误,所以必须拒绝h0。.12显著性水平n是小概率事件发生的概率; 在假设检验中也称为检验

6、的显著性水平,简称为检验水平。.13假设检验的步骤:nstep1:分析问题,提出原假设和备择假设;nstep2:选择和计算统计量u:在原假设成立时,u的分布已知;含有要检验的参数;各个参数应该都是已知的、可求的。nstep3:构造小概率事件:nstep4:判断小概率事件是否发生:nstep5:下结论:若小概率事件发生,拒绝原假设h0;选择备择假设h1。否则,不拒绝原假设。)|(|2/uup则,没发生。则小概率事件发生。否若,|2/uu .14假设检验的具体操作步骤(以正态总体、已知方差,检验均值u为例)n1、提出零假设 h0: = 0 h1 : 0n3、确定显著水平,如=0.05,查表得相应的

7、临界值/2n4、判断和下结论:若|u| /2 ,拒绝h0;若|u| f (1, n-2),则通过方程显著性检验n若 f f (1, n-2),则未通过方程显著性检验1(2)essfrssn221iessx.20自由度的分解(1)什么是自由度(2)对应于平方和分解的自由度的分解.21( 1 )什么是自由度n模型中样本值可以自由变动的个数,称为自由度n自由度 = 样本个数 样本数据受约束条件(方程)的个数n例如,样本数据个数为n,它们受k个方程的约束(系数矩阵秩为k),那么,自由度df = n-k.22举例:tss、rss、ess的自由度1)2() 1(,220, 0,)()(. 1,1,)(22

8、122122122nndfrsstssessndfyneexyyyrssndfynyyytsseriiiiiitii知再由:约束所以,个个方程对方程求出,共有由而所以一个方程的约束受.23(2) 对应于平方和分解的自由度的分解n tss = ess + rss n-1 1 n-2 总自由度dft 回归自由度dfe 残差自由度dfrn自由度分解:dft= dfe +dfr.24f检验与t检验n在一元线性回归模型中两者是一样的,等价的,因为t(n-2)的平方就是f(1,n-2)。但这种关系仅在一元线性回归是如此!n也就是说在一元线性回归模型中,确实不需要用f检验,但当我们考虑多元回归的时候,f检验

9、就不是t检验可以替代的了。.25六. 模型预测点预测(个值和均值的点预测是一样的)0100xy.26区间估计的概念n所谓区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围。n具体作法是找出两个统计量 1(x1,xn)与2 (x1,xn), 使 p(1 2 )=1-n(1 , 2)称为置信区间, 1-称为置信系数(置信度、置信水平), 称为冒险率(测不准的概率)或者显著水平,一般取5%或1%。.27对区间估计的形象比喻n我们经常说某甲的成绩“大概80分左右”,可以看成一个区间估计。(某甲的成绩为被估计的参数) p(1 2 )=大概的准确程度( 1-) 如:p(75 85 )=95%=1

10、-5%“大概80分左右”犯第一类错误的概率(也叫显著水平 )下限上限置信水平1 .282/2/nxn-x :,置信区间nxnx/2/21-x图示如下.29区间估计的步骤: 1)找一个含有该参数的统计量; 2)构造一个概率为 的事件; 3)通过该事件解出该参数的区间估计.1.30区间预测(均值预测)20021()1()niixxvar ynx01200()()yxtse y000022(),()ytse yytse ye(y|x0)的的置信区间.31均值预测带参见课本p120图6-12 和图上边的那段话!.32区间预测(个值预测)000yy构造22002()10,1ixxnnx则有即00(0,(

11、)nvar000 (2)()yytt nse构造y0的的置信区间000022(),()ytseytse.33个值预测带n个值预测带的区间宽度与均值预测带比较而言是更大的,也就是预测精度更差!.34应变量y区间预测的特点,图示如下y的个别值的置信区间fxy均值的置信区间srfxyx时,置信区间最小当xxf.35扰动项的区间估计n对扰动项的区间估计使用的统计量为:)2(/)2(2222nn.36一元线性回归模型举例n研究我国固定资产投资总额与gdp的关系n第一步:建立模型n第二步:收集数据 采用19801998年的数据,数据来源中国统计年鉴(2000)01ttgdpbb i说明:在理论经济学中说明

12、:在理论经济学中i i表示私人部门投资,在我国的统计体系中,固定资表示私人部门投资,在我国的统计体系中,固定资产投资总额既包括私人部门投资,也包括公共部门(政府)的投资。产投资总额既包括私人部门投资,也包括公共部门(政府)的投资。.37举例n第三步:参数估计(ols),得5 .28737058. 201bb.38举例n第四步:模型检验经济意义检验经济意义检验:b1的经济含义是固定资产投资乘数,肯定大于1,按我国的实际情况,不是很大,估计在4或5以下,通过检验。统计检验统计检验:拟合优度检验、参数估计值显著性检验、模型显著性检验。计量经济检验计量经济检验(异方差、序列资相关、随机解释变量、多重共

13、线性)模型预测检验模型预测检验.39统计检验-拟合优度检验n样本判定系数n线性模型解释了因变量的99.29%,拟合程度很好。%29.992r.40统计检验-参数估计值显著性t检验n提出原假设: 备择假设:n构造统计量 计算得n检验:取 =5%,查表得 拒绝原假设,b1显著不为零01b01b110 (2)( )ebtt ns b6 .48t6 .48110. 2)17(025. 0t.41统计检验-方程显著性f检验n提出原假设: 备择假设:n构造统计量 计算得n检验:取 =5%,查表得 拒绝原假设,b1显著不为零,线性关系显著。可以发现t22362约等于2367f,那是因为计算有误差。否则应该相

14、等的。01b01b/1/(2)essfrssn2367f236745. 4)17, 1 (05. 0f.42预测n点预测 1999年固定资产投资总额29854.7亿元n个值区间预测3 .836547 .298547058. 25 .28730100xbby)89319,79989(0y000022(),()ytseytse.43另外一个实例.44 现欲研究某市城镇现欲研究某市城镇居民居民 1995 年年2002 年人均可支配年人均可支配收入和人均消费性支出收入和人均消费性支出之间的关系。表之间的关系。表 1 给出了某市城镇给出了某市城镇居民居民 1995 年至年至 2002 年期间各年度的年期

15、间各年度的人均可支配收入和人人均可支配收入和人均消费性支出的数据。均消费性支出的数据。 表表 1 某市有关统计资料某市有关统计资料 单位:元单位:元年份年份人均可支配收入人均可支配收入人均消费性支出人均消费性支出1995428342833637363719964839483939193919199751605160418541851998542554254331433119995854585446164616200062806280499849982001685968595359535920027703770360306030.45.46相关关系分类:n 只有两个变量:简单相关;三个及三个以上

16、:多重相关(复相关);n 线性相关、非线性相关;n 正相关、负相关、不相关.47正相关(我国人均消费函数)y为我国人均消费x为我国人均国民收入相关系数:0.982004006008001000120005001000150020002500yx.48负相关y与x的相关系数: -0.9220304050607080010203040yx.49不相关(不排除存在曲线相关)n相关系数为:n4.24e-18-60-40-200204060-60-40-200204060yx.50.51 在本例中,影响在本例中,影响人均消费性支出人均消费性支出的因素,除了的因素,除了居民人均可支配收入居民人均可支配收入

17、之外,还可能有消费品的价格之外,还可能有消费品的价格水平、水平、银行存款利率、银行存款利率、消费者的偏好,政府的政策,消费者的偏好,政府的政策,需求者对未来的预期等等多种因素。我们这里仅分需求者对未来的预期等等多种因素。我们这里仅分析析居民人均可支配收入居民人均可支配收入对对人均消费性支出人均消费性支出的影响,的影响,其他各因素的影响,就被包含在随机误差项中。其他各因素的影响,就被包含在随机误差项中。.52.53.54.55 离差形式的中间计算也可不用计算表,而采用如下离差形式的中间计算也可不用计算表,而采用如下的简捷式计算:的简捷式计算:222xnxxii222ynyyii yxnyxyxiiii 式中,式中,nyynxxyyyxxxiiiiii,,n 为样本容量。为样本容量。.56习习题题的的书书写写格格式式: iiixy10 (i=1,2,n) 8662.5257083. 08751239.96198658.91021xyxyxiii iiixxy7083. 08662.52510统统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论