版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§2.3一元线性回归模型的统计检验
回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本问归线代
替总体回归线。尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均
值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。那么,在一
次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。
主要包括拟合优度检验、变量的显著性检验及参数的区间估计。
一、拟合优度检验
拟合优度检验,顾名思义,是检验模型对样本观测值的拟合程度。检验的方法,是构
造一个可以表征拟合程度的指标,在这里称为统计量,统计量是样本的函数。从检验对象中
计算出该统计量的数值,然后与某一标准进行比较,得出检验结论。有人也许会问,采用普
通最小二乘估计方法,已经保证了模型最好地拟合了样在观测值,为什么还要检验拟合程度?
问题在于,在一个特定的条件下做得最好的并不一定就巨高质量的。普通最小二乘法所保证
的最好拟合,是同一个问题内部的比较,拟合优度检验结果所表示优劣是不同问题之间的比
较。例如图2.3.1和图2.3.2中的直线方程都是由散点表示的样本观测值的最小二乘估计结果,
对于每个问题它们都满足残差的平方和最小,但是二者对样本观测值的拟合程度显然是不同
的。
1、总离差平方和的分解
已知由一组样本观测值(X,,匕),z=l,2-,n得到如下样本回归直线
/=一+/因
而y的第,个观测值与样本均值的离差=(匕-『)可分解为两部分之和:
yi=Yi-Y=(Yi-Yi^ai-Y)=ei^-yi(231)
图233示出了这种分解,其中,少=(/一产)是样本回归直线理论值(回归拟合道)与
观测值匕的平均值之差,可认为是由回归直线解释的部分;生二(匕一R)是实际观测值与
【可归拟合值之差,是回归直线不能解释的部分。显然,如果匕落在样本回归线上,则丫的
第i个观测值与样本均值的离差,全部来自样本回归拟合值与样本均值的离差,即完全可由
样本回归线解释。表明在该点处实现完全拟合。
图2.3.3
对于所有样本点,则需考虑这些点与样本均值离差的平方和。由于
Zy;=Z%+Z片+2^
可以证明2少,=0,所以有
(232)
记(X—P)2=75S,称为总离差平方和(TotalSumofSquares),反映样本
观测值总体离差的大小;=工(/-Y)2=ESS,称为回归平方和(ExplainedSumof
Squares),反映由模型中解释变量所解释的那部分离差的大小;
=Z(匕—g)2=RSS,称为残差平方和(ResidualSumofSquares)>反映样本观
测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。
(2.3.2)表明y的观测值围绕其均值的总离差平方和可分解为两部分,一部分来自回归
线,另一部分则来自随机势力。因此,可用来自回归线的回归平方和占Y的总离差的平方
和的比例来判断样本回归线与样本观测值的拟合优度。
读者也许会问,既然RSS反映样本观测值与估计值偏离的大小,可否直接用它作为拟
合优度检验的统计量?这里提出了一个普遍的问题,即作为检验统计量的一般应该是相对量,
而不能用绝对最。因为用绝对量作为检验统计量,无法设置标准。在这里,RSS,即残差
平方和,与样本容量关系根大,当n比较小时,它的值也较小,但不能因此而判断模型的拟
合优度就好。
2、可决系数R?统计量
根据上述关系,可以用
2ESS,RSS
=-----=1--------(2.3.3)
TSS
检验模型的拟合优度,称改为可决系数(coefficientofdetemiination)。显然,在总离差平
方和中,回归平方和所占的比重越大,残差平方和所占的比重越小,则回归直线与样本点拟
合得越好。如果模型与样本观测值完全拟合,则有当然,模型与样本观测值完全
拟合的情况是不可能发生的,我不可能等于lo但亳无疑问的是该统计量越接近于1,模型
的拟合优度越高。
在实际计算可决系数时,在次已经估计出后,一个较为简单的计算公式为:
这里用到了样本回归函数的离差形式来计算回归平方和:
ESS=£%=£(及
在例2.L1的收入-消费支出例中,
说明在线性回归模型中,家庭消费支出总变差(variation)中,由家庭可支配收入的变差解
释的部分占97.66%,模型的拟合优度较高。
由(2.3.3)知,可决系数的取值范围为是一个非负的统计量。它也是随着
抽样的不问而不问,即是随抽样而变动的统计量。为此,对可决系数的统计可靠性也应进行
检验,这将在第3章中进行。
二、变量的显著性检验
变量的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系是否显著成
立作出推断,或者说考察所选择的解释变量是否对被解释变量有显著的线性影响。
从上面的拟合优度检捡中可以看出,拟合优度高,则解释变量对被解释变量的解释程度
就高,线性影响就强,可以推测模型线性关系成立;反之,就不成立。但这只是一个模糊的
推测,不能给出一个统计上的严格的结论。因此,还必须进行变量的显著性检验。变量的显
著性检验所应用的方法是数理统计学中假设检验。
1、假设检验
假设检验是统计推断的一个主要内容,它的基本任务是根据样本所提供的信息,对未
知总体分布的某些方面的假设作出合理的判断。
假设检验的程序是,先根据实际问题的要求提出一个论断,称为统计假设,记为H();
然后根据样本的有关信息,对”。的真伪进行判断,作出拒绝H。或接受“°的决策。
布是双尾分布,所以按照a/2查Z分布表中的临界值。亍是
1|>与(-2)
(这里的/已不同于(2.3.5)式,其中4=0)为原假设"o下的一个小概率事件。在参数估
计完成后,可以很容易计算,的数值。如果发生了|/|>乙(〃-2),则在(1一夕)的置信度下
拒绝原假设“。,即变量X是显著的,通过变量显著性检验。如果未发生|,|>乙(〃-2),
2
则在(1一。)置信度下接受原假设“。,即变量X是不显著的,未通过变量显著性检验。
对于一元线性回归方程中的A,可构造如下t统计量进行显著性检验:
瓦-=A一仇
(2.3.6)
轲S禽
同样地,该统计量服从自由度为(〃-2)的/分布,检验的原假设一般仍为为二0。
在例2.1.1及例2.2.1的收入-消费支出例中,首先计算b?的估计值
2
-2厌ZX4590020-0.777x74250(H).n.
(7=-------=----------------------------=-----------------------------------------------=134UZ
n-2n-210-2
于是瓦和A的标准差的估计值分别是:
S4=犷/£.=713402/7425000=Vo.0018=0.0425
S%=713402x53650000710x7425000=98.41
t统计量的计算结果分别为:
4=8\闻、=0.777/0.0425=18.29
t0=瓦做=-103.17/98.41=-1.048
给定一个显著性水平a=0.05,杳/分布表中自由度为8(在这个例中(〃-2)=8)、a=0.05
的临界值,得到/8)=2.306。可见闻》〃(〃—2),说明解释变量家庭可支配收入在95%
2
的置信度下显著,即通过了变量显著性检验。但Ko|<,aS—2),表明在95%的置信度下,无
2
法拒绝截距项为零的假设,
三、参数的置信区间
假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(最常用的假设为
总体参数值为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多
“近,要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往
需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)
包含着真实的参数值。这种方法就是参数检验的置信区间估计。
要判断估计的参数值A离真实的参数值四有多“近”,可预先选择一个概率
tz(O<a<\),并求一个正数3,使得随机区间(randominterval)(区—5,R+3)包含
参数g的真值的概率为1-a。即:
-建力<2+6)=1-二
如果存在这样一个区间,称之为置信区间(confidenceinterval);l-a称为置信系数(置
信度)(confidencecoefficient),a称为显著性水平(levelofsignificance);置信区间的端点
称为置信限(confidencelimit)或临界值(criticalvalues)•
在变量的显著性检验中已经知道:
P.-P.
t=----t-(n--2)z=O,l
4
这就是说,如果给定置信度从/分布表中查得自由度为5-2)的临界值Q,那么
2
,值处在(一的概率是(1一々)。表示为:
P{-ta<t<t^=\-a
即
P(—L=
4
24一Lx%<,«<4+七x,9)=1-a
2Pt2M
于是得到(1-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专业业务合同书
- 公司租房合同模板
- 广州房屋买卖合同样本
- 2024年生猪养殖场开发承包合同3篇
- 2024-2030年超速高速离心机公司技术改造及扩产项目可行性研究报告
- 2024-2030年电力环保公司技术改造及扩产项目可行性研究报告
- 2024-2030年氧化剂搬迁改造项目可行性研究报告
- 2024年汽车租赁与矿山物资运输服务合同3篇
- 2024外墙保温材料研发、采购、施工及售后合同3篇
- 2024年度桥梁建设项目质量监督检验合同3篇
- 电梯日(日管控、周排查、月调度检查表格)
- 教科版小学二年级上册科学期末测试卷附参考答案(满分必刷)
- 运动生物力学智慧树知到期末考试答案章节答案2024年山东体育学院
- MOOC 油气地质与勘探-中国石油大学(华东) 中国大学慕课答案
- 包茎环切手术后的护理
- 形势与政策智慧树知到期末考试答案2024年
- 医疗器械售后服务能力证明资料模板
- MOOC 国际贸易实务-上海对外经贸大学 中国大学慕课答案
- 《混凝土粘度改性剂》
- 2024年中国人保招聘笔试参考题库附带答案详解
- YYT 1849-2022 重组胶原蛋白
评论
0/150
提交评论