版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.3 一元线性回归模型统计检验 回归分析是要通过样本所可能参数来代替总体真实参数,或者讲是用样本回归线代替总体回归线。尽管从统计性质上已知,假如有足够多重复抽样,参数可能值期望(均值)就等于其总体参数真值,但在一次抽样中,可能值不一定就等于该真值。那么,在一次抽样中,参数可能值与真值差异有多大,是否显著,这就需要进一步进行统计检验。要紧包括拟合优度检验、变量显著性检验及参数区间可能。 一、拟合优度检验拟合优度检验,顾名思义,是检验模型对样本观测值拟合程度。检验方法,是构造一个能够表征拟合程度指标,在那个地点称为统计量,统计量是样本函数。从检验对象中计算出该统计量数值,然后与某一标准进行比较,
2、得出检验结论。有人也许会问,采纳一般最小二乘可能方法,差不多保证了模型最好地拟合了样本观测值,什么缘故还要检验拟合程度?问题在于,在一个特定条件下做得最好并不一定确实是高质量。一般最小二乘法所保证最好拟合,是同一个问题内部比较,拟合优度检验结果所表示优劣是不同问题之间比较。例如图2.3.1和图2.3.2中直线方程差不多上由散点表示样本观测值最小二乘可能结果,关于每个问题它们都满足残差平方和最小,然而二者对样本观测值拟合程度显然是不同。 图2.3.1 图2.3.2 1、总离差平方和分解已知由一组样本观测值,=1,2,n得到如下样本回归直线而第个观测值与样本均值离差可分解为两部分之和: (2.3.
3、1)图2.3.3示出了这种分解,其中,是样本回归直线理论值(回归拟合值)与观测值平均值之差,可认为是由回归直线解释部分;是实际观测值与回归拟合值之差,是回归直线不能解释部分。显然,假如落在样本回归线上,则第个观测值与样本均值离差,全部来自样本回归拟合值与样本均值离差,即完全可由样本回归线解释。表明在该点处实现完全拟合。 Y =来自残差 SRF =总离差 =来自回归 X图2.3.3关于所有样本点,则需考虑这些点与样本均值离差平方和。由于 能够证明,因此有 (2.3.2)记,称为总离差平方和(Total Sum of Squares),反映样本观测值总体离差大小;,称为回归平方和(Explaine
4、d Sum of Squares),反映由模型中解释变量所解释那部分离差大小;,称为残差平方和(Residual Sum of Squares),反映样本观测值与可能值偏离大小,也是模型中解释变量未解释那部分离差大小。 (2.3.2)表明观测值围绕其均值总离差平方和可分解为两部分,一部分来自回归线,另一部分则来自随机势力。因此,可用来自回归线回归平方和占Y总离差平方和比例来推断样本回归线与样本观测值拟合优度。 读者也许会问,既然反映样本观测值与可能值偏离大小,可否直接用它作为拟合优度检验统计量?那个地点提出了一个普遍问题,即作为检验统计量一般应该是相对量,而不能用绝对量。因为用绝对量作为检验统
5、计量,无法设置标准。在那个地点,即残差平方和,与样本容量关系专门大,当n比较小时,它值也较小,但不能因此而推断模型拟合优度就好。 2、可决系数统计量 依照上述关系,能够用 (2.3.3)检验模型拟合优度,称为可决系数(coefficient of determination)。显然,在总离差平方和中,回归平方和所占比重越大,残差平方和所占比重越小,则回归直线与样本点拟合得越好。假如模型与样本观测值完全拟合,则有。因此,模型与样本观测值完全拟合情况是不可能发生,不可能等于1。但毫无疑问是该统计量越接近于1,模型拟合优度越高。在实际计算可决系数时,在差不多可能出后,一个较为简单计算公式为: (2.
6、3.4)那个地点用到了样本回归函数离差形式来计算回归平方和: 。在例2.1.1收入-消费支出例中, 讲明在线性回归模型中,家庭消费支出总变差(variation)中,由家庭可支配收入变差解释部分占97.66%,模型拟合优度较高。 由(2.3.3)知,可决系数取值范围为,是一个非负统计量。它也是随着抽样不同而不同,即是随抽样而变动统计量。为此,对可决系数统计可靠性也应进行检验,这将在第3章中进行。 二、变量显著性检验 变量显著性检验,旨在对模型中被解释变量与解释变量之间线性关系是否显著成立作出推断,或者讲考察所选择解释变量是否对被解释变量有显著线性阻碍。 从上面拟合优度检验中能够看出,拟合优度高
7、,则解释变量对被解释变量解释程度就高,线性阻碍就强,能够推测模型线性关系成立;反之,就不成立。但这只是一个模糊推测,不能给出一个统计上严格结论。因此,还必须进行变量显著性检验。变量显著性检验所应用方法是数理统计学中假设检验。 1、假设检验假设检验是统计推断一个要紧内容,它差不多任务是依照样本所提供信息,对未知总体分布某些方面假设作出合理推断。假设检验程序是,先依照实际问题要求提出一个论断,称为统计假设,记为;然后依照样本有关信息,对真伪进行推断,作出拒绝或同意决策。假设检验差不多思想是概率性质反证法。为了检验原假设是否正确,先假定那个假设是正确,看由此能推出什么结果。假如导致一个不合理结果,则
8、表明“假设为正确”是错误,即原假设不正确,因此要拒绝原假设。假如没有导致一个不合理现象出现,则不能认为原假设不正确,因此不能拒绝拒绝原假设。概率性质反证法依照是小概率事件原理,该原理认为“小概率事件在一次试验中几乎是不可能发生”。在原假设下构造一个事件,那个事件在“原假设是正确”条件下是一个小概率事件。随机抽取一组容量为n样本观测值进行该事件试验,假如该事件发生了,讲明“原假设是正确”是错误,因为不应该出现小概率事件出现了。因而应该拒绝原假设。反之,假如该小概率事件没有出现,就没有理由拒绝原假设,应该同意原假设。 2、变量显著性检验 用以进行变量显著性检验方法要紧有三种:F检验、t检验、z检验
9、。它们区不在于构造统计量不同。应用最为普遍t检验,在目前使用计量经济学软件包中,都有关于t统计量计算结果。我们在此只介绍t检验。 关于一元线性回归方程中,差不多明白它服从正态分布 进一步依照数理统计学中定义,假如真实未知,而用它无偏可能量替代时,可构造如下统计量 (2.3.5)则该统计量服从自由度为分布。因此,可用该统计量作为显著性检验统计量。假如变量是显著,那么参数应该显著地不为0。因此,在变量显著性检验中设计原假设为: 给定一个显著性水平,查分布表(见附录),得到一个临界值。因为分布是双尾分布,因此按照查分布表中临界值。因此 (那个地点已不同于(2.3.5) 式,其中)为原假设下一个小概率
10、事件。在参数可能完成后,能够专门容易计算数值。假如发生了,则在(1)置信度下拒绝原假设,即变量X是显著,通过变量显著性检验。假如未发生,则在(1)置信度下同意原假设,即变量X是不显著,未通过变量显著性检验。关于一元线性回归方程中,可构造如下t统计量进行显著性检验: (2.3.6)同样地,该统计量服从自由度为分布,检验原假设一般仍为。在例2.1.1及例2.2.1收入-消费支出例中,首先计算可能值因此和标准差可能值分不是:t统计量计算结果分不为: 给定一个显著性水平=0.05,查分布表中自由度为8(在那个例中)、=0.05临界值,得到2.306。可见,讲明解释变量家庭可支配收入在95%置信度下显著
11、,即通过了变量显著性检验。但,表明在95%置信度下,无法拒绝截距项为零假设。三、参数置信区间 假设检验能够通过一次抽样结果检验总体参数可能假设值范围(最常用假设为总体参数值为零),但它并没有指出在一次抽样中样本参数值到底离总体参数真值有多“近”。要推断样本参数可能值在多大程度上能够“近似”地替代总体参数真值,往往需要通过构造一个以样本参数可能值为中心“区间”,来考察它以多大可能性(概率)包含着真实参数值。这种方法确实是参数检验置信区间可能。要推断可能参数值离真实参数值有多“近”,可预先选择一个概率,并求一个正数,使得随机区间(random interval)包含参数真值概率为1-。即:假如存在
12、如此一个区间,称之为置信区间(confidence interval); 1-称为置信系数(置信度)(confidence coefficient),称为显著性水平(level of significance);置信区间端点称为置信限(confidence limit)或临界值(critical values)。在变量显著性检验中差不多明白: 这确实是讲,假如给定置信度,从分布表中查得自由度为临界值,那么值处在概率是。表示为: 即 因此得到置信度下置信区间是 (2.3.6)在例2.1.1与2.2.1中,假如给定,查表得: 从假设检验中已得到: , 因此,依照(2.3.6)计算得到、置信区间分不为 (0.6345,0.9195) (-433.32,226.98)显然,参数置
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版大型商业综合体水电安装工程分包合同范本2篇
- 二零二五年度生物医药创新平台建设合同:地方政府与生物医药企业的合作3篇
- 2025版学校食堂承包合同包含食品安全培训与监督3篇
- 2025版微信公众号与电商平台跨界合作服务合同3篇
- 二零二五版绿化苗木培育与种植服务合同3篇
- 二零二五年度城市基础设施大数据信息服务与维护合同4篇
- 二零二五年度便利店便利店加盟店员劳动合同3篇
- 2025年二手车买卖广告宣传合作协议4篇
- 二零二五年度便利店品牌授权及区域保护合同3篇
- 二零二五年度办公用品日常销售第三方产品分销合同3篇
- 销售与销售目标管理制度
- 人教版(2025新版)七年级下册英语:寒假课内预习重点知识默写练习
- 2024年食品行业员工劳动合同标准文本
- 全屋整装售后保修合同模板
- 高中生物学科学推理能力测试
- GB/T 44423-2024近红外脑功能康复评估设备通用要求
- 2024-2030年中国减肥行业市场发展分析及发展趋势与投资研究报告
- 死亡报告年终分析报告
- 棋牌室禁止赌博警示语
- 2022-2023学年四川省南充市九年级(上)期末数学试卷
- 公转私人转账协议
评论
0/150
提交评论