第三节线性回归的显著性检验及回归预测_第1页
第三节线性回归的显著性检验及回归预测_第2页
第三节线性回归的显著性检验及回归预测_第3页
第三节线性回归的显著性检验及回归预测_第4页
第三节线性回归的显著性检验及回归预测_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三节第三节 线性回归的显著性线性回归的显著性检验及回归预测检验及回归预测 在回归分析中在回归分析中, ,要检验因变量要检验因变量Y Y与自变量与自变量X X之间到底有无真正的线性关系之间到底有无真正的线性关系, ,可以通过可以通过回归系数的显著性检验回归系数的显著性检验(t (t检验检验) )或回归方程或回归方程的显著性检验的显著性检验(F(F检验检验) )来判断来判断. .1一、回归系数的显著性检验一、回归系数的显著性检验 回归系数显著性检验的目的是通过检验回回归系数显著性检验的目的是通过检验回归系数归系数 的值与的值与0 0是否有显著性差异,来判断是否有显著性差异,来判断Y Y与与X X

2、之间是否有显著的线性关系之间是否有显著的线性关系. .若若 =0,=0,则总体则总体回归方程中不含回归方程中不含X X项项( (即即Y Y不随不随X X变动而变动变动而变动), ),因因此此, ,变量变量Y Y与与X X之间并不存在线性关系之间并不存在线性关系; ;若若 0, 0,说说明变量明变量Y Y与与X X之间存在显著的线性关系之间存在显著的线性关系. . 提出原假设与备择假设:提出原假设与备择假设:01:0;:0HH 3 构造检验统计量构造检验统计量根据已知条件实际计算统计量根据已知条件实际计算统计量t t的值;的值; (2)( )btt nS b 比较比较与中的计算结果与中的计算结果

3、, ,得到结论得到结论. .21( )()eiS bSbxx 其其中中,为为 的的样样本本方方差差,2222()()iixixxxnSxn 2(2)tn 给定显著性水平给定显著性水平 , ,这是这是t t分布的双侧检验分布的双侧检验, ,查查表计算出临界值表计算出临界值 , ,得出拒绝域得出拒绝域; ;回归系数的检验回归系数的检验 ( (例题分析例题分析) )对例题的回归系数进行显著性检验对例题的回归系数进行显著性检验( ( 0.05)0.05)提出假设提出假设1. 1.计算检验的统计量计算检验的统计量01:0;:0HH 20.7961112.4572645()eibtSxx 0.796116

4、.65480.047820.0253.(2)(14)2.144816.6548,tntYX 所所以以拒拒绝绝原原假假设设, ,表表示示 与与 之之间间存存在在显显著著的的线线性性关关系系, ,即即能能源源消消耗耗量量与与工工业业总总产产值值之之间间存存在在显显著著的的线线性性相相关关关关系系. .5二二. .回归方程的显著性检验回归方程的显著性检验( (方差分析方差分析(F(F检验检验) ) 检验两变量是否线性相关的另一种方法是方差分检验两变量是否线性相关的另一种方法是方差分析析, ,它是建立在对总离差平方和如下分解的基础上:它是建立在对总离差平方和如下分解的基础上: 22222222,()0

5、,iiciciiyiiiiExyiiRExyiiiiERyyyyyySSyynSyynxySSSSbnSSSbx ynSSSSSSbnSbxx yaxSS SSSSaybx 即即:依依赖赖:,n-1,2,1.ERERERERESS SSSSffffffffnfff 三三个个平平方方和和的的自自由由度度分分别别记记为为则则它它们们之之间间也也有有等等式式成成立立:且且:则则注注意意: 提出原假设与备择假设:提出原假设与备择假设:01:0;:0HH 构造检验统计量构造检验统计量22222(1),(2.),REiSSSSn 构构造造分分布布统统计计量量:7221(1,2)(2)(2).RREESSS

6、SFFnSSSSnini 构构造造统统F F分分布布计计量量:给定显著性水平给定显著性水平 , ,查表计算出临界值查表计算出临界值 , ,得出拒绝域得出拒绝域(1,2)Fn (1,2),).Fn 根据已知条件实际计算统计量根据已知条件实际计算统计量F F的值;的值; 比较比较与中的计算结果与中的计算结果, ,得到结论得到结论. .8方差分析方差分析把总离差平方和及其自由度进行分把总离差平方和及其自由度进行分解解, ,利用利用F F统计量检验两变量间线性相关显著性的统计量检验两变量间线性相关显著性的方法称为方差分析方法称为方差分析. .方差分析的结果归纳如下:方差分析的结果归纳如下:离差来源离差

7、来源平方和平方和自由度自由度F F值值回回 归归剩剩 余余1 1n-2n-2 总计总计n-1n-1一一元元线线性性回回归归的的方方差差分分析析表表 2RciSSyy 2EiciSSyy 2iSSyy (2)RESSFSSn 线性关系的检验线性关系的检验( (例题分析例题分析) ) 提出假设提出假设计算检验统计量计算检验统计量F F01:0;:0HH 222()26175(625)161760.9375()37887(916 625) 162105.750.7961 2105.751676.387684.54991676.3876277.5808(2)84.5499 14iixyiiiiRxyE

8、RRESSyynnSx yxynSSbnSSSSSSSSSFSSn 10 确定显著性水平确定显著性水平 =0.05=0.05,并根据分子自由,并根据分子自由度度1 1和分母自由度和分母自由度1414找出临界值找出临界值F F =4.60=4.60 作出决策:若作出决策:若F F F F , , 拒绝拒绝H H0 0,认为能源,认为能源消耗量与工业总产值两变量间的线性相关消耗量与工业总产值两变量间的线性相关关系是显著的关系是显著的. .离差来源离差来源平方和平方和自由度自由度F F值值回回 归归剩剩 余余1 11414 总计总计15151676.3876RSS 84.5499ESS 2105.7

9、5SS 277.5808F 三、利用回归方程进行估计和预测三、利用回归方程进行估计和预测点估计点估计 对于自变量对于自变量x x的一个给定值的一个给定值x x0 0, ,根据回归根据回归方程得到因变量方程得到因变量 y y 的一个估计值的一个估计值cy点估计值有点估计值有 y y 的的平均值平均值的点估计的点估计ny y 的的个别值个别值的点估计的点估计 在点估计条件下,平均值的点估计和个别在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中值的的点估计是一样的,但在区间估计中则不同则不同 y y 的平均值的点估计的平均值的点估计 利用估计的回归方程利用估计的回归方程, ,

10、对于自变量对于自变量x x 的的一一 个给定值个给定值x x0, 0,求出因变量求出因变量y y的平均值的的平均值的一个估计值一个估计值E E( (y y0 0) , ) ,就是平均值的点估计就是平均值的点估计 在能源消耗量与工业总产值的例子中,在能源消耗量与工业总产值的例子中,假如我们要估计能源消耗量为假如我们要估计能源消耗量为7878十万吨十万吨的平均工业总产值,那么将的平均工业总产值,那么将7878十万吨代十万吨代入估计的回归方程,就得到了工业总产入估计的回归方程,就得到了工业总产值的点估计:值的点估计:0()6.51420.7961 7855.5816()E y 亿亿元元y y 的个别

11、值的点估计的个别值的点估计 利用估计的回归方程利用估计的回归方程, ,对于自变量对于自变量x x的的一个给定值一个给定值x x0 0, ,求出因变量求出因变量y y的一个个别的一个个别值的估计值值的估计值 , ,就是个别值的点估计就是个别值的点估计. .例如,如果我们只是想知道能源消耗量为例如,如果我们只是想知道能源消耗量为8080万吨的工业总产值是多少,则属于个别万吨的工业总产值是多少,则属于个别值的点估计值的点估计 。根据估计的回归方程得。根据估计的回归方程得cy6.51420.7961 8057.1738()cy 亿亿元元区间估计区间估计区间估计区间估计点估计不能给出估计的精度,点估计值

12、与点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区实际值之间是有误差的,因此需要进行区间估计间估计对于自变量对于自变量 x x 的一个给定值的一个给定值 x x0 0,根据回归,根据回归方程得到因变量方程得到因变量 y y 的一个估计区间的一个估计区间区间估计有两种类型区间估计有两种类型 置信区间估计置信区间估计(confidence interval estimate)(confidence interval estimate) 预测区间估计预测区间估计(prediction (prediction interval estimate)置信区间估计置信区间估计 利用估

13、计的回归方程,对于自变量利用估计的回归方程,对于自变量 x x 的一个给定值的一个给定值 x x0 0 ,求出因变量,求出因变量 y y 的平的平均值的估计区间均值的估计区间 ,这一估计区间称为,这一估计区间称为置信区间置信区间(confidence interval)(confidence interval) E E( (y y0 0) ) 在在1- 1- 置信水平下的置信区间为置信水平下的置信区间为式中:式中:s se e为回归估计标准差为回归估计标准差 202211(2)ceniixxytnsnxx 置信区间估计置信区间估计( (例题分析例题分析) )【例例】求出工业总产值的点估计为求出

14、工业总产值的点估计为100100亿元时,亿元时,工业总产值工业总产值95%95%置信水平下的置信区间置信水平下的置信区间. . 解:解:根据前面的计算结果根据前面的计算结果, ,已知已知n n=16=16, s se e=2.457=2.457,t t (16-2)=2.1448(16-2)=2.1448 置信区间为置信区间为工业总产值的点估计为工业总产值的点估计为100100亿元时,工业总产值亿元时,工业总产值100cy 21(7357.25)1002.1448 2.457162645 097.9167()102.0833E y预测区间估计预测区间估计 利用估计的回归方程,对于自变量利用估计

15、的回归方程,对于自变量 x x 的一的一个给定值个给定值 x x0 0 ,求出因变量,求出因变量 y y 的一个个别的一个个别值的估计区间,这一区间称为值的估计区间,这一区间称为预测区间预测区间(prediction interval) (prediction interval) y y0 0在在1- 1- 置信水平下的预测区间为置信水平下的预测区间为 202211(2)1ceniixxytnSnxx 置信区间、预测区间、回归方程cyabx 0b x0 x影响区间宽度的因素置信水平置信水平 (1 - (1 - ) ) 区间宽度随置信水平的增大而增大区间宽度随置信水平的增大而增大数据的离散程度数

16、据的离散程度S Se e 区间宽度随离程度的增大而增大区间宽度随离程度的增大而增大3. 3.样本容量样本容量 区间宽度随样本容量的增大而减小区间宽度随样本容量的增大而减小4. 4.用于预测的用于预测的 x x0 0与与 x x的差异程度的差异程度 区间宽度随区间宽度随x x0 0与与 x x 的差异程度的增大的差异程度的增大而增大而增大预测区间估计预测区间估计( (例题分析例题分析) )【例例】求出能源消耗量为求出能源消耗量为7373十万吨时十万吨时, ,工业总产值工业总产值 95% 95% 置信水平下的置信区间置信水平下的置信区间 解:解:根据前面的计算结果根据前面的计算结果, ,已知已知 n n=16=16, s se e= =2.4572.457, t t (14)=2.1448(14)=2.1448 置信区间为置信区间为能源消耗量为能源消耗

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论