实用回归分析_第1页
实用回归分析_第2页
实用回归分析_第3页
实用回归分析_第4页
实用回归分析_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于实用回归分析第一张,PPT共三十七页,创作于2022年6月5.1 残差与残差图一、残差概念与残差图 *一般认为,如果一个回归模型满足所给出的基本假定,所有残差应在e=0附近随机变化,并在变化幅度不大的一条带子内.*如果残差都落在变化幅度不大一条带子内,也就可以说明回归模型满足基本假设.第二张,PPT共三十七页,创作于2022年6月5.1 残差与残差图一、残差概念与残差图 *y观测值的方差并非相同,随x增加而增加. 【消除异方差】第三张,PPT共三十七页,创作于2022年6月5.1 残差与残差图一、残差概念与残差图 *y与x之间并非线性关系. 可能y与x是曲线关系 可能y存在自相关第四张,P

2、PT共三十七页,创作于2022年6月5.1 残差与残差图一、残差概念与残差图 *蛛网现象(y具有自相关)第五张,PPT共三十七页,创作于2022年6月5.2 残差的性质一、残差的性质 性质1 E (ei)=0 证明:第六张,PPT共三十七页,创作于2022年6月5.2 残差的性质一、残差的性质 性质2称为杠杆值 第七张,PPT共三十七页,创作于2022年6月5.2 残差的性质一、残差的性质 性质3. 残差满足约束条件: 第八张,PPT共三十七页,创作于2022年6月5.2 残差的性质二、改进的残差 第九张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值异常值分为两种情况: 一种

3、是关于因变量y异常; 另一种是关于自变量x异常。第十张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值一、关于因变量y的异常值标准化残差学生化残差存在y的异常观测值,普通/标准化/学生化残差都不适用第十一张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值第十二张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值可以证明: 第十三张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值第十四张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值二、关于自变量x的异常值回归的杠杆值hii也是表示自变量的第i次观测值与自变量平均值之

4、间距离的远近。杠杆值大的样本点称为强影响点。第十五张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值二、关于自变量x的异常值第十六张,PPT共三十七页,创作于2022年6月强影响点不一定是y的异常值点,不能单纯根据杠杆值hii的大小判断强影响点是否异常利用Cook距离,来判断强影响点是否为y的异常值点.5.3 异常值与强影响值第十七张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值三、异常值实例分析 例5.1 做异常值的诊断分析。分别计算普通残差ei,学生化残差SREi,删除残差e(i),删除学生化残差SRE(i),杠杆值chii,库克距离Di第十八张,PPT共

5、三十七页,创作于2022年6月5.3 异常值与强影响值第十九张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值第二十张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值RES-残差eDRE-删除残差ZRE-标准化残差SRE 学生化残差SREiSDR 删除学生化残差SRE(i)COO-库克距离Dii LEV-中心化杠杆值chii第二十一张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值第二十二张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值异常值原因异常值消除方法1.数据登记误差,存在抄写或录入的错误重新核实数据2.数据测量误差重新

6、测量数据3.数据随机误差删除或重新观测异常值数据4.缺少重要自变量增加必要的自变量5.缺少观测数据增加观测数据,适当扩大自变量取值范围6.存在异方差采用加权线性回归7.模型选用错误,线性模型不适用改用非线性回归模型第二十三张,PPT共三十七页,创作于2022年6月删除第19组数据第二十四张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值 学生化删除残差、杠杆值、Cook距离识别异常值采取的措施:1. 不能简单的剔除,有时异常观测值是正确的,它说明回归模型的失败,失败的原因可能是遗漏了一个重要变量,或者选择了不正确的回归函数形式.2.如果异常值数据时准确的,但是找不到对它合理的解

7、释,与剔除这个观测值相比,一个更稳健的方法是抑制它的影响.3.最小绝对离差和法是一种稳健估计方法,它具有对异常值和不合适模型不敏感性质.四、异常值问题补充第二十五张,PPT共三十七页,创作于2022年6月5.3 异常值与强影响值 最小绝对离差和法第二十六张,PPT共三十七页,创作于2022年6月违背基本假设的情况 第六章 关于异方差性问题第七章 关于自相关性问题第八章 关于多重共相关问题第二十七张,PPT共三十七页,创作于2022年6月第六章 关于异方差性问题 第二十八张,PPT共三十七页,创作于2022年6月第六章 关于异方差性问题 6.1 异方差性产生的背景6.2 异方差性的诊断6.3 异

8、方差问题的建模处理第二十九张,PPT共三十七页,创作于2022年6月 Gauss-Markov条件 第六章 关于异方差性问题第三十张,PPT共三十七页,创作于2022年6月6.1 异方差性产生的背景 一、异方差产生的原因 例6.1 居民收入与消费水平有着密切的关系。用xi表示第i户的收入量,yi表示第i户的消费额,一个简单的消费模型为:yi=0+1xi+i,i=1,2,n收入不同,消费观念和习惯差异,导致消费模型的随机项i具有不同的方差。低收入的家庭购买差异性比较小,高收入的家庭购买行为差异就很大。第三十一张,PPT共三十七页,创作于2022年6月6.1 异方差性产生的背景 二、异方差性带来的

9、问题 当存在异方差时,普通最小二乘估计存在以下问题:(1)参数估计值虽是无偏的,但不是最小方差线性无偏估计;(2)参数的显著性检验失效;(3)回归方程的应用效果极不理想。第三十二张,PPT共三十七页,创作于2022年6月6.2 异方差性的诊断 一、异方差性的检验(一)残差图分析法 直观、方便的分析法 以残差ei为纵坐标,其他适宜变量为横坐标画散点图,横坐标有三种选择:拟合值xi观测时间或序号第三十三张,PPT共三十七页,创作于2022年6月6.2 异方差性的诊断 一、异方差性的检验(一)残差图分析法 图5.1(b)存在异方差一般情况下,当回归模型满足所有假定时,残差图上的n个点散布应是随机的,无任何规律;存在异方差时,残差图上的点散布呈现相应的趋势.第三十四张,PPT共三十七页,创作于2022年6月6.2 异方差性的诊断 一、异方差性的检验(二)等级相关系数法 等级相关系数检验法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既可用于大样本,也可用于小样本。进行等级相关系数检验通常有三个步骤。 第一步,作y关于x的普通最小二乘回归,求出ei的估计值,即ei的值。第三十五张,PPT共三十七页,创作于2022年6月6.2 异方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论