版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于实用回归分析第一页,共三十七页,2022年,8月28日5.1残差与残差图一、残差概念与残差图
****一般认为,如果一个回归模型满足所给出的基本假定,所有残差应在e=0附近随机变化,并在变化幅度不大的一条带子内.****如果残差都落在变化幅度不大一条带子内,也就可以说明回归模型满足基本假设.第二页,共三十七页,2022年,8月28日5.1残差与残差图一、残差概念与残差图
****y观测值的方差并非相同,随x增加而增加.【消除异方差】第三页,共三十七页,2022年,8月28日5.1残差与残差图一、残差概念与残差图
****y与x之间并非线性关系.可能y与x是曲线关系可能y存在自相关第四页,共三十七页,2022年,8月28日5.1残差与残差图一、残差概念与残差图
****蛛网现象(y具有自相关)第五页,共三十七页,2022年,8月28日5.2残差的性质一、残差的性质
性质1E(ei)=0
证明:第六页,共三十七页,2022年,8月28日5.2残差的性质一、残差的性质
性质2称为杠杆值
第七页,共三十七页,2022年,8月28日5.2残差的性质一、残差的性质
性质3.
残差满足约束条件:第八页,共三十七页,2022年,8月28日5.2残差的性质二、改进的残差
第九页,共三十七页,2022年,8月28日5.3异常值与强影响值异常值分为两种情况:一种是关于因变量y异常;另一种是关于自变量x异常。第十页,共三十七页,2022年,8月28日5.3异常值与强影响值一、关于因变量y的异常值标准化残差学生化残差存在y的异常观测值,普通/标准化/学生化残差都不适用第十一页,共三十七页,2022年,8月28日5.3异常值与强影响值第十二页,共三十七页,2022年,8月28日5.3异常值与强影响值可以证明:第十三页,共三十七页,2022年,8月28日5.3异常值与强影响值第十四页,共三十七页,2022年,8月28日5.3异常值与强影响值二、关于自变量x的异常值回归的杠杆值hii也是表示自变量的第i次观测值与自变量平均值之间距离的远近。杠杆值大的样本点称为强影响点。第十五页,共三十七页,2022年,8月28日5.3异常值与强影响值二、关于自变量x的异常值第十六页,共三十七页,2022年,8月28日强影响点不一定是y的异常值点,不能单纯根据杠杆值hii的大小判断强影响点是否异常利用Cook距离,来判断强影响点是否为y的异常值点.5.3异常值与强影响值第十七页,共三十七页,2022年,8月28日5.3异常值与强影响值三、异常值实例分析
例5.1做异常值的诊断分析。分别计算普通残差ei,学生化残差SREi,删除残差e(i),删除学生化残差SRE(i),杠杆值chii,库克距离Di第十八页,共三十七页,2022年,8月28日5.3异常值与强影响值第十九页,共三十七页,2022年,8月28日5.3异常值与强影响值第二十页,共三十七页,2022年,8月28日5.3异常值与强影响值RES-残差eDRE-删除残差ZRE-标准化残差SRE–学生化残差SREiSDR–删除学生化残差SRE(i)COO-库克距离DiiLEV-中心化杠杆值chii第二十一页,共三十七页,2022年,8月28日5.3异常值与强影响值第二十二页,共三十七页,2022年,8月28日5.3异常值与强影响值异常值原因异常值消除方法1.数据登记误差,存在抄写或录入的错误重新核实数据2.数据测量误差重新测量数据3.数据随机误差删除或重新观测异常值数据4.缺少重要自变量增加必要的自变量5.缺少观测数据增加观测数据,适当扩大自变量取值范围6.存在异方差采用加权线性回归7.模型选用错误,线性模型不适用改用非线性回归模型第二十三页,共三十七页,2022年,8月28日删除第19组数据第二十四页,共三十七页,2022年,8月28日5.3异常值与强影响值
学生化删除残差、杠杆值、Cook距离——识别异常值采取的措施:1.不能简单的剔除,有时异常观测值是正确的,它说明回归模型的失败,失败的原因可能是遗漏了一个重要变量,或者选择了不正确的回归函数形式.2.如果异常值数据时准确的,但是找不到对它合理的解释,与剔除这个观测值相比,一个更稳健的方法是抑制它的影响.3.最小绝对离差和法是一种稳健估计方法,它具有对异常值和不合适模型不敏感性质.四、异常值问题补充第二十五页,共三十七页,2022年,8月28日5.3异常值与强影响值
最小绝对离差和法第二十六页,共三十七页,2022年,8月28日违背基本假设的情况
第六章关于异方差性问题第七章关于自相关性问题第八章关于多重共相关问题第二十七页,共三十七页,2022年,8月28日第六章关于异方差性问题
第二十八页,共三十七页,2022年,8月28日第六章关于异方差性问题
6.1异方差性产生的背景6.2异方差性的诊断6.3异方差问题的建模处理第二十九页,共三十七页,2022年,8月28日
Gauss-Markov条件第六章关于异方差性问题第三十页,共三十七页,2022年,8月28日6.1异方差性产生的背景
一、异方差产生的原因
例6.1居民收入与消费水平有着密切的关系。用xi表示第i户的收入量,yi表示第i户的消费额,一个简单的消费模型为:yi=β0+β1xi+εi,i=1,2,…,n收入不同,消费观念和习惯差异,导致消费模型的随机项εi具有不同的方差。低收入的家庭购买差异性比较小,高收入的家庭购买行为差异就很大。第三十一页,共三十七页,2022年,8月28日6.1异方差性产生的背景
二、异方差性带来的问题
当存在异方差时,普通最小二乘估计存在以下问题:(1)参数估计值虽是无偏的,但不是最小方差线性无偏估计;(2)参数的显著性检验失效;(3)回归方程的应用效果极不理想。第三十二页,共三十七页,2022年,8月28日6.2异方差性的诊断
一、异方差性的检验(一)残差图分析法
——直观、方便的分析法以残差ei为纵坐标,其他适宜变量为横坐标画散点图,横坐标有三种选择:拟合值xi观测时间或序号第三十三页,共三十七页,2022年,8月28日6.2异方差性的诊断
一、异方差性的检验(一)残差图分析法
图5.1(b)存在异方差一般情况下,当回归模型满足所有假定时,残差图上的n个点散布应是随机的,无任何规律;存在异方差时,残差图上的点散布呈现相应的趋势.第三十四页,共三十七页,2022年,8月28日6.2异方差性的诊断
一、异方差性的检验(二)等级相关系数法
等级相关系数检验法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既可用于大样本,也可用于小样本。进行等级相关系数检验通常有三个步骤。第一步,作y关于x的普通最小二乘回归,求出ei的估计值,即ei的值。第三十五页,共三十七页,2022年,8月28日6.2异方差性的诊断
(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版图书捐赠与接受合同示范文本3篇
- 2025版小学校园广播系统及音响设备采购合同3篇
- 农产品市场营销策略与实施考核试卷
- 2025年分销合同的市场需求
- 2025年借壳上市协议法律条款
- 2025年园林绿化设计施工居间合同
- 2025年室内装修工程勘察协议
- 2025年合作哲学书籍出版合同
- 2025年加盟美甲美睫连锁店合同
- 二零二五年度木枋行业人才培训与职业发展合同4篇
- 图像识别领域自适应技术-洞察分析
- 个体户店铺租赁合同
- 礼盒业务销售方案
- 二十届三中全会精神学习试题及答案(100题)
- 【奥运会奖牌榜预测建模实证探析12000字(论文)】
- 土力学与地基基础(课件)
- 主要负责人重大隐患带队检查表
- 鲁滨逊漂流记人物形象分析
- 危险废物贮存仓库建设标准
- 多层工业厂房主体结构施工方案钢筋混凝土结构
- 救生艇筏、救助艇基本知识课件
评论
0/150
提交评论