利用MATLAB进行多元线性回归复习进程_第1页
利用MATLAB进行多元线性回归复习进程_第2页
利用MATLAB进行多元线性回归复习进程_第3页
利用MATLAB进行多元线性回归复习进程_第4页
利用MATLAB进行多元线性回归复习进程_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.线性回归(huíguī)

b=regress(y,X)[b,bint,r,rint,s]=regress(y,X,alpha)输入:y~因变量(列向量),X~1与自变量组成(zǔchénɡ)的矩阵,Alpha~显著性水平(缺省时设定为0.05)s:3个统计(tǒngjì)量:决定系数R2,F值,F(1,n-2)分布大于F值的概率p,p<时回归模型有效输出:b=(),bint:b的置信区间,r:残差(列向量),rint:r的置信区间rcoplot(r,rint)残差及其置信区间作图第一页,共15页。回归(huíguī)模型例3:血压(xuèyā)与年龄、体重指数、吸烟习惯序号血压年龄体重指数吸烟习惯序号血压年龄体重指数吸烟习惯11443924.20211363625.0022154731.11221425026.2131384522.60231203923.50101545619.30301756927.41体重(tǐzhòng)指数=体重(tǐzhòng)(kg)/身高(m)的平方吸烟习惯:0表示不吸烟,1表示吸烟建立血压与年龄、体重指数、吸烟习惯之间的回归模型第二页,共15页。模型(móxíng)建立血压y,年龄x1,体重指数x2,吸烟(xīyān)习惯x3y与x1的散点图y与x2的散点图线性回归(huíguī)模型回归系数0,1,2,3由数据估计,是随机误差第三页,共15页。n=30;m=3;y=[144 215 138 145 162 142 170 124 158 154162 150 140 110 128 130 135 114 116 124136 142 120 120 160 158 144 130 125 175];x1=[39 47 45 47 65 46 67 42 67 5664 56 59 34 42 48 45 18 20 1936 50 39 21 44 53 63 29 25 69];x2=[24.231.122.624.025.925.129.519.727.219.328.025.827.320.121.722.227.418.822.621.525.026.223.520.327.128.628.322.025.327.4];x3=[0101101010100001000...00100110101];X=[ones(n,1),x1',x2',x3'];[b,bint,r,rint,s]=regress(y',X);s2=sum(r.^2)/(n-m-1);b,bint,s,s2rcoplot(r,rint)第四页,共15页。回归系数回归系数估计值回归系数置信区间045.3636[3.553787.1736]10.3604[-0.07580.7965]23.0906[1.05305.1281]311.8246[-0.148223.7973]R2=0.6855

F=18.8906

p<0.0001s2=169.7917模型(móxíng)求解回归系数回归系数估计值回归系数置信区间058.5101[29.906487.1138]10.4303[0.12730.7332]22.3449[0.85093.8389]310.3065[3.387817.2253]R2=0.8462F=44.0087

p<0.0001s2=53.6604剔除(tīchú)异常点(第2点和第10点)后xueya01.m第五页,共15页。第六页,共15页。此时可见第二与第十二个点是异常点,于是删除上述两点,再次进行回归得到(dédào)改进后的回归模型的系数、系数置信区间与统计量回归系数回归系数估计值回归系数置信区间058.5101[29.906487.1138]10.4303[0.12730.7332]22.3449[0.85093.8389]310.3065[3.387817.2253]R2=0.8462F=44.0087

p<0.0001s2=53.6604这时置信区间不包含零点,F统计量增大,可决系数(xìshù)从0.6855增大到0.8462,我们得到回归模型为:第七页,共15页。通常,进行多元线性回归的步骤如下:(1)做自变量与因变量的散点图,根据散点图的形状(xíngzhuàn)决定是否可以进行线性回归;(2)输入自变量与因变量;(3)利用命令:[b,bint,r,rint,s]=regress(y,X,alpha),rcoplot(r,rint)得到回归模型的系数以及异常点的情况;(4)对回归模型进行检验首先进行残差的正态性检验:jbtest,ttest第八页,共15页。其次进行残差的异方差检验:戈德菲尔德一匡特(Goldfeld—Quandt)检验戈德菲尔德检验,简称为G—Q检验.为了检验异方差性,将样本按解释变量排序后分成两部分,再利用样本1和样本2分别建立回归模型,并求出各自的残差平方和RSSl和RSS2。如果误差(wùchā)项的离散程度相同(即为同方差的),则RSSl和RSS2的值应该大致相同;若两者之间存在显著差异,则表明存在异方差.检验过程中为了“夸大”残差的差异性,一般先在样本中部去掉C个数据(通常取c=n/4),再利用F统计量判断差异的显著性:第九页,共15页。其中,n为样本容量,k为自变量个数.然后对残差进行自相关性的检验,通常我们(wǒmen)利用DW检验进行残差序列自相关性的检验。该检验的统计量为:其中为残差序列,对于计算出的结果通过查表决定是否存在自相关性。若du<DW<4-du,则不存在自相关性;若DW<dl,则存在一阶正相关;DW>4-dl,则存在一阶负相关;若dl<DW<du或4-du<DW<4-dl,则无法(wúfǎ)判断第十页,共15页。下面我们对模型进行检验:(1)残差的正态检验:由jbtest检验,h=0表明残差服从正态分布,进而由t检验可知h=0,p=1,故残差服从均值为零的正态分布;(2)残差的异方差检验:我们将28个数据从小到大排列,去掉中间的6个数据,得到(dédào)F统计量的观测值为:f=1.9092,由F(7,7)=3.79,可知:f=1.9092<3.79,故不存在(cúnzài

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论