多元线性回归_第1页
多元线性回归_第2页
多元线性回归_第3页
多元线性回归_第4页
多元线性回归_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元线性回归

(multiplelinearregressionmodel)

———14应化谢雅14540629一、概念

它研究一组自变量如何影响一个因变量。

涉及p个自变量的多元回归模型可表示为:

b0

,b1,b2

,,bp是参数,也称偏回归系数(partialregressioncoefficient)

是被称为误差项的随机变量,也称残差

y是x1,,x2

,,xp

的线性函数加上误差项

包含在y里面但不能被p个自变量的线性关系所解释的变异性多元线性回归模型

二、基本假定:1.解释变量x1,x2,…,xp是确定性变量.不是随机变量。即Y与X1,X2,···,Xm之间具有线性关系。2.误差项ε是一个期望值为0的随机变量,即E()=0。3.对于自变量x1,x2,…,xp的所有值,的方差2都相同4.误差项ε是一个服从正态分布的随机变量,即ε~N(0,2),且相互独立多元线性回归方程(最小二乘法)4三、最小二乘法估计回归参数使因变量的观察值与估计值之间的离差平方和达到最小来求得

。即

式中Q为误差平方和,亦即误差的方差。多元线性回归分析的目标就是找出最佳β值使Q达到最小。通过回归得到的最小Q值称为剩余平方和或残余方差。各变量的离均差L(1,2)=(X11X12+X21X22+````````X271X272)-(X11+```X271)(X12+X272)/27由上面的方程可以看出:总胆固醇、甘油三酯和糖化血红蛋白的升高会引起血糖的升高,而胰岛素的升高会引起血糖的下降。多元线性回归模型的检验1.复相关系数的检验(检验方程)多重相关系数R相关系数越接近1,则模型非常准确。决定系数=1-S残/LYY=S回/LYY(S残=Q)

不可片面追求过大的决定系数,否则预测效果不佳。2.方差分析和F检验(检验自变量)SS为平方和,MS为均方差,n为实验总序号,m为因素F<F临界,则舍弃这个因素。偏回归平方和越大,回归贡献越大。

3.残差分析

(剔除可疑值)

例某种水泥在凝固时释放的热量与水泥中四种化学成分的含量有关

用MATLAB程序求解在程序中输入X数据的13行4列矩阵

Y结果的1行1列矩阵

X=[ones(13,1)x]%生成含常数列的自变量矩阵

[B,BINT,R,RINT,STATS]=regress(y,X,0.05)

可得B的1行5列的矩阵B=57.511.60820.560080.1886-0.10151根据B数组可以确定模型

X=57.51+1.6082X1+0.56008X2+0.1886X3-0.10151X4STATUS=0.9786491.6390.00007.2777STATUS数组的值对应R²=0.97864F=91.639

本次实验的数据个数n=13自变量因素m=4置信度为95%n-m-1=8

在MATLAB下输入finv(0.95,4,8)求得统计参数F的临界值F4,8(0.05)=3.84F计算值>F临界值说明回归方程可以通过统计学检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论