回归分析理论_第1页
回归分析理论_第2页
回归分析理论_第3页
回归分析理论_第4页
回归分析理论_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、多元线性回归表达式:P二煜十十…十必卯2、[b,bint,r,rint,stats]=regress(YXalpha)求回归系数的点估计和区间估计、并检验回归模型bint表示回归系数的区间估计.r表示残差rint表示置信区间stats表示用于检验回归模型的统计量,有三个数值:相关系数2F值、与F对应的概率p说明:相关系数r2越接近1,说明回归方程越显著;F叽gH时拒绝HO,F越大,说明回归方程越显著;与F对应的概率pva时拒绝H0alpha表示显著性水平(缺省时为0.05)3、rcoplot(r,rint)画岀残差及其■信区间4、实例演示,函数使用说明(1)输入数据(2)回归分析及检验运行结果解读如下参数回归结果为4==0.7194,对应的置信区间分别为[-33.7017,1.5612]和[0.6047,0.834]r2=0.9282(越接近于1回归效果越显著),F=180.9531,p=0.0000由p<0.05,可知回归模型y=-16.073+0.7194x成立(3)残差分析作残差图2460101214I63ENunt151从残差图可以看出,除第二个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型y=-16.073+0.7194x能较好的符合原始数据,而第二个数据可视为异常点。

⑷预测及作图二、一元多项式回归1、一元多项式回归函1、一元多项式回归函:'数y=◎皿+函s+…+為x+孤+1(1)[p,S]二polyfit(x,y,m)确定多项式系数的MATLAB命令说明:x=(x1,x2,...,xn),y=(y1,y2,...,yn);p=(a1,a2,...,am+1)是多项式y二a1xm+a2xm-1+...+amx+am+1的系数;S是一矩阵,用来估计预测误差⑵polytool(x,y,m)调用多项式回归GUI界面,参数意义同polyfit2、预测和预测误差估计⑴Y二polyval(p,x)求polyfit所得的回归多项式在x处的预测值Y⑵[Y,DELTA]二polyconf(p,x,S,alpha)求polyfit所得的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间Y±DELTA,alpha缺省时为0.53、实例演示说明观测物体降落的距离s与时间t的关系,得到数据如下表,求s的表达式(即回归方程s=a+bt+ct2)t(s)1/302/303/304/305/306/307/30s(cm)11.8615.6720.6026.6933.7141.9351.13t(s)8/309/3010/3011/3012/3013/3014/30s(cm)61.4972.9085.4499.08113.77129.54146.48解法一:直接作二次多项式回归故回归模型为^=489.2946£2+65.8896£+9.1329

1、多元二项式回归Matlab命令rstool(x,y,'model',alpha)输入参数说明:x:n*m矩阵;Y:n维列向量;alpha:显著性水平(缺省时为0.05);mode:由下列4个模型中选择1个(用字符串2、实例演示说明设某商品的需求量与消费者的平均收入、商品价格的统计数据如下,建立回归模型,预测平均收入为1000、价格为6时的商品需求量

需求量10075807050659010011060收入10006001200500300400130011001300300价格5766875439解法一:选择纯二次模型尹二屈+A^i+A^2+件i彳+炖工;1-10■TOC\o"1-5"\h\zItD:-才/FWIdM71』IEfl'厂u*u.顷9CG603™aue3D1CK初'IniaiiK»i56F■UemSI在x1对应的文本框中输入1000,X2中输入6,敲回车键,此时图形和相关数据会自动更新此时在GUI左边的“PredictedY1”下方的数据变为88.47981,表示平均收入为1000、价格为6时商品需求量为88.4791点击左下角的Export按钮,将会导出回归的相关参数beta、rmse和residuals到工作空间(workspace)在Export按钮下面可以选择回归类型在Matlab命令窗口中输入将得到如下结果故回归模型为尹二110.5313+0.1464^—26.5709x-2—O.OOOIx;+1.24'7弘孑解法二:将上面饿模型转换为多元线性回归f=焊)+A^i+屁花+屛込f+甩爲1.1.2求数字特征例2已知50个数据x二[451.4243.89527.185312.6912.863383.97683.1292.84235.338612.4608.5415.7616.355190.07586.9257.581367.57631.45717.63692.6784.079454.36441.83353.25153.61675.64699.21727.51478.38554.84121.05450.75715.88892.84273.1254.77865.6232.35804.87908.4231.89239.3149.75478.384640.82190.89843.87173.9170.79994.3],计算其数字特征。输入数据,利用下列提供的函数可以求得各数字特征。min(x):向量x的元素的最小值max(x):向量x的元素的最大值mean(x):向量x的元素的算术平均值geomean(x):向量x的元素的几何平均值(n个正数的连乘积的n次算术根叫做这n个数的几何平均数)median(x):向量x的元素的中位数var(x):向量x的元素的方差std(x):向量x的元素的标准差diff(x):向量x的相邻元素的差sort(x):对向量x的元素进行排序(Sorting)length(x):向量x的元素个数sum(x):向量x的元素总和prod(x):向量x的元素总乘积原理表征依变数Y的变异中有多少百分比,可由控制的自变数X来解释.相关系数(coefficientofcorrelation)的平方即为决定系数。它与相关系数的区别在于除掉|R|=0和1情况,由于R2vR,可以防止对相关系数所表示的相关做夸张的解释。决定系数:在Y的总平方和中,由X引起的平方和所占的比例,记为R2(R的平方)决定系数的大小决定了相关的密切程度。当R2越接近1时,表示相关的方程式参考价值越高;相反,越接近0时,表示参考价值越低。这是在一元回归分析中的情况。但从本质上说决定系数和回归系数没有关系,就像标准差和标准误差在本质上没有关系一样。在多元回归分析中,决定系数是通径系数的平方。表达式:R八2=SSR/SST=1-SSE/SST其中:SST=SSR+SSE,SST(sumofsquaresfortotal)为总平方和,SSReg(sumofsquaresforregression为回归平方和,SSE(sumofsquaresforerror)为残差平方和。注:(不同书命名不同)回归平方和:SSR(SumofSquaresforregression)=ESS(explainedsumofsquares)残差平方和:SSE(SumofSquaresforError)=RSS(residualsumofsquares)总离差平方和:SST(SumofSquaresfortotal)=TSS(totalsumofsquares)SSE+SSR=SSTRSS+ESS=TSS意义:拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。取值范围:0-1.作用编辑判定系数只是说明列入模型的所有解释变量对因变量的联合的影响程度,不说明模型中单个解释变量的影响程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论