




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
相关与回来分析第一节变量间的相关关系其次节一元线性回来第三节多元线性回来第四节可化为线性回来的曲线回来雷习目标1. 驾驭相关系数的含义、计算方法和应用2. 驾驭一元线性回来的基本原理和参数的最小二乘估计方法驾驭回来方程的显著性检验利用回来方程进行预料驾驭多元线性回来分析的基本方法了解可化为线性回来的曲线回来用matlab进行回来分析第一节变量间的相关关系一.变量相关的概念二.相关系数及其计算变量相关的概念变量间的关系
(函数关系)是一一对应的确定关系设有两个变量x和y,变量y随变量x一起变更,并完全依靠于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量各观测点落在一条线上xy变量间的关系
(函数关系)函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为
y=p
x(p为单价)圆的面积(S)与半径之间的关系可表示为S=R2
企业的原材料消耗额(y)与产量(x1)
、单位产量消耗(x2)
、原材料价格(x3)之间的关系可表示为y=x1x2x3
变量间的关系
(相关关系)变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时,变量y的取值可能有几个各观测点分布在直线四周xy变量间的关系
(相关关系)相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教化程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系相关关系的类型相关关系非线性相关线性相关正相关正相关负相关负相关完全相关不相关相关关系的图示不相关负线性相关正线性相关非线性相关完全负线性相关完全正线性相关相关系数及其计算相关关系的测度
(相关系数)对变量之间关系亲密程度的度量对两个变量之间线性相关程度的度量称为简洁相关系数若相关系数是依据总体全部数据计算的,称为总体相关系数,记为若是依据样本数据计算的,则称为样本相关系数,记为r相关关系的测度
(相关系数)
样本相关系数的计算公式或化简为相关关系的测度
(相关系数取值及其意义)r的取值范围是[-1,1]|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关r=0,不存在线性相关关系相关-1r<0,为负相关0<r1,为正相关|r|越趋于1表示关系越亲密;|r|越趋于0表示关系越不亲密相关关系的测度
(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加统计工具箱中的回来分析叮嘱1.多元线性回来2.多项式回来3.非线性回来4.逐步回来返回回来模型的类型一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归多元线性回来
b=regress(Y,X)1.确定回来系数的点估计值:183.画出残差及其置信区间:
rcoplot(r,rint)2.求回来系数的点估计和区间估计、并检验回来模型:[b,bint,r,rint,stats]=regress(Y,X,alpha)回归系数的区间估计残差用于检验回归模型的统计量,有三个数值:相关系数r2、F值、与F对应的概率p置信区间显著性水平(缺省时为0.05)19例1解:1.输入数据:x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[8885889192939395969897969899100102]';2.回来分析及检验:[b,bint,r,rint,stats]=regress(Y,X)b,bint,statsToMATLAB(liti11)题目20213.残差分析,作残差图:
rcoplot(r,rint)从残差图可以看出,除其次个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回来模型y=-16.073+0.7194x能较好的符合原始数据,而其次个数据可视为异样点.4.预料及作图:z=b(1)+b(2)*x;plot(x,Y,'k+',x,z,'r')返回ToMATLAB(liti12)22多项式回归(一)一元多项式回来(1)确定多项式系数的叮嘱:[p,S]=polyfit(x,y,m)(2)一元多项式回来叮嘱:polytool(x,y,m)1.回来:y=a1xm+a2xm-1+…+amx+am+123多项式回归(一)一元多项式回来y=a1xm+a2xm-1+…+amx+am+12.预料和预料误差估计:(1)Y=polyval(p,x)求polyfit所得的回来多项式在x处的预料值Y;(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回来多项式在x处的预料值Y及预料值的显著性为1-alpha的置信区间YDELTA;alpha缺省时为0.05.2425法一干脆作二次多项式回来:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];[p,S]=polyfit(t,s,2)ToMATLAB(liti21)得回归模型为:26法二化为多元线性回来:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];T=[ones(14,1)t'(t.^2)'];[b,bint,r,rint,stats]=regress(s',T);b,statsToMATLAB(liti22)得回归模型为:Y=polyconf(p,t,S)plot(t,s,'k+',t,Y,'r')预料及作图ToMATLAB(liti23)27(二)多元二项式回来叮嘱:rstool(x,y,’model’,alpha)nm矩阵显著性水平(缺省时为0.05)n维列向量28例3设某商品的需求量与消费者的平均收入、商品价格的统计数据如下,建立回来模型,预料平均收入为1000、价格为6时的商品需求量.法一干脆用多元二项式回来:x1=[10006001200500300400130011001300300];x2=[5766875439];y=[10075807050659010011060]';x=[x1'x2'];rstool(x,y,'purequadratic')29在画面左下方的下拉式菜单中选”all”,则beta.rmse和residuals都传送到MATLAB工作区中.将左边图形下方方框中的“800”改成1000,右边图形下方的方框中仍输入6.则画面左边的“PredictedY”下方的数据由原来的“86.3791”变为88.4791,即预料出平均收入为1000.价格为6时的商品需求量为88.4791.30在MATLAB工作区中输入叮嘱:beta,rmseToMATLAB(liti31)31结果为:b=110.53130.1464-26.5709-0.00011.8475stats=0.970240.66560.0005法二ToMATLAB(liti32)返回将化为多元线性回归:32非线性回归(1)确定回来系数的叮嘱:[beta,r,J]=nlinfit(x,y,’model’,beta0)(2)非线性回来叮嘱:nlintool(x,y,’model’,beta0,alpha)1.回来:残差Jacobi矩阵回归系数的初值事先用M文件定义的非线性函数估计出的回归系数输入数据x.y分别为矩阵和n维列向量,对一元非线性回归,x为n维列向量.2.预测和预测误差估计:[Y,DELTA]=nlpredci(’model’,x,beta,r,J)求nlinfit或lintool所得的回归函数在x处的预测值Y及预测值的显著性水平为1-alpha的置信区间YDELTA.±33例4对第一节例2,求解如下:2.输入数据:
x=2:16;y=[6.428.209.589.59.7109.939.9910.4910.59…10.6010.8010.6010.9010.76];
beta0=[82]';3.求回来系数:[beta,r,J]=nlinfit(x',y','volum',beta0);beta得结果:beta=11.6036-1.0641即得回来模型为:ToMATLAB(liti41)题目344.预料及作图:[YY,delta]=nlpredci('volum',x',beta,r,J);plot(x,y,'k+',x,YY,'r')ToMATLAB(liti42)35例5*财政收入预料问题:财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关.表中列出了1952─1981年的原始数据,试构造预料模型.解设国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资分别为x1、x2、x3、x4、x5、x6,财政收入为y,设变量之间的关系为:y=ax1+bx2+cx3+dx4+ex5+fx6运用非线性回来方法求解.361.
对回来模型建立M文件model.m如下:functionyy=model(beta0,X)a=beta0(1);b=beta0(2);c=beta0(3);d=beta0(4);e=beta0(5);f=beta0(6);x1=X(:,1);x2=X(:,2);x3=X(:,3);x4=X(:,4);x5=X(:,5);x6=X(:,6);yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6;372.
主程序liti6.m如下:X=[598.00349.00461.0057482.0020729.0044.00…………..2927.006862.001273.00100072.043280.00496.00];y=[184.00216.00248.00254.00268.00286.00357.00444.00506.00...271.00230.00266.00323.00393.00466.00352.00303.00447.00...564.00638.00658.00691.00655.00692.00657.00723.00922.00...890.00826.00810.0]';beta0=[0.50-0.03-0.600.01-0.020.35];betafit=nlinfit(X,y,'model',beta0)ToMATLAB(liti6)38
betafit=0.5243-0.0294-0.63040.0112-0.02300.3658即y=0.5243x1-0.0294x2-0.6304x3+0.0112x4-0.0230x5+0.3658x6结果为:返回39逐步回归逐步回来的叮嘱是:stepwise(x,y,inmodel,alpha)运行stepwise叮嘱时产生三个图形窗口:StepwisePlot,StepwiseTable,StepwiseHistory.在StepwisePlot窗口,显示出各项的回来系数及其置信区间.StepwiseTable窗口中列出了一个统计表,包括回来系数及其置信区间,以及模型的统计量剩余标准差(RMSE)、相关系数(R-square)、F值、与F对应的概率P.矩阵的列数的指标,给出初始模型中包括的子集(缺省时设定为全部自变量)显著性水平(缺省时为0.05)自变量数据,阶矩阵因变量数据,阶矩阵40例6水泥凝固时放出的热量y与水泥中4种化学成分x1、x2、x3、x4有关,今测得一组数据如下,试用逐步回来法确定一个线性模型.411.数据输入:x1=[7111117113122111110]';x2=[26295631525571315447406668]';x3=[615886917221842398]';x4=[6052204733226442226341212]';y=[78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.4]';x=[x1x2x3x4];422.逐步回来:(1)先在初始模型中取全部自变量:stepwise(x,y)得图StepwisePlot和表StepwiseTable图StepwisePlot中四条直线都是虚线,说明模型的显著性不好从表StepwiseTable中看出变量x3和x4的显著性最差.4344(2)在图StepwisePlot中点击直线3和直线4,移去变量x3和x4移去变量x3和x4后模型具有显著性.虽然剩余标准差(RMSE)没有太大的变更,但是统计量F的值明显增大,因此新的回来模型更好.ToMATLAB(liti51)4546(3)对变量y和x1、x2作线性回来:X=[ones(13,1)x1x2];b=regress(y,X)得结果:b=52.57731.46830.6623故最终模型为:y=52.5773+1.4683x1+0.6623x2ToMATLAB(liti52)返回47表1我国人均国民收入与人均消费金额数据单位:元年份人均国民收入人均消费金额年份人均国民收入人均消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相关关系的测度
(相关系数计算例)【练习1】在探讨我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们收集到1981~1993年的样本数据(xi,yi),i=1,2,…,13,数据见表10-1,计算相关系数。48答案:用matlab可得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- (高清版)DB12∕T 490.1-2013 社区管理和服务信息化规范 第1部分:总则
- (高清版)DB12∕T 673-2016 营运车辆二级维护企业技术条件
- 退休座谈会感人发言稿
- 医疗机构自查报告8篇
- 2024年证券从业考试深度剖析试题及答案
- 2025年联营合作协议模板
- 考前准备:CPMM考试时间管理技巧及试题及答案
- 2025年两人合伙开店合作协议模板
- 2025年度离婚债务分割与财产清算协议
- 2025年度酒店预订与会议场地租赁合同
- 2024年7月国家开放大学法律事务专科《民法学(2)》期末纸质考试试题及答案
- 绿化道路及室外管网等工程施工组织设计
- 70岁老人用工免责协议书
- 军人抚恤优待条例培训2024
- 2021年高级经济师《高级经济实务》建筑与房地产经济专业考试题库及答案解析
- 培训机构老师职业规划
- 工厂厂长年终总结汇报
- 《公路桥梁挂篮设计与施工技术指南》
- (一模)宁波市2024学年第一学期高考模拟考试 物理试卷(含答案)
- 人教版高中物理选择性必修第三册第五章原子核第2节放射性元素的衰变课件
- 人教版小学六年级下册音乐教案全册
评论
0/150
提交评论