




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、多元线性回归的数学模型二、数学模型的分析与求解三、MATLAB中回归分析的实现四、小结多元线性回归一、多元线性回归的数学模型二、数学模型的分析与求解三、MAT1一、多元线性回归的数学模型一、多元线性回归的数学模型2多元线性回归模型多元线性回归模型3用最大似然估计法估计参数.达到最小.二、数学模型的分析与求解用最大似然估计法估计参数.达到最小.二、数学模型的分析与求解4化简可得化简可得5正规方程组正规方程组6引入矩阵正规方程组的矩阵形式引入矩阵正规方程组的矩阵形式7最大似然估计值P元经验线性回归方程最大似然估计值P元经验线性回归方程8多元线性回归
1.确定回归系数的点估计值,用命令:
b=regress(Y,X)2.求回归系数的点估计和区间估计,并检验回归模型,用命令:
[b,bint,r,rint,stats]=regress(Y,X,alpha)3.画出残差及其置信区间,用命令:
rcoplot(r,rint)三、MATLAB中回归分析的实现多元线性回归1.确定回归系数的点估计值,用命令:2.9符号说明(1)符号说明(1)10(2)
alpha为显著性水平,默认为0.05;(3)
bint为回归系数的区间估计;(4)
r与rint分别为残差及其置信区间;
(5)
stats是用于检验回归模型的统计量,有三个数值,第一个是相关系数
r2,其值越接近于1,说明回归方程越显著;第二个是
F值,
F>F1-alpha(p,n-p-1)时拒绝H0,F越大,说明回归方程越显著;第三个是与F对应的概率
p,p<alpha时拒绝,回归模型成立.(2)alpha为显著性水平,默认为0.05;(3)11身高143145146147149150153154腿长8885889192939395身高155156157158159160162164腿长969897969899100102例1测得16组的身高和腿长如下(单位:cm):试研究这些数据之间的关系.身高143145146147149150153154腿长8812输入数据x=[143,145,146,147,149,150,153,154,155,156,157,158,159,160,162,164]’;X=[ones(16,1),x];Y=[88,85,88,91,92,93,93,95,96,98,97,96,98,99,100,102]’;回归分析及检验[b,bint,r,rint,stats]=regress(Y,X);b,bint,stats输入数据x=[143,145,146,147,149,15013多元回归分析-2课件14多元回归分析-2课件15一元多项式回归1.确定多项式系数,用命令:
[p,S]=polyfit(x,y,m)也可使用命令:polytool(x,y,m)
结果产生一个交互式的画面,画面中有拟合曲线和y的置信区间,左下方的Export可以输出参数.一元多项式回归1.确定多项式系数,用命令:也可使用命令:162.预测和预测误差估计用命令:求回归多项式在x处的预测值Y.[Y,DELTA]=polyconf(p,x,S,alpha)
求回归多项式在x处的预测值Y以及预测值的显著性为1-alpha的置信区间Y±DELTA,alpha的默认值是0.05.一元多项式回归可化为多元线性回归求解.Y=polyval(p,x)2.预测和预测误差估计用命令:求回归多项式在x处的预测值Y.17例2下面给出了某种产品每件平均单价Y(元)与批量x(件)之间的关系的一组数据.x202530354050y1.811.701.651.551.481.40x606570758090y1.301.261.241.211.201.18试用一元二次多项式进行回归分析.例2下面给出了某种产品每件平均单价Y(元)与x202518输入数据x=[20,25,30,35,40,50,60,65,70,75,80,90];y=[1.81,1.70,1.65,1.55,1.48,1.40,1.30,1.26,1.24,1.21,1.20,1.18];作二次多项式回归[p,S]=polyfit(x,y,2)预测及作图Y=polyconf(p,x,y)plot(x,y,’b+’,x,Y,’r’)输入数据x=[20,25,30,35,40,50,60,6519作二次多项式回归[p,S]=polyfit(x,y,2)>>p=polyfit(x,y,2)p=0.0001-0.02252.1983Y=polyval(p,x)Y=1.79781.71341.63521.56321.49751.38481.29721.26271.23451.21261.19691.1843作二次多项式回归[p,S]=polyfit(x,y,2)>>20预测及作图Y=polyconf(p,x,y)plot(x,y,’b+’,x,Y,’r’)Y=polyconf(p,x,y)Y=1.79781.71341.63521.56321.49751.38481.29721.26271.23451.21261.19691.1843预测及作图Y=polyconf(p,x,y)Y=polyco21预测及作图polytool(x,y,2)预测及作图polytool(x,y,2)22预测及作图polytool(x,y,2)[p,S]=polyfit(x,y,2);[Y,DELTA]=polyconf(p,x,S,0.05)Y=1.79781.71341.63521.56321.49751.38481.29721.26271.23451.21261.19691.1843DELTA=0.03350.03110.02990.02960.02970.03020.03020.02990.02970.02970.03050.0354预测及作图polytool(x,y,2)[p,S]=poly23化为多元线性回归X=[ones(12,1)x’(x.^2)’];X=120400125625130900135122514016001502500160360016542251704900175562518064001908100化为多元线性回归X=[ones(12,1)x’(x.^224化为多元线性回归X=[ones(12,1)x’(x.^2)’];[b,bint,r,rint,stats]=regress(y’,X);b,stats与前面的结果一致.化为多元线性回归X=[ones(12,1)x’(x.^225多元二项式回归rstool(x,y,’model’,alpha)
其中,输入数据
x,y分别为n×m矩阵和n维列向量;
alpha为显著性水平,默认为0.05;
model为下列四种模型中的一种,输入相应的字符串,默认为线性模型.多元二项式回归rstool(x,y,’model’,alph26
rstool的输出是一个交互式画面,画面中有m个图形,分别给出了一个独立变量xi与y的拟合曲线,以及y的置信区间,此时其余m-1个变量取固定值.可以输入不同的变量的不同值得到y的相应值.
图的左下方有两个下拉式菜单,一个用于传送回归系数、剩余标准差、残差等数据;另一个用于选择四种回归模型中的一种,选择不同的回归模型,其中剩余标准差最接近于零的模型回归效果最好.rstool的输出是一个交互式画面,画面中有m个图的27多元回归分析-2课件28例3设某商品的需求量与消费者的平均收入、商品价格的统计数据如下,建立回归模型,预测平均收入为1000,价格为6时的商品需求量.
需求量10075807050收入10006001200500300价格57668需求量659010011060收入400130011001300300价格75439例3设某商品的需求量与消费者的平均收入、商需求量1007529选择纯二次模型,即数据输入x1=[1000,600,1200,500,300,400,1300,1100,1300,300];x2=[5,7,6,6,8,7,5,4,3,9];y=[100,75,80,70,50,65,90,100,110,60]';x=[x1'x2'];回归、检验与预测rstool(x,y,'purequadratic')选择纯二次模型,即数据输入x1=[1000,600,120030化为多元线性回归求解x1=[1000,600,1200,500,300,400,1300,1100,1300,300];x2=[5,7,6,6,8,7,5,4,3,9];y=[100,75,80,70,50,65,90,100,110,60]';X=[ones(10,1)x1'x2'(x1.^2)'(x2.^2)'];[b,bint,r,rint,stats]=regress(y,X)化为多元线性回归求解x1=[1000,600,1200,5031回归系数的点估计以及区间估计回归系数的点估计以及区间估计32残差及其置信区间残差及其置信区间33检验回归模型的统计量检验回归模型的统计量34逐步回归分析
在实际问题中,影响因变量的因素很多,而这些因素之间可能存在多重共线性.为得到可靠的回归模型,需要一种方法能有效地从众多因素中挑选出对因变量贡献大的因素.
如果采用多元线性回归分析,回归方程稳定性差,每个自变量的区间误差积累将影响总体误差,预测的可靠性差、精度低;另外,如果采用了影响小的变量,遗漏了重要变量,可能导致估计量产生偏倚和不一致性.逐步回归分析在实际问题中,影响因变量的因素很多,而这些35选择“最优”回归方程的方法
1.从所有可能的变量组合的回归方程中选择最优者;
2.从包含全部变量的回归方程中逐次剔除不显著因子;
3.从一个变量开始,把变量逐个引入方程;
4.“有进有出”的逐步回归分析.
“最优”的回归方程应该包含所有有影响的变量而不包括影响不显著的变量.选择“最优”回归方程的方法1.从所有可能的变量组合的回归36
逐步回归分析法在筛选变量方面比较理想,是目前较常用的方法.它从一个自变量开始,根据自变量作用的显著程度,从大到小地依次逐个引入回归方程,但当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉.引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步,对于每一步,都进行检验,以确保每次引入新的显著性变量前回归方程中只包含作用显著的变量.
反复进行上面的过程,直到没有不显著的变量从回归方程中剔除,也没有显著变量可引入到回归方程.逐步回归分析法在筛选变量方面比较理想,是反复进行上37函数:
stepwise用法:
stepwise(x,y,inmodel,alpha)符号说明:x—自变量数据,为n×m矩阵;y—因变量数据,为n×1矩阵;inmodel—由矩阵x列的指标构成,表明初始模型中引入的自变量,默认为全部自变量;alpha—判断模型中每一项显著性的指标,默认相当于对回归系数给出95%的置信区间.函数:stepwise用法:stepwise(x,y,i38例4水泥凝固时放出的热量y与水泥中的四种化学成分x1,x2,x3,x4有关,今测得一组数据如下,试用逐步回归法确定一个线性模型.序号1234567226295631525571x3615886917x46052204733226y78.574.3104.387.695.9109.2102.7序号8910111213x1122111110x2315447406668x3221842398x4442226341212y72.593.1115.983.8113.3109.4例4水泥凝固时放出的热量y与水泥中的四种化序号123439x1=[7,1,11,11,7,11,3,1,2,21,1,11,10]';x2=[26,29,56,31,52,55,71,31,54,47,40,66,68]';x3=[6,15,8,8,6,9,17,22,18,4,23,9,8]';x4=[60,52,20,47,33,22,6,44,22,26,34,12,12]';y=[78.5,74.3,104.3,87.6,95.9,109.2,102.7,72.5,93.1,115.9,83.8,113.3,109.4]';x=[x1,x2,x3,x4];输入数据stepwise(x,y)逐步回归分析x1=[7,1,11,11,7,11,3,1,2,21,1,40stepwise(x,y)逐步回归分析stepwise(x,y)逐步回归分析41对变量y和x1,x2,x3,x4,
作线性回归.>>X=[ones(13,1),x1,x2,x3,x4];>>[b,bint,r,rint,stats]=regress(y,X)b=62.40541.55110.51020.1019-0.1441bint=-99.1786223.9893-0.16633.2685-1.15892.1792-1.63851.8423-1.77911.4910r=0.00481.5112-1.6709-1.72710.25083.9254-1.4487-3.17501.37830.28151.99100.9730-2.2943rint=-4.03904.0485-3.23316.2555-5.31261.9707-6.56033.1061-4.57735.0788-0.56238.4132-6.07673.1794-6.89630.5463-3.54266.2993-3.00983.5729-2.23726.2191-4.13386.0797-6.91152.3228stats=0.9824111.47920.00005.9830对变量y和x1,x2,x3,x4,作线42对变量y和x1,x2作线性回归.X=[ones(13,1),x1,x2];[b,bint,stats]=regress(y,X)回归模型为三个统计量表明:回归效果显著.对变量y和x1,x2作线性回归.X=[ones(43对变量y和x1,x2作线性回归.>>x=[x1,x2];>>stepwise(x,y)对变量y和x1,x2作线性回归.>>x=[x44四、小结1.多元线性回归的数学模型2.数学模型的分析与求解四、小结1.多元线性回归的数学模型2.数学模型的分析与求解453.MATLAB中回归分析的实现(1)多元线性回归b=regress(Y,X)(2)一元多项式回归[p,S]=polyfit(x,y,m)(3)多元二项式回归rstool(x,y,’model’,alpha)(4)逐步回归分析stepwise(x,y,inmodel,alpha)3.MATLAB中回归分析的实现(1)多元线性回归b=reg46一、多元线性回归的数学模型二、数学模型的分析与求解三、MATLAB中回归分析的实现四、小结多元线性回归一、多元线性回归的数学模型二、数学模型的分析与求解三、MAT47一、多元线性回归的数学模型一、多元线性回归的数学模型48多元线性回归模型多元线性回归模型49用最大似然估计法估计参数.达到最小.二、数学模型的分析与求解用最大似然估计法估计参数.达到最小.二、数学模型的分析与求解50化简可得化简可得51正规方程组正规方程组52引入矩阵正规方程组的矩阵形式引入矩阵正规方程组的矩阵形式53最大似然估计值P元经验线性回归方程最大似然估计值P元经验线性回归方程54多元线性回归
1.确定回归系数的点估计值,用命令:
b=regress(Y,X)2.求回归系数的点估计和区间估计,并检验回归模型,用命令:
[b,bint,r,rint,stats]=regress(Y,X,alpha)3.画出残差及其置信区间,用命令:
rcoplot(r,rint)三、MATLAB中回归分析的实现多元线性回归1.确定回归系数的点估计值,用命令:2.55符号说明(1)符号说明(1)56(2)
alpha为显著性水平,默认为0.05;(3)
bint为回归系数的区间估计;(4)
r与rint分别为残差及其置信区间;
(5)
stats是用于检验回归模型的统计量,有三个数值,第一个是相关系数
r2,其值越接近于1,说明回归方程越显著;第二个是
F值,
F>F1-alpha(p,n-p-1)时拒绝H0,F越大,说明回归方程越显著;第三个是与F对应的概率
p,p<alpha时拒绝,回归模型成立.(2)alpha为显著性水平,默认为0.05;(3)57身高143145146147149150153154腿长8885889192939395身高155156157158159160162164腿长969897969899100102例1测得16组的身高和腿长如下(单位:cm):试研究这些数据之间的关系.身高143145146147149150153154腿长8858输入数据x=[143,145,146,147,149,150,153,154,155,156,157,158,159,160,162,164]’;X=[ones(16,1),x];Y=[88,85,88,91,92,93,93,95,96,98,97,96,98,99,100,102]’;回归分析及检验[b,bint,r,rint,stats]=regress(Y,X);b,bint,stats输入数据x=[143,145,146,147,149,15059多元回归分析-2课件60多元回归分析-2课件61一元多项式回归1.确定多项式系数,用命令:
[p,S]=polyfit(x,y,m)也可使用命令:polytool(x,y,m)
结果产生一个交互式的画面,画面中有拟合曲线和y的置信区间,左下方的Export可以输出参数.一元多项式回归1.确定多项式系数,用命令:也可使用命令:622.预测和预测误差估计用命令:求回归多项式在x处的预测值Y.[Y,DELTA]=polyconf(p,x,S,alpha)
求回归多项式在x处的预测值Y以及预测值的显著性为1-alpha的置信区间Y±DELTA,alpha的默认值是0.05.一元多项式回归可化为多元线性回归求解.Y=polyval(p,x)2.预测和预测误差估计用命令:求回归多项式在x处的预测值Y.63例2下面给出了某种产品每件平均单价Y(元)与批量x(件)之间的关系的一组数据.x202530354050y1.811.701.651.551.481.40x606570758090y1.301.261.241.211.201.18试用一元二次多项式进行回归分析.例2下面给出了某种产品每件平均单价Y(元)与x202564输入数据x=[20,25,30,35,40,50,60,65,70,75,80,90];y=[1.81,1.70,1.65,1.55,1.48,1.40,1.30,1.26,1.24,1.21,1.20,1.18];作二次多项式回归[p,S]=polyfit(x,y,2)预测及作图Y=polyconf(p,x,y)plot(x,y,’b+’,x,Y,’r’)输入数据x=[20,25,30,35,40,50,60,6565作二次多项式回归[p,S]=polyfit(x,y,2)>>p=polyfit(x,y,2)p=0.0001-0.02252.1983Y=polyval(p,x)Y=1.79781.71341.63521.56321.49751.38481.29721.26271.23451.21261.19691.1843作二次多项式回归[p,S]=polyfit(x,y,2)>>66预测及作图Y=polyconf(p,x,y)plot(x,y,’b+’,x,Y,’r’)Y=polyconf(p,x,y)Y=1.79781.71341.63521.56321.49751.38481.29721.26271.23451.21261.19691.1843预测及作图Y=polyconf(p,x,y)Y=polyco67预测及作图polytool(x,y,2)预测及作图polytool(x,y,2)68预测及作图polytool(x,y,2)[p,S]=polyfit(x,y,2);[Y,DELTA]=polyconf(p,x,S,0.05)Y=1.79781.71341.63521.56321.49751.38481.29721.26271.23451.21261.19691.1843DELTA=0.03350.03110.02990.02960.02970.03020.03020.02990.02970.02970.03050.0354预测及作图polytool(x,y,2)[p,S]=poly69化为多元线性回归X=[ones(12,1)x’(x.^2)’];X=120400125625130900135122514016001502500160360016542251704900175562518064001908100化为多元线性回归X=[ones(12,1)x’(x.^270化为多元线性回归X=[ones(12,1)x’(x.^2)’];[b,bint,r,rint,stats]=regress(y’,X);b,stats与前面的结果一致.化为多元线性回归X=[ones(12,1)x’(x.^271多元二项式回归rstool(x,y,’model’,alpha)
其中,输入数据
x,y分别为n×m矩阵和n维列向量;
alpha为显著性水平,默认为0.05;
model为下列四种模型中的一种,输入相应的字符串,默认为线性模型.多元二项式回归rstool(x,y,’model’,alph72
rstool的输出是一个交互式画面,画面中有m个图形,分别给出了一个独立变量xi与y的拟合曲线,以及y的置信区间,此时其余m-1个变量取固定值.可以输入不同的变量的不同值得到y的相应值.
图的左下方有两个下拉式菜单,一个用于传送回归系数、剩余标准差、残差等数据;另一个用于选择四种回归模型中的一种,选择不同的回归模型,其中剩余标准差最接近于零的模型回归效果最好.rstool的输出是一个交互式画面,画面中有m个图的73多元回归分析-2课件74例3设某商品的需求量与消费者的平均收入、商品价格的统计数据如下,建立回归模型,预测平均收入为1000,价格为6时的商品需求量.
需求量10075807050收入10006001200500300价格57668需求量659010011060收入400130011001300300价格75439例3设某商品的需求量与消费者的平均收入、商需求量1007575选择纯二次模型,即数据输入x1=[1000,600,1200,500,300,400,1300,1100,1300,300];x2=[5,7,6,6,8,7,5,4,3,9];y=[100,75,80,70,50,65,90,100,110,60]';x=[x1'x2'];回归、检验与预测rstool(x,y,'purequadratic')选择纯二次模型,即数据输入x1=[1000,600,120076化为多元线性回归求解x1=[1000,600,1200,500,300,400,1300,1100,1300,300];x2=[5,7,6,6,8,7,5,4,3,9];y=[100,75,80,70,50,65,90,100,110,60]';X=[ones(10,1)x1'x2'(x1.^2)'(x2.^2)'];[b,bint,r,rint,stats]=regress(y,X)化为多元线性回归求解x1=[1000,600,1200,5077回归系数的点估计以及区间估计回归系数的点估计以及区间估计78残差及其置信区间残差及其置信区间79检验回归模型的统计量检验回归模型的统计量80逐步回归分析
在实际问题中,影响因变量的因素很多,而这些因素之间可能存在多重共线性.为得到可靠的回归模型,需要一种方法能有效地从众多因素中挑选出对因变量贡献大的因素.
如果采用多元线性回归分析,回归方程稳定性差,每个自变量的区间误差积累将影响总体误差,预测的可靠性差、精度低;另外,如果采用了影响小的变量,遗漏了重要变量,可能导致估计量产生偏倚和不一致性.逐步回归分析在实际问题中,影响因变量的因素很多,而这些81选择“最优”回归方程的方法
1.从所有可能的变量组合的回归方程中选择最优者;
2.从包含全部变量的回归方程中逐次剔除不显著因子;
3.从一个变量开始,把变量逐个引入方程;
4.“有进有出”的逐步回归分析.
“最优”的回归方程应该包含所有有影响的变量而不包括影响不显著的变量.选择“最优”回归方程的方法1.从所有可能的变量组合的回归82
逐步回归分析法在筛选变量方面比较理想,是目前较常用的方法.它从一个自变量开始,根据自变量作用的显著程度,从大到小地依次逐个引入回归方程,但当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉.引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步,对于每一步,都进行检验,以确保每次引入新的显著性变量前回归方程中只包含作用显著的变量.
反复进行上面的过程,直到没有不显著的变量从回归方程中剔除,也没有显著变量可引入到回归方程.逐步回归分析法在筛选变量方面比较理想,是反复进行上83函数:
stepwise用法:
stepwise(x,y,inmodel,alpha)符号说明:x—自变量数据,为n×m矩阵;y—因变量数据,为n×1矩阵;inmodel—由矩阵x列的指标构成,表明初始模型中引入的自变量,默认为全部自变量;alpha—判断模型中每一项显著性的指标,默认相当于对回归系数给出95%的置信区间.函数:stepwise用法:stepwise(x,y,i84例4水泥凝固时放出的热量y与水泥中的四种化学成分x1,x2,x3,x4有关,今测得一组数据如下,试用逐步回归法确定一个线性模型.序号1234567226295631525571x3615886917x46052204733226y78.574.3104.387.695.9109.2102.7序号8910111213x1122111110x2315447406668x3221842398x4442226341212y72.593.1115.983.8113.3109.4例4水泥凝固时放出的热量y与水泥中的四种化序号123485x1=[7,1,11,11,7,11,3,1,2,21,1,11,10]';x2=[26,29,56,31,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 孩子作业奖励协议书
- 餐饮保险免责协议书
- 公安调解诈骗协议书
- 车辆违章违法协议书
- 购买狗狗协议书范本
- 护罩设计技术协议书
- 房租装修协议书范本
- 保洁责任承包协议书
- 房屋无偿划拨协议书
- 合约婚姻结婚协议书
- 土方回填施工记录表
- 旋挖钻机基坑支护工程施工隐患排查治理清单
- 空调维保质量保障体系及措施方案
- 平面向量在三角函数中的应用(学案)
- 中药的道地药材课件
- 幼儿园《3-6岁儿童学习与发展指南》健康领域知识试题及答案
- 国家职业技能标准 (2021年版) 婴幼儿发展引导员
- 幼儿园小班科学:《小鸡和小鸭》 PPT课件
- 伯努利方程-ppt课件
- 年产20吨阿齐沙坦原料药生产车间的设计和实现材料学专业
- 电子公章模板
评论
0/150
提交评论