回归分析案例_第1页
回归分析案例_第2页
回归分析案例_第3页
回归分析案例_第4页
回归分析案例_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、身高0.750.850.951.081.121.161.351.511.551.61.631.671.711.781.85体重101215172022354148505154596675Matlab 实现:h=0.75 0.85 0.95 1.08 1.12 1.16 1.35 1.51 1.55 1.6 1.63 1.67 1.71 1.78 1.85;m=10 12 15 17 2022 35 41 48 50 51 54 59 66 75;plot(x,y,*)可令: m dha,求系数可用 p=polyfit(x,y,n),其中 y in m,x In h ,n=1,结果:p=2.3,

2、2.823由此得2 3d=16.8,a=2.3,即有经验公式:m 16.8h .。也直接利用Matlab统计工具箱中的命令regress求解,使用格式:b,bint,r,rint,stats=regress(y,x,alpha)alpha 为置信水平,r 为残差向量 y x ?,stats 为回归模型的检验统计量,有 3个值,第一个是回归方程的决定系数R2,第二个是F统计量值,第三个是与F统计量对应的概率值 p。上例可如下操作:y=log(m);x=o nes(le ngth(y),1),log(h);b,b in t,r,ri nt,stat=regress(y,x)b =2.82282.3

3、000stat =10240.0000残差分析:rcoplot(r,ri nt)例2:施肥效果分析(1992建模赛题) 磷肥施用量(吨/公顷)与土豆产量:磷肥施用量024497398147196245294342土豆产量33.4632.4736.0637.9641.0440.0941.2642.1740.3642.73y(0)、y(24)是病态数据,以线性插值代替:磷肥施用量024497398147196245294342土豆产量33.4634.7636.0637.9641.0440.0941.2642.1740.3642.73氮肥施用量(吨/公顷)与土豆产量:氮肥施用量02449739814

4、7196245294342土豆产量33.4634.7636.0637.9641.0440.0941.2642.1740.3642.731)模型选择:对于磷肥-土豆:可选择函数cxyx 或威布尔函数 y A Be ,x 0a be对于氮肥-土豆:可选择函数2 yb0b|X b2x , x 02)模型的参数估计:可如下操作:x=0 34 67 101 135 202 259 336 404 471;y=15.18 21.36 25.72 32.29 34.03 39.45 43.15 43.46 40.83 30.75;土豆 40E11+1*T1-1*35.+呻卜30-一25-一加-15-一ir-

5、一-一1 1050100150230250300350X=o nes(le ngth(y),1),x,x.A2; b,bi nt,r,ri nt,stat=regress(y,X) b =14.74160.1971-0.0003土豆产量如353D25201&105050100150200250300350400450氮肥施用量stat =0.9863 251.79710.0000即 y 14.74160.1971x0.0003x2拟合曲线图:3)显著性检验:(仅以氮肥-土豆模型为例说明)A):回归方程的显著性检验:检验的概率p=0,说明方程是高度显著的.B):回归系数的的显著性检验:对 1 :

6、 H 10:10检验统计量T2539.10825802353对 2 : H 20:20检验统计量T-1004341.84343142都有 Tt.05(7) 1.8945,所以,均应拒绝原假设,认为系数i(i 1,2)显著地不为0.4)残差诊断:标准化残差图如下1.510.5 l0 -0.5 -1 -1.5-2-2.51234578910标准化残差基本上均匀分布于-2至2之间,可以认为模型拟合是合理的案例:牙膏的销售量某牙膏制造企业要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等 之间的关系,从而预测出在不同价格和广告费用下的销售量。为此,销售部收集了过去30个销售周期公

7、司生产的牙膏的销售量、销售价格、广告费用,以及同期其他厂家生产的同类牙膏的平均销售价格。试根 据这些数据建立一个数学模型,分析牙膏销售量与其他因素的关系,为制定价格策略和广告投入策略提供 数量依据。销售公司销售价格其他厂家平均广告费用价格差(元)销售量(百万支)周期(元)价格(元)(百万兀)13.853.805.50-0.057.3823.754.006.750.258.5133.704.307.250.609.5243.703.705.500.007.5053.603.857.000.259.3363.603.806.500.208.2873.603.756.750.158.7583.803

8、.855.250.057.8793.803.655.25-0.157.10103.854.006.000.158.00113.904.106.500.207.89123.904.006.250.108.15133.704.107.000.409.10143.754.206.900.458.86153.754.106.800.358.90163.804.106.800.308.87173.704.207.100.509.26183.804.307.000.509.00193.704.106.800.408.75203.803.756.50-0.057.95213.803.756.25-0.057

9、.65223.753.656.00-0.107.27233.703.906.500.208.00243.553.657.000.108.50253.604.106.800.508.75263.654.256.800.609.21273.703.656.50-0.058.27283.753.755.750.007.67293.803.855.800.057.93303.704.256.800.559.26分析与假设:在购买同类产品的牙膏时,顾客会在意不同品牌之间的价格差异,而不是价格本身。 记牙膏销售量为y,价格差为xi,广告费x2,其它厂家平均价格X3,公司销售价格x4,xiy 01X1y对x

10、2用二次函数拟合:y20 1 x22x2基本模型:先作出y对x1及y对x2的散点X3X4。y图,图中y对xi线性关系明显:兀销售量)综合以上分析,建立如下模型:y 0 必2x23x;模型求解:利用 Matlab 统计工具箱的命令 regress,格式:b,bint,r,rint,stat=regress(y,X,alpha) 其中:X是数据矩阵1 x,x2x; (n 4)。结果:参数参数估计值参数置信区间017.32445.728228.920611.30700.68291.93112-3.6956-7.49890.107730.34860.03790.6594R20.9054F 82.940

11、9p 0.0000销售量预测方程:? ?0?2x2 ?3xf以及预测区间。取为0.2元,x2 6.5百万元,估计? 8.2933百万支,95%的预测区间7.8230,8.7636模型改进:上述模型中,是假定价格差*!与广告费X2对牙膏销售量y的影响是相互独立的,据直觉和经验可以猜想,*!与X2的交互作用会对牙膏销售量 y有影响,模型修改为:参数参数估计值参数置信区间029.113313.701344.5252111.13421.977820.29062-7.6080-12.6932-2.522830.67120.25381.08874-1.4777-2.8518-0.10372R 0.9209

12、F 72.7771p 0.0000y 01x14x1x22x223x2结果:有改善。进一步的讨论 为进一步了解X1与X2的交互作用,考察模型(2)的预测方程?29.1133 11.1342X17.6080x20.6712xf 1.4777X1X2如果取x10.1,可得y 30.22677.6080X20.67x2如果取x10.3,可得2?2 32.4535 8.0513X2 0.67x2图形如下(3)(4)10.51D9.598.5876解释: 完全二次多项式模型2 2y01 X12x23X1X2 4 X15 X2可直接利用 MATLAB统计箱中命令rstool求解。格式 rstool(X,y

13、) 其中X=x1 x2为n2数据矩阵。0.10 20.3 OJ asI -r-5.5Q6,5口诈酶促反应问题:某生化系学生为研究嘌呤酶素在某项酶促反应中对反应速度与底物(反应物)浓度之间关系 的影响,设计了两个实验,一个实验中所使用的酶是经过嘌呤酶素处理的,而另一个实验中所使用的酶是 没有经过嘌呤酶素处理的,试建立一个合适的数学模型,来反映这项酶促反应的速度与底物浓度以及嘌呤 酶素处理与否之间的关系底物浓度(ppm)0.020.060.110.220.561.10反应 速度处理764797107123139159152191201207200未处理67518486981151311241441

14、58160/分析与假设:记酶促反应的速度为y,底物浓度为x,二者之间的关系写作y f (x,),由问题背景知:当底物浓度较小时,反应速度与浓度成正比(一级反应);而当底物浓度很大,渐进饱和时,反应速度趋于一个固定值(零级反应),下面两个简单模型具有这种性质:Michaelis-Me nte n 模型y f(x,)2x(1)指数增长模型y f(x,)1(1e 2x)(2)以模型(1)来拟合。散点图如下:y220300180160140120100eo600.20.40.60.6y对乳经处理)的散点图160140120WOeoco0.20.40.60.6丫对狀未蛭处理)的散点图线性化模型 模型(i

15、)可通过如下的变量代换化为线性模型:11 2 1i2X(3)y i i x对经过嘌呤酶素处理的实验数据,应用模型(3),作线性回归,统计结果如下:参数参数估计值置信区间10.00510.00350.006720.00020.00020.0003R20.8557F 59.2975p 0.0000从而可算出 ? 195.8027?2 0.048411旳与1/胃的散点图和回归直线图用线性化得到的原始數据拟合图拟合欠佳!非线性模型及求解可以用非线性回归方法直接估计模型(1 )中的参数,利用 Matlab统计工具箱中的命令进行,使用格式为:beta,R,J=nlinfit(x,y, model ,bet

16、aO)其中输入x为自变量数据矩阵,每列一个变量;y为因变量数据向量;model为模型的M函数文件名,betaO为参数的初始值。将实际数据输入后执行以下程序:beta0=195.80 0.0484;beta,R,J=nlin fit(x,y,huaxue1,beta0);betaci=n lparci(beta,R,J);beta,betacixx=0:0.01:1.2;yy=beta(1)*xx./(beta(2)+xx);plot(x,y,*,xx,yy),nli ntool(x,y,huaxue1,beta)function y=huaxue1(beta,x)y=beta(1)*x./(b

17、eta(2)+x);对经过嘌呤酶素处理的实验数据,应用模型(1),作非线性回归,结果如下:参数参数估计值置信区间1212.6818197.2028228.160820.064140.04670.08257图形如下:用非线性回归得到的原始数据拟合團aaoinPidctedlY1QUS35710011.282250Ifxpcr*XI最终反应速度为?212.6818,达到最终反应速度一半时,底物的浓度(“半速度点”)为20.06412。混合反应模型嘌呤酶素处理会影响最终反应速度,而基本不影响半速度点2,考虑如下的混合反应模型:f(x,)(1必2)洛(22 X2 ) X1。(略)其中:X1为底物的浓度

18、,X2为一示性变量(0 1变量,处理与否用0 1表示)思考与练习:软件开发人员的薪金一高技术公司人事部门为研究软件开发人员的薪金与他们的资历、管理责任、教育程度等因素之间的关系,需依照收集的数据建立一数学模型。表中管理一列中1表示管理人员,0表示非管理人员,教育一 列中,1表示中学程度,2表示大学程度,3表示研究生(更高)。编号薪金y年数x1管理x2教育E1138761112116081033187011134112831025117671036208722127117722028105352019121952031012313302111497531112213713121319800313

19、1411417401152026341316132314031712884402181324550219136775032015965511211236660122213526132313839602编号薪金y年数x1管理x2教育E2422884612251697871126148038022717404811282218481329135488013014467100131159421002322317410133323780101234254101112351486111013616882120237241701213381599013013926330131240179491402412

20、568515134227837161243188381602441748316014519207170246193462001模型:y01 Xl2X23 E14Ei11如果第i人属于中学0否则Ei21如果第i人属于大学0否则2 1 Y=abX回归线为一条直线,它是一元曲线模型的特殊情况。当b0时,丫随X增大而线性增大(图 la );当bv 0时,丫随X增大而线性减小(图lb )。直线与丫轴的交点为(0, a)。2. 2 Y=aX当a0, 0 vbv l时,丫单调递增且下凹,曲线过原点;当 a0, bl时,y单调递增且 上凹,曲线过原A,(图2a);当a 0,b v 0时,丫随X增大单调递减上凹

21、,以X轴和丫 轴为渐近线(图 2b)。图 1-17 常用数学模型的示意曲线(图中未特别标注 a0)bX2 3 Y=aebX当a0, b 0时,丫随X增大单调递增上凹(图3a);当a0, b v0时,丫单调递减仍 上凹,并向X轴渐近。曲线与丫轴的交点为(0, a)(图3b)。2. 4 Y=aXe当a0, b 0时,丫随X增大而急速上升,曲线通过原点且上凹(图4a)。当a0, bv0时,在X的区间(0,-1/b)上,丫单调递增,曲线通过原点;在X=-1 /b时,丫max=-a/( be); 在X的区间(-1/b, +x)上,丫单调递减,其中,在区间(0, 2/b) 上,曲线下凹;在区 间(-2/b

22、 , +x)上,曲线上凹,向X轴渐近;拐点坐标为X=-2/b , 丫=-2a /(be2)(图4b)。2. 5 丫= aexp(b/X)当a0, b 0时,丫随X增大单调递减上凹,具有渐近线X= 0和丫二a (图5a)。当a0, bv 0时,丫单调递增;在X的区间(0, -2 /b)上,曲线上凹,且当X-0时,丫= 0; X= -2 /b, 丫二aexp (-b2/2 )为曲线拐点坐标;在X的开区间(-2/b, +*)上,曲线下凹,且以 Y=a为渐近线(图5b)。2. 6 丫= aexp(bX)此曲线关于丫轴对称。当a0, b 0时,有X=0,论尸a,曲线上凹(图6a),当a0, bv 0 时

23、,有极大点(0, a);点 X= (-0.5/b ) 0.5, 丫= a/e5 和 X=- (-0.5/b ) 0.5, Y=a/e5 为曲线的两个拐点(图 6b)。2. 7 丫= a+ blgX当b0时,丫随X增大单调递增(图7a);当bv0时,丫单调递减。曲线与X轴的交点坐a/b标为( 1 0-a/b , 0)(图 7b)。2. 8Y= a+b/X当a0, b 0时,曲线有渐近线X= 0和Y= a, 丫随X增大单调递减,且曲线上凹(图8a); 当a0, bv0时,丫单调递增,且曲线下凹,曲线与X轴的交点坐标为(-b/a , 0)(图8b)。2. 9 丫 =1/(a + bX)曲线上凹。当a

24、0, b 0时,丫 随X增大单调递减,以X轴为渐近线,曲线与丫轴的交点为(0, 1/a )(图9a);当a0, b v 0时丫单调递增,以X=-a/b为渐近线,曲线 与丫轴的交点坐标为(0, 1/a )(图9b);当av0, b 0时,丫单调递减,以丫二0和 Y=-a/b为渐近线(图9c)。2. 10 丫= X/(a + bX) 当a0, b 0时,曲线通过原点,丫 随X 增大单调递增,向丫二1/b渐近,曲线下凹(图10a);当a0,bv0时,曲线通过原点,丫 随X 增大单调递增且向X= -a/b渐 近,曲线上凹(图10b);当av 0,b0时,在X的区间(-a/b,+x)上丫取正值,且单 调

25、递减,曲线上凹,具有渐近线 X=-a/b和y二1/b (图10c)。2. 11 Y= 1/(a + beX)当a,b均大于零时,有水平渐近线 丫二O和丫二1/a;拐点坐标为X=-ln (a/b),y= 0.5 / a (图 11)。2. 12 Y=M-aebX为Mitscherlich增长曲线,M a,b均大于零。丫 随X增大单调递增,且上凸。当 X=O时,丫= M-a;心 时,丫=M(图 12)。2. 13 丫= M(l + ae-bX)为Logistic 增长曲线,M a,b均大于零。当 X +*时,Y=M。拐点坐标为X= (In a)/ b, Y=0.5M。拐点之前曲线上凹,拐点之后曲线

26、下凹。当X= 0时,丫二M/(1 + a)(图13)。2. 14 丫= Mbxp(-ae-bX)称为Gompertz增长曲线,M,a,b均大于零。拐点坐标为X= (In a)/b,Y = Me,拐点之前曲 线上凹,拐点之后曲线下凹。当 X-时,Y= M;当X=0时,丫=陆-3 (图14)。2. 15 Y=M(1-ae-bX)3称BertallanffY 增长曲线,M, a,b均大于零。拐点坐标为 X=ln(3 a)/ b,Y= 8M27。拐点 左侧曲线上凹,拐点右侧曲线下凹。当 X- 时,丫= M当x=0时,丫二M(1-a)3 (图15)。2. 16 Y=a+ bX+ cX2称为二次抛物线。a是曲线与丫轴交点之纵坐标。当cv 0时,曲线有一个极大点,曲线两 端斜向下方延伸(图16a);当c0时,曲线有一个极小点,两端斜向上方延伸。极点坐标 为X=-0.5 b/c,丫= (ac-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论