数学模型课件:第10章 统计回归模型_第1页
数学模型课件:第10章 统计回归模型_第2页
数学模型课件:第10章 统计回归模型_第3页
数学模型课件:第10章 统计回归模型_第4页
数学模型课件:第10章 统计回归模型_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章 统计回归模型10.1 牙膏的销售量10.2 软件开发人员的薪金10.3 酶促反应10.4 投资额与生产总值和物价指数10.5 教学评估10.6 冠心病与年龄回归模型是用统计分析方法建立的最常用的一类模型. 数学建模的基本方法机理分析测试分析通过对数据的统计分析,找出与数据拟合最好的模型. 不涉及回归分析的数学原理和方法 . 通过实例讨论如何选择不同类型的模型 . 对软件得到的结果进行分析,对模型进行改进. 由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型. 变量间的相互关系确定性的函数关系 Y=f (X)不确定性的统计关系相关关

2、系 Y= f(X)+ (为随机变量)没有关系 变量间关系的图形描述:坐标图(散点图)相关与回归分析的概念 从涉及的变量数量看 简单相关 多重相关(复相关)相关关系的类型 从变量相关关系的表现形式看 线性相关散布图接近一条直线(左图) 非线性相关散布图接近一条曲线(右图) 从变量相关的程度看 完全相关 (B) 不完全相关 (A) 不相关 (C)从变量相关关系变化的方向看 正相关变量同方向变化 同增同减 (A) 负相关变量反方向变化 一增一减 (B)ABC 回归的古典意义: 高尔顿遗传学的回归概念父母身高与子女身高的关系: 无论高个子或低个子的子女都有向人的平均身高回归的趋势 一个因变量对若干解释

3、变量依存关系的研究 回归的目的(实质):由固定的自变量去估计因变量的平均值样本总体自变量固定值估计因变量平均值回归的现代意义10.1 牙膏的销售量 问题建立牙膏销售量与价格、广告投入之间的模型;预测在不同价格和广告费用下的牙膏销售量. 收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其他厂家同类牙膏的平均售价 .9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851销售量(百万支)价格差(元)广告费用(百万元)其他厂家价格(元)本公司价格(元)销售周期基本模型y

4、公司牙膏销售量x1其他厂家与本公司价格差x2公司广告费用x2yx1yx1, x2解释变量(回归变量, 自变量) y被解释变量(因变量) 0, 1 , 2 , 3 回归系数 随机误差(均值为零的正态分布随机变量)MATLAB 统计工具箱 模型求解b,bint,r,rint,stats=regress(y,x,alpha) 输入 x= n4数据矩阵, 第1列为全1向量alpha(置信水平,0.05) b的估计值 bintb的置信区间 r 残差向量y-xb rintr的置信区间 Stats检验统计量 R2,F, p,s2 yn维数据向量输出 由数据 y,x1,x2估计参数参数估计值置信区间17.32

5、445.7282 28.92061.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p0.0001 s2=0.0490 0123结果分析y的90.54%可由模型确定 参数参数估计值置信区间17.32445.7282 28.92061.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p0.0001 s2=0.0490 0123F值远超过F检验的临界值 p值远小于=0.05 2

6、的置信区间包含零点(右端点距零点很近) x2对因变量y 的影响不太显著x22项显著 可将x2保留在模型中 模型从整体上看成立销售量预测 价格差x1=其他厂家价格x3-本公司价格x4估计x3调整x4控制价格差x1=0.2元,投入广告费x2=6.5百万元销售量预测区间为 7.8230,8.7636(置信度95%)上限用作库存管理的目标值 下限用来把握公司的现金流 若估计x3=3.9,设定x4=3.7,则可以95%的把握知道销售额在 7.82303.7 29(百万元)以上控制x1通过x1, x2预测y(百万支)模型改进x1和x2对y的影响独立 参数参数估计值置信区间17.32445.7282 28.

7、92061.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p0.0001 s2=0.04260123参数参数估计值置信区间29.113313.7013 44.525211.13421.9778 20.2906 -7.6080-12.6932 -2.5228 0.67120.2538 1.0887 -1.4777-2.8518 -0.1037 R2=0.9209 F=72.7771 p0.0001 s2=0.049030124x1和x2对y的影响有交互作用两模型销售量预测比较预测区间

8、 7.8230,8.7636预测区间 7.8953,8.7592 控制价格差x1=0.2元,投入广告费x2=6.5百万元预测区间长度更短 略有增加 预测值预测值x2=6.5x1=0.2 x1x1x2x2两模型 与x1,x2关系的比较交互作用影响的讨论价格差 x1=0.1 价格差 x1=0.3加大广告投入使销售量增加 ( x2大于6百万元)价格差较小时增加的速率更大 x2价格优势会使销售量增加 价格差较小时更需要靠广告来吸引顾客的眼球 完全二次多项式模型 MATLAB中有命令rstool直接求解从输出 Export 可得鼠标移动十字线(或下方窗口输入)可改变x1, x2, 左边窗口显示预测值 及

9、预测区间牙膏的销售量 建立统计回归模型的基本步骤 根据已知数据从常识和经验分析, 辅之以作图, 决定回归变量及函数形式(先取尽量简单的形式). 用软件(如MATLAB统计工具箱)求解. 对结果作统计分析: R2,F, p, s2是对模型整体的评价, 回归系数置信区间是否含零点,用于检验回归变量 对因变量的影响是否显著. 模型改进, 如增添二次项、交互项等. 对因变量进行预测.10.2 软件开发人员的薪金资历 从事专业工作的年数;管理 1=管理人员,0=非管理人员;教育 1=中学,2=大学,3=更高程度.建立模型研究薪金与资历、管理责任、教育程度的关系.分析人事策略的合理性,作为新聘用人员薪金的

10、参考. 编号薪金资历管理教育0113876111021160810303187011130411283102编号薪金资历管理教育422783716124318838160244174831601451920717024619346200146名软件开发人员的档案资料 分析与假设 y 薪金,x1 资历(年)x2 = 1 管理人员,x2 = 0 非管理人员1=中学2=大学3=更高 资历每加一年,薪金的增长是常数; 管理、教育、资历之间无交互作用. 教育线性回归模型 a0, a1, , a4是待估计的回归系数,是随机误差 中学:x3=1, x4=0 ;大学:x3=0, x4=1; 更高:x3=0,

11、x4=0 假设模型求解参数参数估计值置信区间a011033 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994 -3826 -2162 a4148 -636 931 R2=0.9567 F=226 p0.0001 s2=106R2,F, p 模型整体上可用资历增加1年薪金增长546 管理人员薪金多6883 中学程度薪金比更高的少2994 大学程度薪金比更高的多148 a4置信区间包含零点,解释不可靠!中学:x3=1, x4=0;大学:x3=0, x4=1; 更高:x3=0, x4=0. x2 = 1 管理,x2 = 0 非管理x1资历(年)残差

12、分析方法 结果分析残差e 与资历x1的关系 e与管理教育组合的关系 残差全为正,或全为负,管理教育组合处理不当. 残差大概分成3个水平,6种管理教育组合混在一起,未正确反映.应在模型中增加管理x2与教育x3, x4的交互项 .组合123456管理010101教育112233管理与教育的组合进一步的模型增加管理x2与教育x3, x4的交互项参数参数估计值置信区间a01120411044 11363a1497486 508a270486841 7255a3-1727-1939 -1514a4-348-545 152a5-3071-3372 -2769a618361571 2101R2=0.9988

13、 F=554 p0.0001 s2=3104 R2,F有改进,所有回归系数置信区间不含零点,模型完全可用 消除了不正常现象 异常数据(33号)应去掉! e x1 e 组合去掉异常数据后的结果参数参数估计值置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-3056-3171 2942a619971894 2100R2= 0.9998 F=36701 p0.0001 s2=4103e x1 e 组合R2: 0.9567 0.99880.9998F:226 554 36701 s2:

14、 104 3104 4103置信区间长度更短残差图十分正常最终模型的结果可以应用模型应用 制订6种管理教育组合人员的“基础”薪金(资历为0)组合管理教育系数“基础”薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中学:x3=1, x4=0 ;大学:x3=0, x4=1; 更高:x3=0, x4=0 x1= 0; x2 = 1 管理,x2 = 0 非管理大学程度管理人员比更高程度管理人员的薪金高. 大学程度非管理人员比更高程度非管理人员的薪金略低. 对定性因素(如管理、

15、教育)可以引入0-1变量处理,0-1变量的个数可比定性因素的水平少1. 软件开发人员的薪金残差分析方法可以发现模型的缺陷,引入交互作用项常常能够改善模型. 剔除异常数据,有助于得到更好的结果.注:可以直接对6种管理教育组合引入5个0-1变量. 10.3 酶促反应 问题研究酶促反应(酶催化反应)中嘌呤霉素对反应速度与底物(反应物)浓度之间关系的影响. 建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系. 设计了两个实验 :酶经过嘌呤霉素处理;酶未经嘌呤霉素处理. 实验数据见下表. 方案底物浓度(ppm)0.020.060.110.220.561.10反应速度处理7647

16、97107123139159152191201207200未处理6751848698115131124144158160/基本模型 Michaelis-Menten模型y 酶促反应的速度, x 底物浓度 1 , 2 待定系数 底物浓度较小时,反应速度大致与浓度成正比;底物浓度很大、渐进饱和时,反应速度趋于固定值.酶促反应的基本性质 xyO1实验数据经嘌呤霉素处理xy未经嘌呤霉素处理xy线性化模型 经嘌呤霉素处理后实验数据的估计结果 参数参数估计值(10-3)置信区间(10-3)15.10723.5386 6.675820.24720.1757 0.3188R2=0.8557 F=59.2975

17、 p0.0001 s2=3.5806 10-6对1 , 2非线性 对1, 2线性 线性化模型结果分析 x较大时,y有较大偏差 1/x较小时有很好的线性趋势,1/x较大时出现很大的起落. 参数估计时,x较小(1/x很大)的数据控 制了回归参数的确定. 1/y1/xxybeta,R,J = nlinfit (x,y,model,beta0) beta的置信区间MATLAB 统计工具箱 输入 x自变量数据矩阵y 因变量数据向量beta 参数的估计值R 残差,J 估计预测误差的Jacobi矩阵 model 模型的函数M文件名beta0 给定的参数初值 输出 betaci =nlparci(beta,R

18、,J) 非线性模型参数估计function y=f1(beta, x)y=beta(1)*x./(beta(2)+x);x= ; y= ;beta0=195.8027 0.04841;beta,R,J=nlinfit(x,y,f1,beta0);betaci=nlparci(beta,R,J);beta, betaci beta0线性化模型估计结果 非线性模型结果分析参数参数估计值置信区间1212.6819197.2029 228.160920.06410.0457 0.0826 画面左下方的Export 输出其他统计结果.拖动画面的十字线,得y的预测值和预测区间剩余标准差s= 10.9337

19、最终反应速度为其他输出命令nlintool 给出交互画面o 原始数据+ 拟合结果 半速度点(达到最终速度一半时的x值 )为混合反应模型 x1为底物浓度, x2为一示性变量 x2=1表示经过处理,x2=0表示未经处理 1是未经处理的最终反应速度 1是经处理后最终反应速度的增长值 2是未经处理的反应的半速度点 2是经处理后反应的半速度点的增长值 在同一模型中考虑嘌呤霉素处理的影响o 原始数据+ 拟合结果 混合模型求解用nlinfit 和 nlintool命令估计结果和预测剩余标准差s=10.4000 参数参数估计值置信区间1160.2802145.8466 174.713720.04770.0304 0.0650 152.403532.4130 72.3941 20.0164-0.0075 0.04032置信区间包含零点,表明2对因变量y的影响

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论