版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
回归模型1建立实际回归模型的过程实际问题设置指标变量解释变量的重要性;不相关性;用相近的变量代替或几个指标复合;个数适当——这个过程需反复试算收集整理数据时间序列数据:随机误差项的序列相关,如人们的消费习惯横截面数据:随机误差项的异方差性,如居民收入与消费样本容量的个数应比解释变量个数多缺失值,异常值处理构造理论模型绘制yi
与xi的样本散点图,如生产函数、投资函数、需求函数估计模型参数——最小二乘,偏最小二乘,主成分回归等,依靠软件.模型检验——统计检验和模型经济意义检验,从设置指标变量修改模型运用经济因素分析、经济变量控制、经济决策预测2线性回归实例选讲--牙膏的销售量
1.问题建立牙膏销售量与价格、广告投入之间的模型;预测在不同价格和广告费用下的牙膏销售量.收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其他厂家同类牙膏的平均售价.9.260.556.804.253.70307.930.055.803.853.8029
8.510.256.754.003.7527.38-0.055.503.803.851销售量(百万支)价格差(元)广告费用(百万元)其他厂家价格(元)本公司价格(元)销售周期3明确问题-----牙膏的销售量确定关系:牙膏销售量——价格、广告投入内部规律复杂
数据统计分析常用模型
回归模型
×
数学原理
软件30个销售周期数据:销售量、价格、广告费用、同类产品均价销售周期公司价(元)它厂价(元)广告(百万元)价差(元)销售量(百万支)13.853.805.50-0.057.3823.754.006.750.258.51………………293.803.855.800.057.93303.704.256.800.559.2642.基本模型x2yx1yy~公司牙膏销售量x1~其它厂家与本公司价格差x2~公司广告费用解释变量(回归变量,自变量)被解释变量(因变量)
多元回归模型5Matlab
统计分析rcoplot(r,rint)残差及其置信区间作图[b,bint,r,rint,stats]=regress(y,X,alpha)statisticstoolbox解释变量:矩阵显著性水平:0.05
系数
估计值
置信区间
残差向量y-xb
置信区间
被解释变量:列检验统计量:R2,F,p,s2随机误差:正态分布均值为零回归系数x=3.模型求解由数据y,x1,x2估计
x=[ones(size(x1)),x1,x2,x2.^2];[b,bint,r,rint,stats]=regress(y,x)程序64.结果分析参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p<0.0001s2=0.0490
0
1
2
3,故x22项显著但可将x2保留在模型中即:y的90.54%可由模型确定、F远超过F检验的临界值、p远小于
=0.05显著性:整体显著x2
:
2置信区间包含零点,但右端点距零点很近
——x2对因变量y的影响不太显著;
3
显著7控制价格差x1=0.2元,投入广告费x2=6.5百万元销售量预测区间为[7.8230,8.7636](置信度95%)上限用作库存管理的目标值下限用来把握公司的现金流若估计x3=3.9,设定x4=3.7(百万支)销售量预测价差x1=它厂价x3-公司价x4估计x3,调整x4控制x1预测y得则可以95%的把握知道销售额在7.8320
3.7
29(百万元)以上85.模型改进x1和x2对y的影响独立
参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p<0.0001s2=0.0426
0
1
2
3参数参数估计值置信区间29.1133[13.701344.5252]11.1342[1.977820.2906]-7.6080[-12.6932-2.5228]0.6712[0.25381.0887]-1.4777[-2.8518-0.1037]R2=0.9209F=72.7771p<0.0001s2=0.0490
3
0
1
2
4x1和x2对y的影响有交互作用比较:置信区间,R29比较:两模型销售量预测控制价格差x1=0.2元,投入广告费x2=6.5百万元(百万支)区间[7.8230,8.7636]区间[7.8953,8.7592](百万支)预测区间长度更短
略有增加
10x2=6.5x1=0.2x1x1x2x26.比较:两模型与x1,x2的关系11讨论:交互作用影响价格差x1=0.1价格差x1=0.3广告投入
y
(x2大于6百万元)价格差较小时增加的速率更大x2价格优势
y
价格差较小
广告作用大x1x212多元二项式回归命令:rstool(x,y,’model’,alpha)nm矩阵显著性水平(缺省时为0.05)n维列向量13完全二次多项式模型MATLAB中有命令rstool直接求解从输出Export可得鼠标移动十字线(或下方窗口输入)可改变x1,x2,左边窗口显示预测值及预测区间Rstool(x,y,’model’,alpha,’xname’,’yname’)14牙膏的销售量建立统计回归模型的基本步骤根据已知数据从常识和经验分析,辅之以作图,
决定回归变量及函数形式(先取尽量简单的形式).用软件(如MATLAB统计工具箱)求解.对结果作统计分析:R2,F,p,s2是对模型整体评价,
回归系数置信区间是否含零点检验其影响的显著性.
模型改进,如增添二次项、交互项等.对因变量进行预测.15非线性回归实例选讲--酶促反应
问题研究酶促反应(酶催化反应)中——嘌呤霉素(处理与否)——对反应速度与底物(反应物)浓度之间关系的影响.酶促反应由酶作为催化剂催化进行的化学反应生物体内的化学反应绝大多数属于酶促反应酶促反应中酶作为高效催化剂使得反应以极快的速度(103~1017倍)或在一般情况下无法反应的条件下进行酶是生物体内进行各种化学反应最重要的因素16建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系设计了两个实验酶经过嘌呤霉素处理酶未经嘌呤霉素处理实验数据:底物浓度(ppm)0.020.060.11反应速度处理764797107123139未处理6751848698115底物浓度(ppm)0.220.561.10反应速度处处理131124144158160/方案17经嘌呤霉素处理xy未经嘌呤霉素处理xyxy0
1
1/2
2
2
(半速度点)分析Michaelis-Menten模型待定系数
=(
1
,2)基本模型酶促反应的速度底物浓度酶促反应的基本性质底物浓度较小时,反应速度大致与浓度成正比;底物浓度很大、渐进饱和时,反应速度趋于固定值数据分析18解决方案一:线性化模型
经嘌呤霉素处理后实验数据的估计结果
参数参数估计值(×10-3)置信区间(×10-3)
15.107[3.5396.676]
20.247[0.1760.319]R2=0.8557F=59.2975p<0.0001对
1
,2非线性
对
1,
2线性
19线性化模型结果分析
x较大时,y有较大偏差1/x较小时有很好的线性趋势,1/x较大时出现很大的起落
1/y1/xxy线性化:参数估计时x较小(1/x很大)的数据控制了回归参数的确定改进:非线性模型20beta的置信区间[beta,R,J]=nlinfit(x,y,’model’,beta0)
回归分析:非线性解释变量:矩阵模型的函数M文件名参数估计值残差参数初值被解释变量:列估计预测误差的Jacobi矩阵betaci=nlparci(beta,R,J)解决方案二:非线性化模型
21[beta,R,J]=nlinfit(x,y,’model’,beta0)%beta的置信区间MATLAB统计工具箱
functiony=f1(beta,x)y=beta(1)*x./(beta(2)+x);x==…………;y=…………;beta0=[195.80270.04841];[beta,R,J]=nlinfit(x,y,’f1’,beta0);betaci=nlparci(beta,R,J);beta,betaci
beta0~线性化模型估计结果Matlab
程序22半速度点(达到最终速度一半时的底物浓度x值
)为o~原始数据+~拟合结果
非线性模型结果分析参数参数估计值置信区间
1212.6819[197.2029,228.1609]
20.0641[0.04570.0826]其他输出命令nlintool
给出交互画面最终反应速度为给出交互画面拖动画面的十字线,得y的预测值和预测区间画面左下方的Export输出其它统计结果。剩余标准差s=10.933723在同一模型中考虑嘌呤霉素处理的影响,用未经嘌呤霉素处理的模型附加增量的方法。混合反应模型底物浓度示性变量x2示性变量:x2=1表示经过处理,x2=0表示未经处理未经处理的最终反应速度经处理后最终反应速度增长值未经处理的反应的半速度点经处理后反应的半速度点增长值24用nlinfit
和nlintool命令参数初值:基于对数据的分析
o~原始数据+~拟合结果估计结果和预测剩余标准差s=10.4000参数估计值置信区间
1160.2802[145.8466174.7137]
20.0477[0.03040.0650]
152.4035[32.413072.3941]
20.0164[-0.00750.0403]
2置信区间包含零点,表明
2对因变量y的影响不显著经嘌呤霉素处理的作用不影响半速度点参数未经处理经处理混合模型求解25简化的混合模型
估计结果和预测参数估计值置信区间
1166.6025[154.4886178.7164]
20.0580[0.04560.0703]
142.0252[28.941955.1085]简化的混合模型形式简单参数置信区间不含零点剩余标准差s=10.5851,比一般混合模型略大o~原始数据+~拟合结果未经处理经处理26实际值一般模型预测值Δ(一般
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2134电大成本会计历年真题及答案
- 彩妆知识培训课件图片
- 2024食品配料研发实验室员工保密条款合同范本3篇
- 2025年度企业IT运维外包服务及数据备份恢复合同3篇
- 福建省南平市岚下中学2020年高三英语期末试卷含解析
- 2024瓷砖经销商墙地砖销售合同
- 2024年小班区域教案
- 2025年度交通安全责任协议范本3篇
- 2024铝材行业信息化建设与数据共享合同3篇
- 2024高层次人才聘用协议书
- 申论公务员考试试题与参考答案(2024年)
- DB4101T 9.1-2023 反恐怖防范管理规范 第1部分:通则
- 2024-2030年中国公安信息化建设与IT应用行业竞争策略及投资模式分析报告
- 2024年加油站场地出租协议
- 南宁房地产市场月报2024年08月
- 2024年金融理财-担保公司考试近5年真题附答案
- 高中语文古代文学课件:先秦文学
- 人教版五年级上册递等式计算100道及答案
- 文娱产业政策与发展趋势
- 集团公司2024年度内控评价工作方案
- 20以内加减法口算练习题带括号填空135
评论
0/150
提交评论