版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、利用 Matlab作回归分析一元线性回归模型:2, (0, y x N =+求得经验回归方程:yx =+ 统计量: 总偏差平方和:21( n i i SST y =-,其自由度为 1T f n =-; 回归平方和:21( n i i SSR y =-,其自由度为 1R f =; 残差平方和:21( n i i i SSE y y =-,其自由度为 2E f n =-;它们之间有关系:SST=SSR+SSE。一元回归分析的相关数学理论可以参见概率论与数理统计教 程 ,下面仅以示例说明如何利用 Matlab 作回归分析。【例 1】 为了了解百货商店销售额 x 与流通费率 (反映商业活动 的一个质量
2、指标, 指每元商品流转额所分摊的流通费用 y 之间 的关系,收集了九个商店的有关数据,见下表 1. 试建立流通费 率 y 与销售额 x 的回归方程。表 1 销售额与流通费率数据 【分析】 :首先绘制散点图以直观地选择拟合曲线,这项工作可 结合相关专业领域的知识和经验进行, 有时可能需要多种尝试。 选定目标函数后进行线性化变换,针对变换后的线性目标函数 进行回归建模与评价,然后还原为非线性回归方程。【 Matlab 数据处理】 :【 Step1】 :绘制散点图以直观地选择拟合曲线x=1.5 4.5 7.5 10.5 13.5 16.5 19.5 22.5 25.5; y=7.0 4.8 3.6
3、3.1 2.7 2.5 2.4 2.3 2.2;plot(x,y,'-o' 输出图形见图 1。 510152025图 1 销售额与流通费率数据散点图根据图 1, 初步判断应以幂函数曲线为拟合目标, 即选择非 线性回归模型,目标函数为:(0 b y ax b =< 其线性化变换公式为:ln , ln v y u x = 线性函数为:ln v a bu =+【 Step2】 :线性化变换即线性回归建模(若选择为非线性模型 与模型评价% 线性化变换u=log(x'v=log(y'% 构造资本论观测值矩阵mu=ones(length(u,1 u;alpha=0.0
4、5;% 线性回归计算b,bint,r,rint,states=regress(v,mu,alpha输出结果:b = 2.1421; -0.4259表示线性回归模型 lnv a bu=+中:lna=2.1421, b=-0.4259; 即拟合的线性回归模型为y x=-;bint = 2.0614 2.2228; -0.4583 -0.3934表示拟合系数 lna 和 b 的 100(1-alpha%的置信区间分别为: 2.0614 2.2228和 -0.4583 -0.3934;r = -0.0235 0.0671 -0.0030 -0.0093 -0.0404 -0.0319 -0.0016
5、0.0168 0.0257表示模型拟合残差向量;rint = -0.0700 0.02300.0202 0.1140-0.0873 0.0813-0.0939 0.0754-0.1154 0.0347-0.1095 0.0457-0.0837 0.0805-0.0621 0.0958-0.0493 0.1007表示模型拟合残差的 100(1-alpha%的置信区间;states =0.9928 963.5572 0.0000 0.0012 表示包含 20.9928SSR R SST=、 方差分析的 F 统计量 /963.5572/(2R E SSR f SSR F SSE f SSE n =-
6、、 方差分析的显著性概率 (1,2 0p P F n F =-> 模型方差的估计值 20.00122SSE n =-。 【注】 :严格来讲,模型评价工作应在逆线性化变换后进行;但 是,若所建立的线性回归方程不理想,则相应的非线性回归方 程必定不理想。【 Step3】 :拟线性化变换求非线性回归方程(若选择为非线性 模型% 逆线性化变换A=exp(b(1B=b(2运行结果为:A = 8.5173; B = -0.4259。即非线性回归方程为:多元回归模型多元线性回归模型(p>1 :201122, (0, p p y x x x N =+求得经验回归方程:01122p py x x x
7、 =+ 统计量: 总偏差平方和:21( n i i SST y =-,其自由度为 1T f n =-; 回归平方和:21( n i i SSR y =-,其自由度为 R f p =; 残差平方和:21( n i i i SSE y y =-,其自由度为 1E f n p =-;它们之间有关系:SST=SSR+SSE。多元回归分析的相关数学理论可以参见多元数据分析 ,下面 仅以示例说明如何利用 Matlab 作多元回归分析。【例 2】参见教材 P294:10.1 牙膏的销售量。【下面只描述运行程序的过程,应该按照规定格式书写报告】 。 符号说明:1x :表示价格差;2x :广告费用;y :销售量
8、。【 Step1】 :绘制散点图以直观地选择拟合曲线clearclcx1=-0.05 0.25 0.60 0 0.25 0.20 0.15 0.05 -0.15 0.15 0.20 0.10 0.40 0.45 0.35 0.30 0.50 0.50 0.40 -0.05 -0.05 -0.10 0.20 0.10 0.50 0.60 -0.05 0 0.05 0.55;x2=5.50 6.75 7.25 5.50 7.00 6.50 6.75 5.25 5.25 6.00 6.506.25 7.00 6.90 6.80 6.80 7.10 7.00 6.80 6.50 6.25 6.00 6
9、.507.00 6.80 6.80 6.50 5.75 5.80 6.80;y=7.38 8.51 9.52 7.50 9.33 8.28 8.75 7.87 7.10 8.00 7.89 8.15 9.10 8.86 8.90 8.87 9.26 9.00 8.75 7.95 7.65 7.27 8.00 8.50 8.75 9.21 8.27 7.67 7.93 9.26;h1=figure;plot(x1,y,'+'h2=figure;plot(x2,y,'o' ;88.599.5 10图 1 y对 x1的散点图 图 2 y 对 x2的散点图分析图 1,可
10、以发现,随着 x1的增加, y 的值有比较明显的线 性增长趋势;分析图 2,当 x 增大时, y 有向上弯曲的趋势,可用二次多项式 进行逼近;因此可以选择如下方程作为初步的回归模型:220112232, (, y x x x N u =+【 Step2】 :模型求解 (理论方法:最小二乘法 alpha=0.05;v=ones(length(x1,1 x1' x2' (x2.2'b,bint,r,rint,stats=regress(y',v,alpha计算结果:b = 17.3244 1.3070 -3.6956 0.3486bint = 5.7282 28.9
11、2060.6829 1.9311-7.4989 0.10770.0379 0.6594r = -0.0988 -0.0795 -0.1195 -0.0441 0.4660 -0.0133 0.2912 0.2735-0.2351 0.1031 -0.4033 0.1747 0.0400 -0.1504 0.1284 0.1637-0.0527 -0.1907 -0.0870 -0.0165 -0.1292 -0.3002 -0.2933 -0.1679-0.2177 0.1116 0.3035 0.0693 0.2474 0.2270rint = -0.5270 0.3294; -0.5309
12、 0.3718; -0.5106 0.2716;-0.4731 0.3848; 0.0813 0.8507; -0.4609 0.4343;-0.1374 0.7197; -0.0870 0.6340; -0.59600.1258;-0.3280 0.5341; -0.8190 0.0125; -0.2618 0.6112;-0.4032 0.4832; -0.5933 0.2925; -0.3207 0.5775;-0.2841 0.6116; -0.4830 0.3776; -0.6248 0.2434;-0.5348 0.3609; -0.4423 0.4092; -0.5609 0.3
13、024;-0.7181 0.1177; -0.7243 0.1377; -0.5548 0.2190;-0.6449 0.2095; -0.2994 0.5226; -0.1037 0.7106;-0.3714 0.5099; -0.1807 0.6755; -0.1890 0.6430stats = 0.9054 82.9409 0.0000 0.0490【 Step3】结果分析回归模型为:x x x =+-+ 从结果数据来看,模型整体可用。但也有缺陷,可以改进。【 Step4】销售量的预测设需要预测的点为:001020(, , , ' p x x x x = ,则预测值为 0010
14、12020p py x x x =+记 *211, , , 1,2, , 1ni kik SSE xi p n p n=-1( ( T ij p p c X X -=,则在 0x 处的区间预测为:*00(1 (1 (1 , (1 yt n p y t n p -+- 【模型改进】 :当两个因素是不独立时,引入交叉项 12x x ,新的 回归模型为20112232412y x x x x x =+alpha=0.05;v=ones(length(x1,1 x1' x2' (x2.2' (x1.*x2' b,bint,r,rint,stats=regress(y
15、39;,v,alpha 输出结果:b = 29.1133 11.1342 -7.6080 0.6712 -1.4777 bint = 13.7013 44.5252; 1.9778 20.2906; -12.6932 -2.5228; 0.2538 1.0887; -2.8518 -0.1037r = -0.0441; -0.1229; 0.0299; -0.0745; 0.3841;-0.0472; 0.2331; 0.0287; -0.0661; 0.0297; -0.4372; 0.1763; 0.0356; -0.1382; 0.1027;0.1270; 0.0048; -0.1435
16、; -0.1016; 0.0050; -0.0389; -0.1334; -0.3272; -0.3274; -0.2102; 0.1412; 0.3250; 0.1096; 0.2342; 0.2455 rint = -0.4425 0.3542; -0.5408 0.2951;-0.3101 0.3698; -0.4736 0.3247;0.0245 0.7437; -0.4640 0.3695;-0.1674 0.6337; -0.2369 0.2943;-0.3751 0.2430; -0.3691 0.4284;-0.8118 -0.0627; -0.2306 0.5832;-0.3
17、788 0.4499; -0.5521 0.2757;-0.3172 0.5226; -0.2917 0.5456;-0.3944 0.4039; -0.5490 0.2621;-0.5193 0.3160; -0.3926 0.4026;-0.4360 0.3582; -0.5045 0.2378;-0.7212 0.0667; -0.6326 -0.0221;-0.6085 0.1881; -0.2398 0.5223;-0.0484 0.6984; -0.2988 0.5181;-0.1650 0.6335; -0.1391 0.6302stats = 0.9209 72.7771 0.
18、0000 0.0426结果分析:效果更好。逐步回归方法要点:【 Step1】 根据问题所属专业领域的理论和经验提出对因变量可 能有影响的所有自变量;【 Step2】计算每一个自变量对因变量的相关系数,按其绝对值 从大到小排序;【 Step3】取相关系数绝对值最大的那个自变量建立一元线性回 归模型, 检验所得回归方程的显著性, 若检验表明回归效果则转 入【 Step4】 , 若检验表明回归效果不显著则停止建模;【 Step4】进行变量的追加、剔除和回归方程的更新操作。 Matlab 命令:【命令 1】 :stepwisefit【调用格式】 :b,se,pval,inmodel,stats,nex
19、tstep,history=stepwisef it(x,y, param1 ,value1, param2 ,value2, 【参数说明】 :X :p 个自变量的 n 个观测值的 n p矩阵;Y :因变量的 n 个观测值的 1n 矩阵; penter :设置回归方程显著性检验的显著性概率上限,缺 省值为 0.05; premove :设置回归方程显著性检验的显著性概率下限, 缺省值为 0.10; display :用来指明是否强制显示建模过程信息,取值为 on (显示,缺省设置和 off (不显示 。例 4:某种水泥在凝固时放出的热量 (单位:卡 /克 Y 与水泥 中的四种化学成分所占的百分
20、比有关, 现测得 13组数据如下表: 作回归分析。【 Matlab 程序】 :clearclcload haldb,se,pval,inmodel,stats,nextstep,history=stepwisefit(ingredients,heat, 'penter' ,0.10, 'display' , 'off' ; % 自变量的筛选和模型参数估计信息 inmodel,b0=ercept,b % 回归方程显著性整体检验信息 Allp=stats.pval,rmse=stats.rmse % 回归方程显著性分别检验信息 P=stats.PVAL 输出结果:inmodel = 1 1 0 0; b0 = 52.5773;b = 1.4683 0.6623 0.2500 -0.2365; Allp = 4.4066e-009; rmse = 2.4063;P = 0.0000 0.0000 0.2089 0.2054。 结果分析:x x =+,回归方程显著性 整体检验和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 雅安市高2022级(2025届)高三“零诊”考试 语文试卷(含标准答案)
- 养老护理员初级培训
- 中考数学二轮复习专项选择题题组集训二课件
- 防疫培训幼儿园
- 2024-2025学年贵州省六盘水市水城区高二上学期期中质量监测数学试卷(含答案)
- T-ZFDSA 20-2024 蜂蜜蒸梨制作标准
- 山东省菏泽市郓城一中2024-2025学年九年级上学期第一次月考数学试题
- 03Z028安全环保部安全管理员工作标准
- 人教版六年级语文下册两小儿辩日
- 高中语文第5单元散而不乱气脉中贯3祭十二郞文课件新人教版选修中国古代诗歌散文欣赏
- 桥梁冬季施工方案及措施
- 职高数学《等差数列》试卷试题
- 急性胸痛的急诊处理ppt课件
- 砂矿采样规范手册.docx
- 实验检测生物组织中的糖类脂肪和蛋白质PPT课件
- 聚乙烯PE管道施工方案完整
- 流动资金贷款需求量测算参考计算表(XLS12)
- 西师大版六年级数学上册期中测试卷(附答案)
- 岗位价值评估方法(共15页)
- 202X年妇联赴外出学习考察心得体会.doc
- suzuki偶联反应(课堂PPT)
评论
0/150
提交评论