


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验十三 商品需求量的预测【实验目的】1了解回归分析的根本原理和方法。2学习用回归分析的方法解决问题,初步掌握对变量进行预测和控制。3.学习掌握用 MATLAB命令求解回归分析问题。【实验内容】现有某种商品的需求量、消费者的平均收入、商品价格的统计数据如表 1所示,试用所 提供的数据预测消费者平均收入为1000、商品价格为6时的商品需求量。需求量10075807050659010011060收入10006001200500300400130011001300300价格5766875439【实验准备】现实生活中,一切事物都是相互关联、相互制约的。我们将变化的事物看作变量,那么变量之间的相互关系,
2、 可以分为两大类:一类是 确定性关系,也叫作函数关系,其特征是一 个变量随着其它变量确实定而确定,如矩形的面积由长宽确定; 另一类关系叫 相关关系,其特征是变量之间很难用一种精确的方法表示出来,如商品销量与售价之间有一定的关联,但由售价我们不能精确地计算出销量。不过,确定性关系与相关关系之间没有一道不可逾越的鸿沟,由于存在实际误差等原因,确定性关系在实际问题中往往通过相关关系来表达;另一方面,当对事物内部规律了解得更加深刻时,相关关系也可能转化为确定性关系。1.回归分析的根本概念回归分析 就是处理变量之间的相关关系的一种数学方法,它是最常用的数理统计方法, 能解决预测、控制、生产工艺化等问题。
3、由相关关系函数确定形式的不同,回归分析一般分为线性回归、非线性回归和逐步回归,在这里我们着重介绍线性回归,它是比拟简单的一类回归分析,在实际问题的处理中也是应用得较多的一类。回归分析中最简单的形式是y = 0 + 1 x + x、y 为标量1固定的未知参数 0 , 1称为回归系数,自变量X称为回归变量,是均值为零的随机变量, 它是其他随机因素对 y的影响,是不可观察的,我们称1为一元线性回归。它的一个自 然推广是x是多元变量,形如y =0 +1X1 + mXm + 2m >2,我们称为多元线性回归,或者更有一般地y =0 +1f1(X)+ m fm(x) + 3其中x = x1,xm,f
4、j (x) j = 1,,m丨是函数,称为 非线性回归也叫 曲线或曲面回归丨。不难看出,对自变量 x作变量替换,一般能够将非线性回归3转化为线性回归2的形式进行求解分析,所以我们着重讨论线性回归的内容。对2式两边同时取数学期望得X11-y1X =Y =1Xn1YnI J其中Y = X + E = 0, D =20 ,1, mT,=1 ,2, nT4式称为线性回归方程。线性回归分析所要考虑的主要任务是:用试验值样本值对 未知参数和2作点估计,同时对估计值作假设检验,从而确立y与x,,xm之间的数量关系;在x0 = x01,x0m丨处对y值作预测与控制,即对 y作区间估计。这里我 们均假设样本容量
5、大于变量个数,即n > m + 1。2模型的参数估计和假设检验用最小二乘法估计模型4中的参数,作离差平方和nnQ=: =(yioi 1i 1求 使得Q到达最小。根据微积分学中求极值的方法,1 xi 1m xim )只需求Q关于o5m 一一*阶导数为0的方程组的解,此解不是m的真值,而是的最小二乘估计值我们用 ° ,1, m表示6=(XTX) 1xty将 的估计值 0, 1,m代入回归方程4得到y的估计值y =0 +1 X1 +拟合误差e = y y称为残差,可作为随机误差m Xm的估计,而nnQ = e = (y i yi)i 1i 178为残差平方和或剩余平方和,即Q()。在
6、实际问题中,事先我们并不知道或者不能断定随机变量y与一组变量x1,xm之间有线性关系,如2式y = 0 + 1 x1 + m xm + 往往只是一种假设,因此在求 出线性回归方程后,还须对求出的线性回归方程同实际观测数据拟合效果进行检验,可提出以下原假设:H 0 : 0 = 1 = m = 0 9采用F检验法或R检验法详细内容在数理统计类书籍中均可查到,此处不再赘述,拒绝H。,那么认为y与X1,Xm之间显著地有线性关系;否那么就接受 H。,认为y与, Xm之间线性关系不显著。3.变量的预测与控制当回归模型和系数通过了假设检验后,可由给定的x0 = x01,x0m预测出y0 ,y。是随机的,显然
7、由回归方程7知道,其预测值点估计为y° = 0 + 1 X01 + m X0m 10对于给定的显著水平 a,可以算出y。的预测区间区间估计,结果较复杂,但当n较大且 X0i接近平均值Xi, y0的预测区间可简化为y° u a s , y + u aS 111 - 1 其中U a是标准正态分布的1 -e = y - y的置信区间,e服2对于y0的区间估计方法可用于给出随机数据的残差从均值为零的正态分布,所以假设某个e的置信区间不包括零点,那么认为这个数据是异常的,可予以剔除。4. MATLAB 统计工具箱中的回归分析命令多元线性回归模型4可采用命令regress,此命令也可用
8、于求解一元线性回归,其格 式如下所示:b = regress( y , x )确定回归系数的点估计值;b , bin t , r , rint , stats = regress( y , x , alpha )求回归系数的点估计和区间估计,y, x的定义见4,b为回归系数的点估计值,见6; alpha为显著性水平缺省时为0.05; bint为回归系数的区间估计;r和rint分别为残差y y及其置信区间;stats: 1X 3检验统计量,第一值是回归方程的置信度,越接近1说明回归方程越显著;第二值是 F统计量,F> F1a k, n k 1时拒绝H°, F越大说明回归方程越显
9、著;第三个是与F统计量相对应的概率 p, pv a时拒绝H。,说明回归方程系数不为0,线性回归方程模型成立;rcoplot( r , rint ) 对用regress命令求得的残差和残差置信区间作图,当残差离零点的数据数目比拟多时,可认为回归方程显著性越大,对于置信区间不包括零点的,可以视为异常点;多元二项式回归用命令rstool,格式如下:rstool( x , y , 'model' , alpha , 'xname' , 'yname') 输入数据 x, y 分别为 nx m 矩阵和 n维列向量;alpha为显著性水平缺省时为 0.05;
10、xname' , 'yname'分别是x轴和y轴 的标签,可省略;'model'由以下4个模型中选择1个缺省为线性:linear线性:y = 0 + 1 x1 +m xmn2purequadratic纯二次:y = 0 + 1 为 + m xm + jj xjj 1ninteraction交叉:y =0 + 1 x1 + m xm +jk xjxk1 j k mnquadratic 完全二次:y =0 + 1 x1 + m xm +jk xj xk1 j,k mrstool产生有m个图形的交互画面,每个图给出独立变量 xi另m- 1个变量固定与y的拟合曲
11、线;图中 Export菜单向MATLAB工作区输送回归系数等参数;Model菜单对上述4模型比拟剩余标准差,其中剩余标准差最接近0的模型最好。对于非线性回归模型的求解命令我们也一并给出,可用命令nlinfit , nlintool , nlpredci来实现,其格式如下:beta , r , J = nlinfit( x , y , 'FUN' , beta0 ) x, y 为 n x m 矩阵和 n 维列向量;'FUN' 为事先用M 定义的非线性函数;beta0为回归系数beta的初值;J估计预测误差用;nlintool( x , y , 'FUN
12、39; , beta0 , alpha ) 其输出画面与 rstool 命令类似;ypred , delta = nlpredci( 'FUN', x , beta , r , J ) 求 nlinfit 或 nlintool 所得的回归函 数在x处的预测值ypred及显著水平为1 alpha置信区间ypred ±elta。【实验方法与步骤】1 引例问题的分析求解由问题提供的数据,我们可以初步判断,商品的需求量与消费者的平均收入和商品价格 之间存在某种相关关系,具体的函数关系式我们还不清楚。输入三组数据,我们先独立分析商品需求量与消费者平均收入,商品需求量与价格之间存
13、在何种关系:>> x1=1000 600 1200 500 300 400 1300 1100 1300 300'% 消费者的平均收入>> x2=5 7 6 6 8 7 5 4 3 9'% 商品价格>> y=100 75 80 70 50 65 90 100 110 60'%商品的需求量>> plot(x1,y,'+')%以消费者的平均收入和商品的需求量所对应的离散点作图110 1100 - + + -90 -80 - + -十70 -+60-50 11300400500600700800900100011
14、0012001300>> plot(x2,y,'+')%以商品的价格和商品的需求量所对应的离散点作图1201 1 T100=T+-十80一+一十+60+40Fr3456789由上面两图我们看到商品的需求量随着消费者平均收入增加呈线性递增的趋势,而随着商品的价格增加呈线性递减趋势,这样我们可初步判断商品需求量与消费者平均收入和商品 价格之间存在某种线性相关的关系。接下来用多元线性回归来进行分析检验:>> x=ones(10,1) x1 x2;>> b,bi nt,r,ri nt,stats=regress(y,x)b =bint =-0.012
15、0stats =可知回归系数 0 = 111.6918, 1 =, 2 =,它们的置信区间为 bint,均包含了回归系 数的估计值,stats第一个分量为,第三个分量 p = < 0.05,拒绝Ho,说明回归方程系数不为 0,线性回归方程模型y =+ % x2 12成立。继续对残差进行分析,作残差图:>> rcoplot(r,ri nt)302010-10-20L_iL_1kJ - 12345678910从残差图可以看出,大多数数据的残差离零点较近,且残差的置信区间全部包含零点, 这进一步说明回归模型12能近似地符合原始数据。现利用线性回归方程对引例问题的要求作出预测,X1
16、= 1000 , X2 = 6>> z=111.6918+0.0143*1000-7.1882*6得到结果,当消费者平均收入为1000、商品价格为6时的商品需求量大约为。【结果分析】利用线性回归分析所得结果, 我们看到stats第一个分量为,它并不十分接近1,且局部 残差离零点较远,这说明回归模型还存在缺陷,几个随机变量之间的线性关系有待改进, 我 们不妨用多元二项式回归来试验:>> x=x1,x2;>> rstool(x,y,'purequadratic')140120I :r I 100ae 479i- 8060 404006008001
17、00012001000XI4567820得到一交互式画面,左图是x2固定时曲线y(x1)及置信区间,右图是x1固定时曲线y(x2) 及置信区间。在x1,x2指示框中分别输入 1000和6,即预测到平均收入为 1000、价格为6 时商品需求量为 88.4791。在下拉列表框 Export中选择"all把beta回归系数、rmse剩 余标准差和residuals残差传送到 MATLAB工作区,在命令框中输入>> beta,rmse,residuals即可得 beta、rmse、residuals 的数值beta = rmse =在 Model 下拉列表菜单对 lin ear、
18、purequadratic、in teraction、quadratic4 模型比拟剩余标 准差,其中purequadratic型的剩余标准差相比其它3个模型的剩余标准差最接近于0,故此回归模型的显著性较好。我们用纯二次回归模型所得的残差与前面线性回归模型所得的残差 列表进行比拟纯二次5.2724线性9.9523显然由二元纯二次多项式所得残差绝大多数要比由线性回归模型所得残差更接近零点, 由最小二乘法原理我们可以相信,改进后的回归模型y =+ x x2 x; + x;能够更好地近似原始数据。【练习与思考】1 电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据,建立回 归模型并进行检验,诊断是否有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物业档案管理考题及答案
- 吉林省安图县联考2024年中考数学全真模拟试题含解析
- 造营林工考试题及答案
- 成都市新都区2025届小升初总复习数学精练含解析
- 湖北汽车工业学院《建筑设计(1)》2023-2024学年第二学期期末试卷
- 福建省厦门外国语中学2025年校高三下期摸底考试语文试题试卷含解析
- 开封职业学院《影视摄像》2023-2024学年第二学期期末试卷
- 长春健康职业学院《现代测试技术》2023-2024学年第一学期期末试卷
- 亳州职业技术学院《生物医学图像处理》2023-2024学年第一学期期末试卷
- 友谊县2025年四年级数学第二学期期末复习检测模拟试题含解析
- 第八单元单元分析2024-2025学年新教材一年级语文上册同步教学设计
- 上海2025年上海市公安机关辅警-检察系统辅助文员-法院系统辅助文员招聘笔试考务问答笔试历年参考题库附带答案详解
- 《清镇市站街镇龙滩前明铝铁矿山有限公司清镇市站街镇龙滩前明铝铁矿(延续)矿产资源绿色开发利用方案(三合一)》评审意见
- 元朝的建立与统一课件 2024-2025学年统编版七年级历史下册
- 室外管网施工方案
- 2025年郑州铁路职业技术学院单招职业技能考试题库附答案
- 2025年安徽港航集团所属企业招聘13人笔试参考题库附带答案详解
- 《江南水乡》幼儿园小学少儿美术教育绘画课件创意教程教案
- 2025年春花城版(2024)小学音乐一年级下册教学计划
- 民用无人机操控员执照(CAAC)考试复习重点题库500题(含答案)
- 中国胰腺癌诊治指南2021更新(全文)
评论
0/150
提交评论