版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、暨南大学本科实验报告专用纸课程名称决策支持系统成绩评定实验项目名称商品的需求量预测与决策指导教师 谭满春实验编号80001440906实验项目类型综合性实验地点南海楼520学生姓名李永胜学号2009051049学院信息科学技术学院系数学系专业佶息管埋与信息系统实验时间2011年10月21日上午10月28日上午温度°c湿度【实验目的】1. 了解i叫归分析的基木原理和方法。2. 学习用回归分析的方法解决问题,初步掌握対变量进行预测和控制。3. 学习掌握用matlab命令求解回归分析问题。【实验内容】现冇某种商品的需求量、消费者的平均收入、商品价格的统计数据如表1所示,试用所 提供的数据预
2、测消费者平均收入为1000、商晶价格为6时的商晶需求量。需求量10075807050659010011060收入10006001200500300400130011001300300价格5766875439【实验准备】现实生活中,一切事物都是相互关联、相互制约的。我们将变化的事物看作变量,那么 变量z间的相互关系,对以分为两大类:一类是确定性关系,也叫作函数关系,其特征是一 个变量随着其它变量的确定而确定,如矩形的而积山长宽确定;另一类关系叫相关关系,其 特征是变量之间很难用一种精确的方法表示出來,如商品销量与售价z间有一定的关联,但 由伟价我们不能精确地计算出销最。不过,确定性关系与相关关系
3、之间没有一道不可逾越的 鸿沟,由于存在实际误差等原因,确定性关系在实际问题中往往通过相关关系來体现;另一 方而,当对事物内部规律了解得更加深刻时,相关关系也可能转化为确定性关系。1. 回归分析的基本概念回归分析就是处理变量z间的相关关系的一种数学方法,它是最常用的数理统计方法, 能解决预测、控制、生产工艺化等问题。由相关关系函数确定形式的不同,回归分析一般分 为线性回归、非线性回归和逐步回归,在这里我们着重介绍线性回归,它是比较简单的一类 回归分析,在实际问题的处理中也是应用得较多的一类。回归分析中最简单的形式是y = 00 + 0i 兀 + £ ( x、y 为标量)(1)固定的未知
4、参数0(),几称为回归系数,i浚量兀称为回归变量,£是均值为零的随机变量, 它是其他随机因素对y的影响,是不可观察的,我们称(1)为一元线性回归。它的一个口 然推广是兀是多元变量,形如y = 0()+ a 山 + 0,” 心 + 占22,我们称为多元线性回归,或者更有一般地y =0() + 0| /,(%)+-+ an f.n () + £(3)其中兀=(x,,xmj ), fj (x) ( )=1,,m )是己知函数,称为非线性回归(也叫 曲线或曲面回归)。不难看出,对口变量x作变量替换,一般能够将非线性回归(3)转化为 线性回归(2)的形式进行求解分析,所以我们着重讨论
5、线性回归的内容。对(2)式两边同时取数学期望得其中y = x p+s (e £=0, d£ = /)1心6x = j 心 f0 = ( 0o,0,0,”)丫,£ =( 5,乞,j)(4)(4)式称为线性回归方程。线性回归分析所要考虑的主要任务是:川试验值(样本值)对 未知参数0和"2作点佔计,同时对估计值作假设检验,从而确立)',与列,旺“z间的 数蜃关系;在兀。=(x()1,,无加)处对y值作预测与控制,即对y作区间估计。这里我 们均假设样本容量大于变量个数,即n>m+.2. 模型的参数估计和假设检验用最小二乘法估计模型(4)中的参数,作
6、离差平方和q = 2£7(儿 一 00 pxi 一一 0"泅)2/=1 /=1求0使得q达到最小。根据微积分学中求极值的方法,只需求q关于0°, 0、,,0,”一 阶导数为0的方程组的解,此解不是0°,伙,,0川的真值,而是0的最小二乘估计值, 我们用“°,,表示b = (xxy'xy(6)将0的估计值bo,b,久代入i叫归方程 得到y的估计值= bo + b “+b”兀”拟合误差w = y 9称为残差,可作为随机误差0的估计,而q = xei一为)2(8)/=1 /=!为残差平方和(或剩余平方和),即q(b)。在实际问题中,事先我们并
7、不知道或者不能断定随机变量y与一组变量坷,兀”之 间有线性关系,如(2)式y =0。+肉坷+ pm xm+s往往只是一种假设,因此在求 岀线性回归方程后,还须对求出的线性回归方程同实际观测数据拟合效果进行检验,可提岀 以下原假设:h。: 0() = 0 =/?,“ =0(9)采用f检验法或/?检验法(详细内容在数理统计类书籍中均可查到,此处不再赘述),拒绝 h。,则认为y与",兀”之间显著地有线性关系;否则就接受h。,认为y与“, 兀”之间线性关系不显箸。3. 变量的预测与控制当回归模型和系数通过了假设检验示,可由给定的“)=(心,兀(加)预测出儿, ),()是随机的,显然由冋归方程
8、(7)知道,其预测值(点估计)为% = ()+a s+b” f(10)对于给定的显著水平d,可以算出儿的预测区间(区间估计),结果较复杂,但当/?较人且 兀接近平均值兀,儿的预测区间可简化为九一弘 3, y + u as(11)1 12 2其中"“是标准正态分布的1一纟分位数。乜2对于儿的区间估计方法可用于给出已知随机数据的残差£ = y y的置信区间,丘服 从均值为零的正态分布,所以若某个勺的置信区间不包括零点,则认为这个数据是异常的, 可予以剔除。4. matlab统计工具箱中的回归分析命令多元线性回归模型(4)可采用命令regress,此命令也可用于求解一元线性回归,
9、其 格式如下所示:b = regress( y , x )确定回归系数0的点估计值;b , bint , r , rint , stats 二 regress( y , x , alpha ) 求回归系数的 点估计和区间佔计,y, x的定义见(4), b为回归系数0的点估计值,见(6); alpha 为显著性水平(缺省时为0. 05); bint为回归系数的区间佔计;r和rint分别为残差y 一亍及其置信区间;stats: 1x3检验统计量,第一值是回归方程的置信度,越接近1说明回归方程越 显著;第二值是f统计量,f>f- (k, n-k-1)时拒绝h°, f越人说明回归方程越
10、显 著;第三个是与f统计量相对应的概率p, p<a时拒绝h。,说明回归方程系数不为0, 线性回归方程模型成立;rcoplot( r , rint )对用regress命令求得的残差和残差置信区间作图,当残 差离零点的数据数冃比较多时,町认为回归方程显著性越大,对于置信区间不包括零点 的,可以视为界常点;多元二项式回归用命令rstool,格式如下:rstool ( x , y , 'model' , alpha,xname',yname')输入数据 x, y 分别 为nxm矩阵和n维列向量;alpha为显著性水平(缺省时为0. 05); j xname,yn
11、ome' 分别是x轴和y轴的标签,可省略;'modev由下列4个模型中选择1个(缺省为线性): linear (线性):y = 0()+ 0、兀4卜 pm xmpurequadratic (纯二次):y = 0° + 0兀 0川兀川 + 工 0尤;)=1interaction (交叉):y = 0()+ 0、xx 4- (3m xm + z 0j"1< jk<mquadratic (完全二次):y = 0()+ 0】xx 卜 /3m xm + z pjkxjxk1< j,k<mrstool产生冇m个图形的交互imiiftl,每个图给出
12、独立变量xi (另ml个变量固定) 与y的拟合曲线;图屮export菜单向matlab工作区输送回归系数等参数;model菜单 对上述4模型比较剩余标准差,其中剩余标准差最接近0的模型最好。对于非线性冋归模型的求解命令我们也一并给出,可用命令nlinfit, nlintool, nlpredci来实现,其格式如下:beta , r , j = nlinfit ( x , y , ' fun' , betao ) x, y 为 nxm 矩阵和 n维列向量;'fun'为事先用m-定义的非线性函数;betao为回归系数beta的初值;j 估计预测课弟用;nl into
13、ol ( x , y , ' fun' , betao , alpha ) 其输出画面与 rstool 命令类似;ypred , delta = nlpredci ( 'fun' , x , beta , r , j ) 求 nlin fit 或 nlintool所得的回归函数在x处的预测值ypred及显著水平为1rpha置信区间 ypredi delta o【实验方法与步?1.引例问题的分析求解由问题提供的数据,我们可以初步判断,商品的需求最与消费者的平均收入和商品价格 之间存在某种相关关系,具体的函数关系式我们还不清楚。输入三组数据,我们先独立分析 商品需求
14、量与消费者平均收入,商品需求量与价格z间存在何种关系:» xl=1000 600 1200 500 300 400 1300 1100 1300 300, ;% 消费者的平均收入» x2 二5 76687543 9'% 商品价格» y二100 75 80 70 50 65 90 100 110 60' ;% 商品的需求量» plot(xl,y,'+')%以消费者的平均收入和商品的需求量所对应的离散点作图110 10090 80 70 60-5300400500_600700_800""90000plot
15、(x2, y,' +')%以商品的价格和商詁的需求量所对应的离散点作图1201008060山上血两图我们看到商品的需求量随着消费者平均收入增加呈线性递增的趋势,而随着 商品的价格增加呈线性递减趋势,这样我们可初步判断商品甜求量与消费者平均收入和商品价格之间存在某种线性相关的关系。接下来用多元线性回归来进行分析检验: >> x二ones (10, 1) xl x2;>> b, bint, r, rint, stats=regress (y, x)b =111.69180.0143-7. 1882bint =56. 0503167. 3334-0.01200
16、.0406-13.2306 -1.1458stats 二0. 894429. 65330. 0004可知冋归系数00=111.6918, 0|=0.0143, 02 =一7.1882,它们的置信区间为bint, 均包含了回归系数的估计值,stats第一个分量为0. 8944,第三个分量p = 0. 0004<0. 05, 拒绝h。,说明回归方程系数不为0,线性回归方程模型y = 111.6918 + 0.0143 “ 一 7. 1882 x2 (12)成立。继续对残差进行分析,作残差图:» rcoplot(r, rint)3020100-10-20()() ()() ()()(
17、)12345678910从残差图可以看出,大多数数据的残差离零点较近,且残差的置倍区间全部包含零点, 这进一步说明回归模型(12)能近似地符合原始数据。现利用线性回归方程对引例问题的要求作出预测,歼=1000,兀2 =6» z=lll. 6918+0. 0143*1000-7. 1882*682.8626得到结果,当消费者平均收入为1000、商品价格为6时的商品需求量大约为82.8626。【结果分析】利用线性回归分析所得结果,我们看到stats笫一个分量为0. 8944,它并不十分接近1, r部分残差离零点较远,这说明回归模型还存在缺陷,几个随机变量z间的线性关系冇待改 进,我们不妨
18、用多元二项式冋归来试验:» x二xl, x2;» rstool (x,y,' purequadratic,)2000806040fxnartpure qua:400 6qq 8qq 1qqo 1200t诃6o45678 e i x2 得到一交互式画面,左图是x2固定时曲线y(xl)及置信区间,右图是xl固定时曲线y(x2) 及置信区间。在xl, x2指示框中分别输入1000和6,即预测到平均收入为1000、价格为6 时商品需求量为88. 4791o在下拉列表框export中选择“all”,把beta (回归系数)、rmse(剩余标准差)和residuals (残差)传送到matlab i作区,在命令框中输入>> b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 热塑管项目可行性研究报告
- 胸部放射技术培训课件
- 痔疮手术复原多久
- 2023-2024学年广东省深圳市罗湖区六年级上学期期末英语试卷
- 中班科学教案:蝉
- 大班语言活动教案:枫桥夜泊
- 脑梗护理诊断与措施
- 2.1作图练习(一)原卷版
- 秩序维护部培训方案
- 2023年辽宁省沈阳二中高考地理三模试卷
- 10以内加减法口算题(13套100道题-可直接打印)
- 企业中层管理人员绩效考核中存在的问题及对策
- 桩基检测静载试验培训教材ppt课件
- 婚礼主持人培训-_图文ppt课件
- 新教科版五年级上册科学期末试卷
- 汽车维修价格表格模板
- 第七章 行为修正模式
- 小猪吃的饱饱教案
- 部编版语文一年级上册教材解读.ppt
- 科学课程中的概念教学浅探
- 铝方通吊顶施工工艺
评论
0/150
提交评论