版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
#成绩评定表学生姓名刘小平班级学号1009010219专业信息与计算科学课程设计题目国民生产总值及物价指数与投资额的回归分析评语组长签字:成绩日期2012年6月28日
课程设计(论文)任务书学院理学院专业信息与计算科学学生姓名刘小平班级学号1009010219课程名称概率论与数理统计课程设计课程设计(论文)题目国民生产总值及物价指数与投资额的回归分析设计要求(技术参数):通过该课程设计,使学生进步理解概率论与数理统计的基本概念、理论和方法;初步掌握Excel统计工作表在随机模拟中的应用,MATLAB统计软件包对数据进行统计检验和统计分析;具备初步的运用计算机完成数据处理的技能,使课堂中学习到理论得到应用。设计任务(至少一个):数据整理:收集数据,录入数据,画出相应图形;建立数学模型,数据的输入与整理,各种数据的图形显示。假设检验:MATLAB绘制出直方图,做数据分布的推测;参数估计,假设检验,绘制概率密度图。3•单因素、多因素方差分析:正态总体的方差分析问题;MATLAB统计软件中关于方差分析的相关命令,做出方差分析表,box图,能对结果进行简单分析。4.元、多元线性回归模型:回归系数的估计与检验,数据散点与回归直线的图示,残差图。运用MATLAB统计软件,对给定的数据拟合回归方程。计划与进度安排:周三1~2节:选题,设计解决问题方法周三3~8节:调试程序周四1~4节:完成论文,答辩成绩:指导教师(签字):2012年6月28日专业负责人(签字):2012年7月8日主管院长(签字):2012年7月19日摘要数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位。对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题本文利用概率纶与数理统计中的所学的回归分析知识,对某地区实际投资额与国民生产总值(GNP)及物价指数的关系建立数学模型,并利用这些数据做出国民生产总值x及物价指数x与y的多元回归方程,并MATLAB与EXCEL软件1t2tt对验数据进行分析处理,得出线性回归系数与拟合系数等数据,并用F检验法检验了方法的可行性,同时用分布参数置信区间和假设检验问题,得出了国民生产总值x及物价指数x与y的线性关系显著,提出了小样本常用分布参数的置1t2tt信区间与假设检验的解决方法。关键词:统计量法;置信区间;假设检验;线性关系;回归分析目录TOC\o"1-5"\h\z设计目的5设计问题5设计原理6多元线性回归方程的求法6多元线性相关的显著性检验8方法实现9设计步骤9设计结果12设计总结14参考文献15致谢15设计目的了解一元回归方程,回归系数的检验方法及应用一元回归方程进行预测的方法;学会应用MATLAB软件进行一元回归实验的分析方法。同时更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。本设计是利用一元线性回归理论对用切削机房进行金属品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关系建立数学模型,并用Excel分析工具库中的回归分析软件进行解算。设计问题收集该地区连续20年的统计数据,目的是由这些数据建立一个投资额的模型,并根据对未来国民生产总值及物价指数的估计,预测未来的实际投资额。数据如下:年号序列投资额国民生产总值物价指数年号序列投资额国民生产总值物价指数190.9596.70.716711229.81326.41.0575297.4637.70.727712228.71434.21.15083113.5691.10.743613206.11549.21.25794125.7756.00.767614257.91718.01.32345122.8799.00.790615324.11918.31.40056133.3873.40.825416386.62163.91.50427149.3944.00.867917423.02417.81.63428144.2992.70.914518401.92631.71.78429166.41077.60.960119474.92954.71.951410195.01185.91.000020424.53073.02.0688利用这些数据做出国民生产总值x及物价指数x与y的线性回归方程。1t2tt设计原理3.1多元线性回归方程的求法TOC\o"1-5"\h\z记住该地区第t年的投资额为y,国民生产总值为x,物价指数为x(以第t1t2t10年的物价指数为基准,基准值为1),t=1,2,n,n=20.因变量y与自变量x和t1tx的散点图如下所示:t1ty对x的散点图t2t由图可以看出,随着国民生产总值的增加,投资额也增大,而且两者有很强的线性关系,物价指数与投资额的关系也类似,因此可以建立多元线性方程y=B+Bx+Bx+£t011t22tt方程中除了国民生产总值和物价指数外,影响y的其它因素的作用都包含在随机t误差8内,这里假设8(对t)相互独立,且服从均值为0的正态分布,t=1,2,,ttn。与一元线性回归类似,我们利用最小二乘法求未知参数卩,卩,卩的估计值。012为了使偏差平方和n2S=£(y-卩-卩x-卩x-...-卩x)取得最小值,分别求偏导数k01122mmk=1as/邻,as/邻,…,as/。卩,并让他们等于零,整理得到方程组01mnP+(工x)P+...+(工x)P=工y0k=11k1k=1mkmk=1k(Mx)P+(Mx2)P+...+(Mxx)P=Mxy1k01k11kmkm1kkk=1k=1k=1k=1(Mnx)P+(Mxx)P+...+(Mx2)P=Mxymk0k=1mk1kk=11mk=1kmmkkk=1设x=工x,其中i=1,2,...,minikk=1y=-My;nk
k=1l=l=Mxx-nxx
ijjiikjkijk=1其中i=1,2,...,mj=1,2,...,m;特别的当i=j时有l=(n-1)s2
iii其中s2表示x的观测值的样本方差;iil=Mxy-nxyiyikkk=1其中i=1,2,...,m,利用消元发不难将方程组化为如下形式P+迟龙P=_0iii=1MmlP=l1ii1yi=1
迟l0二lmimmyi=1于是我们解得b其中i=1,2,...,m,再代入第一个方程即得:i0ii0iii=1最后得到多元回归方程y=0+0x+0x+...+0xTOC\o"1-5"\h\z01122mm3.2多元线性相关的显著性检验我们可以利用多元线性回归的方差分析,检验原假设H:0=0=...=0=0012m是否成立。考察样本y,y,...,y的偏差平方和12m=工(y=工(y-y)2=工(ykkk=1k=1-y)2+工(ykk=1-yk)2=SR+Se上式中S=工(y—y)2Rkk=1称为回归平方和,它反映了由于Y与X,X,X之间存在线性相关关系而引12m起的回归值y』,..."的分散程度;12ms=工(y—y)2ekkk=1称为剩余平方和,它就是偏差平方和的最小值,它反映了由于随机误差引起的观测值y与相应的回归值y(k=1,2,..,n)的偏离程度kk可以证明,当原假设正确的时候,则君〜咒2(n-1),〜X2(m),茫〜X2(n-m-1),并且S与S是相互独立的,于是Re〜F(m,n-m〜F(m,n-m-1).RS/(n-m-1)e计算S,S,S时可以利用如下公式;TReS=l=(n一1)s2TOC\o"1-5"\h\zTyyyS=区$l;Riiyi=1S=S-S=l-区pleTRyyiiyi=1最后写出多元线性回归的方差分析表如下万差来源平方和自由度F值临界值显著性回归剩余SRSemn一m-1S/mF一RF(m,n一m一1)0.05F(m,n一m一1)0.01F—RS/(n-m-1)e总计STn—1方法实现4.1设计步骤①在【工具】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然后在“分析工具”中选择“回归”选项,如图二所示。单击【确定】后,则弹出【回归】对话框,如图二所示。②填写【回归】对话框。如图三所示,该对话框的内容较多,可以根据需要,选择相关项目。在“Y值输入区域”内输入队因变量数据区域的引用,该区域必须有单列数据组成,如本题中三种成分的含量;在“X只输入区域”输入对自变量数据区域的引用,如本题中温度T。该区域必须是连续的,Excel将对此区域中的自变量从左到右按升序排列,自变量的个数最多是25个。“标志”:如果输入区域的第一行中包含标志项,则选中此复选框,本题中的输入区域包含标志项;如果在输入区域中没有标志项,则应清楚此复选框,Excel将在输出表中生成合适的数据标志。“置信度”:如果需要在汇总输出表中包含附件的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。Excel默认的置信度为95%,相当于显著性水平a=0.05。“常数为零”:如果要强制回归线通过原点,则选中此复选框。“输出选项”:选择“输出区域”,在此输出对输出表左上角单元格的引用。“残差”:如果需要以残差输出表形式查看残差,则选中此复选框。“正态概率图”:如果需要绘制正态概率图,则选中此复选框。得到下面的图形:
方弄分析dfSSMSF;nificanc回归分析2297462.7148731.4913.47485.01E-18残差172767.929162.8193总19300230.6得到了回归系数估计值及置信区间(置信水平a=0.05)、检验统计量R2,F,p的结果如下:参数参数估计值置信区间322.7250(224.3386421.1114)0.6185(0.47730.7596)£-859.4790(-1121.4757-597.4823)R2=0.9908F=919.8529pvO.OOOl将参数估计量带入方程得到勺=322.725+0.618X-859.479Xt1t2t对新建立的多元回归方程及偏回归系数按上述程序进行检验,直到余下的偏回归系数都具有统计意义为止。最后得到最优方程。由Coefficien-标准误差tStatP-valueLower95%Upper95%F限95.0止限95.6Intercept322.51846.792776.8924762.61E-06223.7939421.2421223.7939421.24210.759732-595.86XI0.6180630.0671489.2045475.14E-080.4763940.7597320.476394z2-858.756124.6061-6.891762.61E-06-1121.65-595.86-1121.65二.填好【回归】对话框后,点击“确定”,即可得到回归分析的结果三.在图四的第三个表中,除了列出了回归系数,还有标准误差等项目。其中“标准误差”表示的事对应回归系数的标准误差,其中偏回归系数的标准误差。“tStat”就是t检验时的统计量t;如果多元线性回归,则可直接根据“tStat”的大小,判断因素的主次顺序。“P-value”表示t检验偏回归系数不显著的概率,如果P-value<0.01,则可认为该系数对应的变量对试验结果影响非常显著(**),如果0.01<P-value<0.05,则可认为该系数对应的变量对试验结果影响显著(*);对于常数项,P-value则表示常数项为零的几率。根据上面的图形判断X与Y的相关性显著,不剔除•再把X,和Y的多元回归方12程再求出来。即再在Excel中输入数据得到新的图形如下回归统计—Multiple0.99538RSquare0.990781Adjusted0.989696标淮误差12.76007观测植加4.2设计结果试验结果F=919.8529有显著性表明至少有一个自变量与应变量之间存在线性回归关系。由图:Coefficien-标准误笨tStatP-valueLower95%Upper95%艮95.09上限95.①Intercept322.51846.792776.8924762.61E-06223.7939421.2421223.7939421.2421XI0.6180630.0671489.2045475.14E-080.4763940.7597320.4763940.759732x2-858.756124.6061-6.891762.61E-06-1121.65—595.86-1121.65—595.86知道x和x都与y有线性关系,不需要剔除,得到x及x与y之间的多元线性方1212程$=322.725+0.618x-859.479x也可以根据上图的置信区间x:[0.4773t1t2t1t0.7596],x:[-1121.4757-597.4823]各自的残差图如下:根据x和x的变化得到y的预测值汇成图标:12拟合曲线:根据拟合曲线预测Y的值和相应的残差,标准残差表:预测y残差标准残差百分比排名y75.8457415.054261.2472652.590.991.739995.660010.4689397.597.4111.09032.4096820.19964512.5113.5130.5924-4.89244-0.4053517.5122.8137.4178-14.6178-1.211122.5125.7153.5169-20.2169-1.67527.5133.3160.655-11.355-0.9407832.5144.2150.7366-6.53664-0.5415737.5149.3164.05092.3491010.19462642.5166.4196.7227-1.72273-0.1427347.5195234.1821-4.38207-0.3630652.5206.1220.68739.1126940.75499957.5229.8199.79186.3082350.52264662.5229.8247.872210.027770.83081467.5257.9305.460118.639
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南名校教育联盟2025届高三12月大联考历史试卷(含答案解析)
- 联合办学协议书争议处理办法
- 合同数量减少补充协议
- 合同识别对比解决方案
- 课件音频教学课件
- 望岳教学课件
- 校园安全教育课件教学
- 《客房服务课件》课件
- 《保温杯市场调查》课件
- 玩转文献检索高效管理文献(一)医学信息检索基础知识
- 研发部绩效考核方案课件
- 数字化医院建设方案的信息系统整合与优化
- 冬季运动安全快乐冰天雪地以安全为先
- 中国脑卒中康复治疗指南课件
- 未来医疗2024年的AR手术眼镜
- 海南省2022-2023学年高一上学期期末学业水平诊断(一)数学试题
- 可爱的四川七年级上册期末质检及复习资料
- 最美教师的事迹演讲课件
- 人工智能概论(第二版)即问即答题目及答案 郭福春
- 《系统解剖学》课程考试复习题库大全-5骨骼部分
- 双T板吊装施工专项方案
评论
0/150
提交评论