




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、仅供个人参考成绩评定表学生姓名陈基政班级学号17专业信息与计算科学课程设计题目合金钢的抗拉强度与钢中含碳量的回归分析评语组长签字:成绩日期20 年 月日课程设计任务书学院理学院专业信息与计算科学学生姓名陈基政班级学号17课程设计题目合金钢的抗拉强度与钢中含碳量的回归分析实践教学要求与任务:通过该课程设计,使学生进一步理解概率论与数理统计的基本概念、理论和方法;初步掌握Excel统计工作表在随机模拟中是应用,MATLAB统计软件包对数据进行统 计检验和统计分析;具备初步的运用计算机完成数据处理的技能,使课堂中学习到理 论得到应用。1 .数据整理:收集数据,录入数据,画出相应图形;建立数学模型,数
2、据的输入 与整理,各种数据的图形显示。2 .假设检验:MATLAB绘制出直力图,做数据分布的推测;参数估计,假设检 验,绘制概率密度图。3 .单因素、多因素方差分析:正态总体的方差分析问题;MATLAB统计软件中关于方差分析的相关命令,做出方差分析表,box图,能对结果进行简单分析。4 . F、多元线性回归模型:回归系数的估计与检验,数据散点与回归宜线的图 示,残差图。运用MATLAB统计软件,对给定的数据拟合回归方程。工作计划与进度安排:周三12节:选题,设计解决问题方法周三38节:调试程序周四14节:完成论文,答辩指导教师:2012年6月28日专业负责人:2012年7月8日学院教学副院长:
3、2012年7月19日数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占 有很重要的地位。对于正态总体期望和方差的区间估计和假设检验问题已有完备 的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究 的问题。本文利用概率纶与数理统计中的所学的回归分析知识, 对小样本常用小样本 常用分布参数置信区间和线性相关的显著性检验,相关系数的显著性检验,预测与监控,进行了深入研究,提出了小样本常用分布参数的置信区间与线性相关 的显著性检
4、验,相关系数的显著性检验,预测与监控,的解决方法。本文利用小样本情形的统计量法解决离散型的 0-1分布、二项分布以及连续 型的指数分布参数的置信区间与线性相关的显著性检验,相关系数的显著性检 验,对于泊松分布的参数的置信区间与线性相关的显著性检验,相关系数的显著性检验则采用数学方法进行分析。 对于均匀分布,利用两个参数的最大似然估计 求出联合概率密度进行求解。关键词:方差分析;置信区间;线性相关;预测与监控不得用于商业用途1设计目的 42设计问题 43设计原理 43.1 模型回归系数的估计 53.2 回归方程显著性检验 63.3 回归系数的置信区间 73.4 利用模型预测 74方法实现 84.
5、1 输入数据,观察线性关系 84.2 作回归分析与检验 84.3 残差分析 94.4 点预测及作图 104.5 对含碳量X=0.15%1行预测 114.6 下面用Excel ”分析工具库”提供的“回归”工具,找出线性回归方程,并检验其显著性 115.设计总结 15参考文献 15致 1 161设计目的了解一元回归方程,回归系数的检验方法及应用一元回归方程进行预测的方 法;学会应用MATLA歆件进行一元回归实验的分析方法。同时更好的了解概率 论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。本设计是利用一元线性回归理 论对合金钢的
6、抗拉强度与钢中的碳含量的关系建立数学模型,并用Excel分析工具库中的回归分析软件进行解算。2设计问题某种合金钢的抗拉强度 Y(N/mm 2)与钢中含碳量X (%)有关,测得实验数据如下:乙V、y、0.054080.134560.074170.144510.084190.164890.094280.185000.104020.205500.114360.225580.124480.246601.检验合金钢的抗拉强度 Y(N/mm 2)与钢中含碳量X (%)之间是否存在显著的线性相关关系;如果存在,求 Y关于X的线性回归方程。2.设含碳量X=0.15%,求抗拉强度Y的置信水平为0.95的预测区间
7、3设计原理在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。设其中有两个变量x与y ,我们可以用一个确定函数关系式:y = u(x)大致的描述y与x之间的相关关系,函数u(x)称为y关于x的回归函数,方程y = u(x)成为y关于x的回归方程。一元线性回归处理的是两个变量 x与y之间的线性关系,可以设想 y的值由两部分构成:一部分由自变量 x的线性影响所致,表示 x的线性函数 a + bx ;另一部分则由众多其他因素,包括随机因素的影响所致,这一部 分可以视为随机误差项,记为8。可得一元线性回归模型:y = a bx (i)式中,自变量x是可以控制
8、的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;y称为响应变量或因变量。由于*是随机误差,根据中心极限2 -2定理,通常假定& N(0,。),仃 是未知参数。确定y与x之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此我们可以用线性方程:y = a * bx大致描述变量y与x之间的关系;3.1 模型回归系数的估计为了估计回归系数,假定试验得到两个变量x 与y 的n个数据对仪,yi )i =1,2,3n,我们将这n对观测值代入式(1),得:yi 二 a bxi n,i = 1,2,3, n这里a,名2,加互独立的
9、随机变量,均服从正态分布,即N(0,二2), i = 1,2,3, n回归系数估计的方法有多种,其中使用最广泛的是最小二乘法,即要求选 取的a , b ,的值使得述随机误差&的平方和达到最小,即求使得函数2nn-2Qa, b)二1 i = yi - a - bxii已i W取得最小值的a , b。由于Q(a, b)是a , b的二元函数, 利用微积分中的函数存在极值的必要 条件,分别对Q(a, b)求a , b偏导数,并令其为0,构成二元一次方程组:n( £ (yi - a - bxi)= 0, i =0i =0J Z (yi - a - bxi )xi = 0 , i 1化
10、简后得到如下正规方程组:na C Xi )b =、yx,i 1i 1na,i 1nXi )aci 12Xi )b=1";"n, Xi yi 一 " Xi % yi22n% Xi 一(" Xi )解方程组得到总体参数a, b估计量:这里,Xi和yi(i = 1,2n)均已有的观测数据。由此得到回归方程:y? = a bX带入观测Xi,得到值yi称为回归预测值。方程的直线称为回归直线。3.2 回归方程显著性检验建立一元线性回归方程当且仅当变量之间存在线性相关关系时才是有意义的,因此必须对变量之间的线性相关的显著性进行检验,即对建立的回归模型进行显著性检验。我
11、们首先引入几个概念:n(1) S' = £ (yi -y)2,称为S6总偏差平方和,它表示观测值yi总的 i 1 分散程度;n(2) SSr =£(Wi -y)2,称SSr为回归平方和,它是由回归变量 X的变 i 1化引起的,放映了回归变量X对变量y线性关系的密切程度;n(3) SSE = £ (yi -胡)2 ,称SSe为残差(剩余)平方和,它是由观测误 i 1差等其他因素起误差,它的值越小说明回归方程与原数据拟合越好。可以证明下列关系成立SST = ss R ss ennn%(yi-y)2八(y?-y)2+ '、(yi-y?)2i 1i 1i
12、1我们主要考虑回归平方和在总偏差和中所占的比重,记R2 = SSRo (0<=R<=1S1),称R为复相关系数,用R的大小来评价模型的有效性,R越大,则反映回归变 量与相应变量之间的线性函数关系越密切。引入F统计量。定义F = SS一 ,可知FF (1, n-2).对于给定的显著水平a(一般这里 SSE(n - 2)取0.05或0.01),查表可得临界值Fa (1,n-2 )如果F> Fa (1,n-2 ),则认为y与x之间的线性关系显著;如果 F<= Fa (1,n-2 ),则认为y与x之间的线性关系不显著,或者不存在线性关系,在实际 应用中也可以通过F对应的概率Ps
13、来说明y与x之间的线性相关性显著。3.3 回归系数的置信区间A A回归方程(1)的回归系统a, b是一个点估计值,给定置信水平1-0(后,可 得到他们对应的置信区间,并且回归区间越短越好,如果摸个回归系数的置信区 间包含0点,则说明该回归变量的影响不显著, 需要进一步地修改回归方程,尽 量是每个回归系数的置信区间都不包含 0点。3.4 利用模型预测在对所建立的回归模型进行相关程度检验与分析之后, 如果预测变量y与相关变量x的每一个给定值x0 ,带入回归模型,就可以求得一个相对应的回归预 A A测值y, ya称为模型的点估计值。4方法实现4.1 输入数据,观察线性关系在命令窗口输入:y=408
14、417 419 428 420 436 448 456 451 489 500 550 558 600 x=0.05 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.16 0.18 0.20 0.22 0.24 plot(x,y, '*')生成图(1),可以看出x和y大体成线性关系。图(1)散点图(横轴:X纵轴:Y)4.2 作回归分析与检验在命令窗口输入:n=length(y);x=ones(n,1),x'b,bint,r,rint,s=regress(y',x); b,bint,s输出:b =1.0e+003 *0.3328
15、1.0165 bint =1.0e+003 *0.30950.35610.85681.17610.9413 192.47450.0000 234.8459这个结果可整理成如表(1)的形式。表(1) MATLAB回归分析结果表回归系数回归系数估计值回归系数置信区问B 0332.8309.5,356.1B 11.01650.8568,1.1761r2=0.9413 F=192.4745 p<234.8459一元回归方程为:y =332.8 1.0165x从几个方面都可以检验模型是有效的,所以X与Y的相关性显著。4.3 残差分析残差及其置信区间作图代码输入:rcoplot(r,rint)结果如
16、图(2)所示:仅供个人参考图(3)点预测不得用于商业用途Residual Case Order Plot468101214Case Number54m-21. 1-2-3-4-58-Enlp而2H图(2)残差图(横轴:钢中含碳量纵轴:残差分析值)所谓残差是指实际观察值与回归估计值的差,残差分析就是通过残差所 提供的信息,分析出数据的可靠性、周期性或其它干扰。从残差图可以看出, 数据的残差离零点较近,且残差的置信区间均包含零点,这说明回归模型 y = 332.8 +1.0165x能很好的符合原始数据4.4 点预测及作图在命令窗口输入:Z=b(1)+b(2)*xplot(x,y, 'k+&
17、#39; ,x,Z,'r')输出:如图(3)仅供个人参考4.5 对含碳量X=0.15%S行预测在命令窗口输入:y=408 417 419 428 420 436 448 456 451 489 500 550 558 600;x=0.05 0.07 0.08 0.09 0.10 0.11 0.12 0.13 0.14 0.16 0.18 0.20 0.220.24;polytool(x,y,1,0.05)输出:如图(4)图(4)散点图及拟合曲线如图所示,红线表示为数据离合区间,蓝色“+”表示为数据散点分布,绿色表示为拟合曲线。在含碳量 X=0.15%,抗拉强度Y的置信水平为0.
18、95的预测区间 514.763,445.5662。4.6 下面用Excel ”分析工具库”提供的“回归”工具,找出线性 回归方程,并检验其显著性具体步骤如下:1在【数据】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然 后“分析工具”中选择“回归”选项,如图(5)所示。单击【确定】后,则弹 出【回归】对话框,如图(6)所示。2填写【回归】对话框。如图(6)所示,该对话框的内容较多,可以根据 需要,选择相关项目。在“ X值输入区域”内输入队因变量数据区域的引用,该 区域必须有单列数据组成,如本题中组分 B;在“Y只输入区域”输入对自变量数据区域的引用,如本题中组分 A。“标志”:如果输入区
19、域的第一行中包含标 志项,则选中此复选框,本题中的输入区域包含标志项; 如果在输入区域中没有 标志项,则应清楚此复选框,Excel将在输出表中生成合适的数据标志。“置信度”: 如果需要在汇总输出表中包含附件的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。Excel默认的置信度为95%,相当于显著性水平 a=0.05。“常数为 零”:如果要强制回归线通过原点,则选中此复选框。“输出选项”:选择“输 出区域”,在此输出对输出表左上角单元格的引用。3>“残差”:如果需要以残差输出表形式查看残差,则选中此复选框。“标准残差”:如果需要在残差输出表中包含标准残差, 则选中
20、此复选框。“残差图” 如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框。“线性拟合图”:如果需要为预测值和观察值生成和观测值生车一个图表,则选中此复 选框。“正态概率图”:如果需要绘制正态概率图,则选中此复选框。图(5) Excel数据分析工具图(6)回归分析工具界面不得用于商业用途仅供个人参考不得用于商业用途回归分析工具运行结果:表SUMMARY OUTPUT回归统计 Multiple 0.944845 R Square 0.392733 Adjusted 0. 882981 标准误差0. 01S729 观海值13表中,“Multiple R”是线性回归的系数“R Square&
21、#39;是拟合系数“AdjustedR Square调整后的拟合系数。表(3)方差分析.方差分析 _Idf £S MSF 犯F归差计回残总1 0.032111 0.032111 91.54752 1. 15E-0611 0.003858 0.00035112 0.035969表(4)回归分析结果C-ffician-标彳隹误差 t Stat F-valn Lty&t 95%U口口er限 95.8上限 95. 0%Intercept -0. 20282 0. 036363 -5. 57755 0. 000166 -0. 28285 -0. 12278 -0. 28285 -0.
22、1227S 408 0.000718 7. 51E-05 9. 568047 1. 15E-06 0. 000553 0. 0008S4 0. 000553 0. 0008S4表(5)回归分析结果残差与标准残差RESIDUALOUTPUT观测值预测0. 05残差标准残差10. 096726-0. 02673-1.4904720. 09S163-0. 01816-1.012930. 104627-0. 01463-0. 8157640. 0988810,0011190. 06241450.110374-0. 00037-0. 0208660.1189940.0010060. 05610270.
23、1247410.0052590. 29330880. 1211490,0188511.05129790, 1484450.0115550. 644383100.1563470. 0236531.319096110.1922630. 0077370. 431458120.198010. 021991.226352130. 2712790. 03128-1.74442408 Residual Pilot0 05 n-0.05408图(7)用Excel处理数据得出的残差分布图图(8)用Excel处理数据得出线性拟合图根据运行结果分析:由表3所知,若保留四位有效数字,该回归方程的截距是332.8,斜率
24、为1.0165,所以回归方程白表达式为:y = 332.8+1.0165X ;根据回归统计结果,知 决定系数x=0.9409,即相关系数r=0.970 ,说明自变量与因变量之间有较高的相 关性;根据方差分析的结果,F=91.5475,有效的F<0.01,所以建立的回归方程 非常显著。在表五中,除了列出了回归系数,还有标准误差等项目。其中“标准误差” 表示的事对应回归系数的标准误差,其中偏回归系数的标准误差。"t Stat ”就是t检验时的统计量t;如果多元线性回归,则可直接根据“ t Stat ”的大小, 判断因素的主次顺序。“P-value ”表示t检验偏回归系数不显著的概率,如果 P-value<0.01 ,则可认为该系数对应的变量对试验结果影响非常显著,如果 0.01< P-value <0.05,则可认为该系数对应的变量对试验结果影响显著;对于常 数项,P-value则表示常数项为零的几率。5.设计总结通过对概率论与数理统计的这道实际问题的解决,不仅使我更加深刻的理解了概率论与数理统计的基础知识,而且使我对这些知识在实际中的应用产生了浓 厚的兴趣,同时对我学习好概率论与数理统计这门课有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小说情节结构分析试题及答案
- 高职单招职业技能测试题库
- 高职单招语文文学常识篇三
- (高清版)DB12∕T 642-2016 天津市行政许可事项操作规程 举办大型群众性活动安全许可-举办大型群众性活动安全许可
- 个人发展与2024年CPMM的试题及答案
- 感恩演讲稿-感恩老师
- 2025年活动合同模版
- 专升本思政理论的试题及答案检验
- 2025年度智能家居环保住宅商品房预售资金监管与智慧社区服务合同
- 二零二五年度特色小吃餐饮承包经营协议
- 消防设施检查记录
- 2024智能网联汽车自动驾驶功能仿真试验方法及要求
- 重大事件保电作业指导书
- 山东省济南市2022-2023学年六年级下学期语文期末考试试卷(含答案)
- 五年级上册小数乘除法计算题(纯竖式计算)1
- 供电所绩效考核实施方案
- 《宝葫芦的秘密》导读课(教案)部编版语文四年级下册
- 艾滋病伴卡氏肺孢子虫肺炎的个案护理
- 资产负债表完整版本
- 彩盒生产工艺流程图
- 污水处理项目实施重点、难点分析
评论
0/150
提交评论