概率论与数理统计课程设计_一元线性回归分析(共21页)_第1页
概率论与数理统计课程设计_一元线性回归分析(共21页)_第2页
概率论与数理统计课程设计_一元线性回归分析(共21页)_第3页
概率论与数理统计课程设计_一元线性回归分析(共21页)_第4页
概率论与数理统计课程设计_一元线性回归分析(共21页)_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、沈阳理工大学课程设计论文成 绩 评 定 表学生姓名孙康班级学号1309010224专 业信息与计算科学课程设计题目金属加工时刀具的磨损速度与刀具的厚度之间的回归分析评语组长签字:成绩日期 2015 年 6月5日 课程设计任务书学 院理学院专 业信息与计算科学学生姓名孙康班级学号1309010224课程设计题目金属加工时刀具的磨损速度与刀具的厚度之间的回归分析课程设计目的:通过本课程设计,使学生进一步理解概率论与数理统计的基本概念、理论和方法。基本掌握MATLAB、SAS、SPSS等任何一种具有统计分析功能软件的使用;具备初步的运用计算机完成数据处理的技能,使课堂知识得以在生活实践中应用。设计任

2、务(二选一):1、一元、多元线性回归模型:首先做样本数据的散点图;其次对回归参数做点估计及区间估计;三对回归系数、回归方程做显著性检验,并对拟合效果做拟合优度检验,利用残差图检验归回效果;最后利用回归方程做点预测和区间预测。2、单因素、双因素方差分析:首先对总体做正态分布检验和方差齐性检验;然后检验单因素或双因素对实验指标是否有显著影响,最后选择合适的方法进行多重比较。工作计划与进度安排:周一:选题;周二、周三:进行设计;周四:完成设计报告;周五;答辩。指导教师: 2015 年 6月5日专业负责人:2015年6月 日学院教学副院长:2015年6月 日 III I摘要(zhiyo)数理统计是具有

3、(jyu)广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律(gul)性,这种函数称为回归函数或回归方程。回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,检验回归方程的可信度等是回归分析的主要内容

4、。按回归模型类型可划分为线性回归分析和非线性回归分析。本文利用概率纶与数理统计中的所学的回归分析知识,对用切削机房进行金属品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关系建立数学模型,利用这些数据做出刀具厚度关于时间的线性回归方程,并MATLAB 与EXCEL软件对验数据进行分析处理,得出线性回归系数与拟合系数等数据,并用F检验法检验了方法的可行性,同时用分布参数置信区间和假设检验问题 ,得出了刀具厚度关于时间的线性关系显著,并进行了深入研究,提出了小样本常用分布参数的置信区间与假设检验的解决方法。关键词:统计量法;置信区间;假设检验;线性关系;回归分析目录(ml) TO

5、C o 1-3 h z u HYPERLINK l _Toc296923982 一设计(shj)目的 PAGEREF _Toc296923982 h 4 HYPERLINK l _Toc296923983 二设计(shj)问题 PAGEREF _Toc296923983 h 4 HYPERLINK l _Toc296923984 三设计原理 PAGEREF _Toc296923984 h 4 HYPERLINK l _Toc296923985 四方法实现 PAGEREF _Toc296923985 h 8 HYPERLINK l _Toc296923986 五设计总结 PAGEREF _Toc

6、296923986 h 18 HYPERLINK l _Toc296923987 参考文献 PAGEREF _Toc296923987 h 18 HYPERLINK l _Toc296923988 致 谢 PAGEREF _Toc296923988 h 19 一设计(shj)目的了解一元回归方程,回归系数的检验(jinyn)方法及应用一元回归方程进行预测的方法;学会应用MATLAB软件进行一元回归实验的分析方法。同时更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。本设计是利用一元线性回归理论对用切削机房进行金属

7、品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关系建立数学模型,并用Excel分析(fnx)工具库中的回归分析软件进行解算。二设计问题 用切削机床进行金属加工时,为了适当地调节机床,需要测定刀具的磨损速度。在一定时间(例如每隔一小时)测量刀具的厚度,得到数据如下:切削时间刀具厚度切削时间刀具厚度030.01524.8129.11624.0228.41723.7328.11823.1428.01922.9527.72022.6627.52122.3727.22222.1827.02321.7926.82421.51026.52521.31126.32621.01226.127

8、20.61325.72820.31425.32920.1 由此,我们利用这些数据做出刀具厚度关于时间的线性回归方程。三设计(shj)原理在实际问题中,经常会出现两个变量之间的相关关系(gun x)不是线性的(即直线型),而是非线性的(即曲线型)。设其中有两个变量与,我们可以(ky)用一个确定函数关系式:大致的描述与之间的相关关系,函数称为关于的回归函数,方程称为关于的回归方程。一元线性回归处理的是两个变量与之间的线性关系,可以设想的值由两部分构成:一部分由自变量的线性影响所致,表示的线性函数 ;另一部分则由众多其他因素,包括随机因素的影响所致,这一部分可以视为随机误差项,记为。可得一元线性回归

9、模型 (1)式中,自变量是可以控制的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;称为响应变量或因变量。由于是随机误差,根据中心极限定理,通常假定,是未知参数。确定与之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此我们可以用线性方程:大致描述变量与之间的关系;1)模型回归系数的估计为了估计回归系数,假定试验得到两个变量 与 的 个数据对我们将这对观测值代入式(1),得 这里(zhl)互独立(dl)的随机变量,均服从(fcng)正态分布,即 回归系数估计的方法有多种,其中使用最广泛的是最小二乘法,即要求选取的, 的值使

10、得述随机误差 的平方和达到最小,即求使得函数 取得最小值的,。由于是,的二元函数,利用微积分中的函数存在极值的必要条件,分别对求,偏导数,并令其为0,构成二元一次方程组,化简后得到如下正规方程组 a解方程组得到总体参数估计量,这里, 均已有的观测数据。由此得到回归方程带入观测(gunc),得到(d do)值称为回归(hugu)预测值。方程的直线称为回归直线。2)回归方程显著性检验建立一元线性回归方程当且仅当变量之间存在线性相关关系时才是有意义的,因此必须对变量之间的线性相关的显著性进行检验,即对建立的回归模型进行显著性检验。我们首先引入几个概念:,称为总偏差平方和,它表示观测值总的分散程度;,

11、称为回归平方和,它是由回归变量的变化引起的,放映了回归变量对变量线性关系的密切程度;,称为残差(剩余)平方和,它是由观测误差等其他因素起误差,它的值越小说明回归方程与原数据拟合越好。可以证明下列关系成立 即 =+ 我们主要考虑回归平方和在总偏差和中所占的比重,记。(0=R F(1,n-2),则认为y与x之间的线性关系显著;如果F= F(1,n-2),则认为y与x之间的线性关系不显著,或者不存在线性关系,在实际应用中也可以通过F对应的概率P y=30 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.

12、8 24.0 23.7 23.1 22.9 22.6 22.3 22.1 21.7 21.5 21.3 21.0 20.6 20.3 20.1; x=0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29; plot(x,y,*)生成图(1),可以看出(kn ch)x和y大体成线性关系。图 SEQ 图 * ARABIC 1 散点图(横轴:X 纵轴Y)(2)作一元(y yun)回归分析,输入: n=length(y); X=ones(n,1),x; b,bint,r,rint,s=regres

13、s(y,X); b,bint,sb = 29.5501 -0.3329bint = 29.3326 29.7676 -0.3458 -0.3200s = 1.0e+003 *0.0010 2.8019 0 0.0001这个结果(ji gu)可整理成表1的形式。回归系数回归系数估计值回归系数置信区间29.550129.3326,29.7676-0.3329-0.3458,-0.3200 表 SEQ 表 * ARABIC 1 MATLAB回归(hugu)分析结果表一元(y yun)回归方程为: 从几个方面都可以检验模型是有效的:检验-接近于0;的置信区间不含零点;用MATLAB命令finv(0.9

14、5,1,28)计算得到,F为统计量观测值,所以X与Y的相关性显著。残差及其置信区间作图代码输入:rcoplot(r,rint)结果如图2所示:图 SEQ 图 * ARABIC 2 残差图(横轴:削磨时间 纵轴:残差分析(fnx)值)所谓残差是指实际观察(gunch)值与回归估计值的差,残差分析就是通过残差所提供的信息(xnx),分析出数据的可靠性、周期性或其它干扰。从残差图可以看出,数据的残差离零点较近,且残差的置信区间均包含零点,这说明回归模型能很好的符合原始数据。(3)讲上面的回归系数估计值,带入回归方程,刀具磨损速度的测试中,对时间间隔为30/h的刀具厚度进行预测,得到 。在,刀具的厚度

15、预测区间简化为,输入计算指令: t1=19.5631-norminv(0.0975,0,1)*sqrt(sum(r.2)/16)t1 = 20.0742 t2=19.5631+norminv(0.0975,0,1)*sqrt(sum(r.2)/16)t2 = 19.0520即时间间隔为30/h的刀具磨损速度测试中,刀具厚度的置信度为0.95的预测(yc)区间为。也可以(ky)用命令: y=30 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.8 24.0 23.7 23.1 22.9 22.6 2

16、2.3 22.1 21.7 21.5 21.3 21.0 20.6 20.3 20.1; x=0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29; polytool(x,y,1,0.05)作出散点图及拟合(n h)曲线,并对时的y进行预报,结果如图 3 所示。图 SEQ 图 * ARABIC 3 散点图及拟合曲线 如图3所示,红线表示为数据离合区间,蓝色“+”表示为数据散点分布,绿色表示为拟合曲线。(4)下面用Excel“分析工具库”提供的“回归”工具,找出线性回归方程,并检验其显著性。

17、1、具体步骤如下:1在【工具(gngj)】菜单中选中【数据分析】,则会弹出【数据分析】对话框,然后“分析(fnx)工具”中选择(xunz)“回归”选项,如图二所示。单击【确定】后,则弹出【回归】对话框,如图所示。2填写【回归】对话框。如图所示,该对话框的内容较多,可以根据需要,选择相关项目。在“X值输入区域”内输入队因变量数据区域的引用,该区域必须有单列数据组成,如本题中组分B;在“Y只输入区域”输入对自变量数据区域的引用,如本题中组分C。“标志” :如果输入区域的第一行中包含标志项,则选中此复选框,本题中的输入区域包含标志项;如果在输入区域中没有标志项,则应清楚此复选框,Excel将在输出表

18、中生成合适的数据标志。“置信度” :如果需要在汇总输出表中包含附件的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。Excel默认的置信度为95%,相当于显著性水平a=0.05。“常数为零” :如果要强制回归线通过原点,则选中此复选框。“输出选项” :选择“输出区域”,在此输出对输出表左上角单元格的引用。3“残差” :如果需要以残差输出表形式查看残差,则选中此复选框。“标准残差” :如果需要在残差输出表中包含标准残差,则选中此复选框。“残差图” :如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框。“线性拟合图” :如果需要为预测值和观察值生成和观测值生车一个

19、图表,则选中此复选框。“正态概率图” :如果需要绘制正态概率图,则选中此复选框。图 SEQ 图 * ARABIC 4 散点图 图 SEQ 图 * ARABIC 5 Excel数据分析工具(gngj) 图Excel数据分析工具(gngj)图 SEQ 图 * ARABIC 6 回归分析工具(gngj)界面回归(hugu)分析工具运行结果: Multiple R0.995041R Square0.990106Adjusted R Square0.989752标准误差0.298135观测值30表 SEQ 表 * ARABIC 2 回归(hugu)统计 表2中,“Multiple R”是线性回归的系数“

20、R Square”是拟合系数“Adjusted R Square” 调整后的拟合系数。dfSSMSFSignificance F回归分析1249.0449249.04492801.8981.29E-29残差282.4887620.088884总计29251.5337表 SEQ 表 * ARABIC 3 方差分析Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept29.550110.106197278.25759.73E-5029.3325729.7676429.3325729.76764X Variab

21、le 1-0.332880.006289-52.9331.29E-29-0.34576-0.32-0.34576-0.32表 SEQ 表 * ARABIC 4 回归分析(fnx)结果1 RESIDUAL OUTPUTPROBABILITY OUTPUT观测值预测 Y残差标准残差百分比排位Y129.550110.4498921.5357341.66666720.1229.21723-0.11723-0.40016520.3328.88435-0.48435-1.653348.33333320.6428.55146-0.45146-1.541111.6666721528.21858-0.21858

22、-0.746151521.3627.8857-0.1857-0.6339118.3333321.5727.55282-0.05282-0.1803121.6666721.7827.21994-0.01994-0.068072522.1926.887060.112940.38552828.3333322.31026.554180.2458210.83912531.6666722.61126.22130.2787020.9513663522.91225.888420.4115831.40496338.3333323.11325.555540.5444641.8585641.6666723.7142

23、5.222650.4773451.62944645241524.889770.4102261.40033148.3333324.81624.556890.2431070.8298651.6666725.31724.22401-0.22401-0.764685525.71823.89113-0.19113-0.6524458.3333326.11923.55825-0.45825-1.5642661.6666726.32023.22537-0.32537-1.110676526.52122.89249-0.29249-0.9984268.3333326.82222.55961-0.25961-0

24、.8861871.66667272322.22673-0.12673-0.432597527.22421.89385-0.19385-0.661778.3333327.52521.56096-0.06096-0.208181.6666727.72621.228080.0719170.24549385282720.89520.1047980.35773488.3333328.12820.562320.0376790.12861991.6666728.42920.229440.070560.240869529.13019.896560.2034410.69445798.3333330表 SEQ 表

25、 * ARABIC 5 回归分析结果(ji gu) 残差与标准残差观测值预测 Y残差129.550110.449892229.21723-0.11723328.88435-0.48435428.55146-0.45146528.21858-0.21858627.8857-0.1857727.55282-0.05282827.21994-0.01994926.887060.112941026.554180.2458211126.22130.2787021225.888420.4115831325.555540.5444641425.222650.4773451524.889770.4102261624.556890.2431071724.22401-0.224011823.89113-0.191131923.55825-0.458252023.22537-0.325372122.89249-0.292492222.55961-0.259612322.22673-0.126732421.89385-0.193852521.56096-0.060962621.228080.0719172720.89520.1047982820.562320.0376792920.229440.070563019.896560.203441表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论