数学建模模拟题,图论,回归模型,聚类分析,因子分析等 (3)_第1页
数学建模模拟题,图论,回归模型,聚类分析,因子分析等 (3)_第2页
数学建模模拟题,图论,回归模型,聚类分析,因子分析等 (3)_第3页
数学建模模拟题,图论,回归模型,聚类分析,因子分析等 (3)_第4页
数学建模模拟题,图论,回归模型,聚类分析,因子分析等 (3)_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十二章 回归分析3题摘要本文主要研究的是矿物分布的模型建立,通过对已知数据的分析,先画出散点图,在建立合适的回归模型,有线性模型,二次模型,双曲线模型,对数模型等。运用matlab软件,通过比较模型的剩余标准差,选出最合适的模型是二次模型。关键词:散点图 回归模型 剩余标准差 问题重述1.1 一矿脉有13个相邻样本点,人为地设定一原点,得出样本点到原点的距离为x,并设每一样本点处的金属含量为y,画出散点图,并建立合适的回归模型。 问题分析 模型假设本题需要先画出散点图,然后对其进行分析,建立模型。从数理统计的观点看,这里涉及的都是随机变量,根据一个样本计算的系数,只是它们的一个点估计,应该对

2、它们做区间估计或假设检验,如果置信区间太大,甚至包含了零点,则系数的估计值就显得毫无意义。这样也可以用方差分析的方法对模型的误差进行分析,对拟合的优劣给出评价。具体地说,回归分析在一组数据的基础上研究这样几个问题:(1) 建立因变量y与自变量之间的回归模型:(2) 对回归模型的可信度进行检验;(3) 判断每个自变量对y的影响是否显著;(4) 诊断回归模型是否适合这组数据;(5)利用回归模型对y进行预报和控制。 符号说明 模型建立和求解Matlab统计工具箱用命令regress实现多元线性回归,用的方法是最小二乘法,用法是:b=regress(Y.X),其中,b为回归系数估计值,这里Y,X同上,

3、alpha为显著性水平(缺省时设定为0.05),b,bint为回归系数估计值和它们的置信区间,r,rint为残差(向量)及其置信区间。Stats是用于检验回归模型的统计量,有四个数值,第一个是R2,第二个是F,第三个是与F对应的概率P,P<拒绝H0,回归模型成立,第四个是残差的方差。1.1绘制散点图如图1.1:分析图像,若将第一个数据点删除,则线性关系比较明显,但也不能排除其他模型的拟合效果,接下来可以将这几种模型加以比较。1.1.1 线性模型输入程序得到图(1.2):b = 108.2581 0.1742bint = 107.2794 109.2367 0.0891 0.2593sta

4、ts = 0.6484 20.2866 0.0009 0.5965现行相关系数R2=0.6484,拟合效果一般,P=0.0009在第一个点为异常点(仅指线性模型下)条件下成立,予以剔除。若再次输入程序得(图1.3)b = 109.0668 0.1159bint = 108.8264 109.3072 0.095 0.1360stats = 0.9428 164.8060 0.0000 0.0267剔除第一个点后R2=0.9428,拟合效果更好,P=0,而且没有异常点。线性模型为:对该模型求剩余标准差:得:。1.1.2二次曲线因为第一个点偏离太多,将其剔除后重新输入程序得:p = -0.0043

5、 0.2102 108.6718,二次模型为:,对该模型求剩余标准差:.1.1.3双曲线模型双曲线模型类似于,可以将x倒数代换转化为线性模型来求。输入程序得到如图(1.4):b =111.4405 -9.0300bint =111.1068 111.7743 -10.6711 -7.3889stats =0.9302 146.6733 0.0000 0.1184可明显观察到有两个异常点,剔除后再次输入程序得图(1.5)输出结果:b =111.5653 -10.9938bint =111.2882 111.8424 -13.5873 -8.4002stats =0.9309 107.7623 0

6、.0000 0.0221双曲线模型:。对该模型求剩余标准差:rmse=01487。3.1.4对数曲线类似于双曲线模型,输入程序可得图(1.6)输出结果:b =106.7113 1.5663bint =105.6382 107.7844 1.0828 2.0499stats =0.8221 50.8285 0.0000 0.3018剔除异常点,重新输入程序计算可得图(3.7):输出结果:b =107.9762 1.0496bint =107.6403 108.3121 0.9037 1.1956stats =0.9625 256.7014 0.0000 0.0175对数模型:对该模型求剩余标准差:rmse=0.1324.1.2结果比较对几个模型进行比较可得,二次模型的标准剩余差最小。如表(1.1)线性模型二次模型双曲线模型对数模型0.16350.12130.14870.1324 模型评价与改进四个模型中,第一点都属于异常点,需要剔除。但同时点数的减少又将样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论