多元统计报告-王天豪-1201620203.doc_第1页
多元统计报告-王天豪-1201620203.doc_第2页
多元统计报告-王天豪-1201620203.doc_第3页
多元统计报告-王天豪-1201620203.doc_第4页
多元统计报告-王天豪-1201620203.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中 国 地 质 大 学研究生课程论文封面课程名称 多 元 统 计 分 析 教师姓名 陈 兴 荣 研究生姓名 王 天 豪 研究生学号 1201620203 研究生专业 安 全 工 程 所在院系 工 程 学 院 类 别: 硕 士 日 期: 2016年12月1日 评 语对课程论文的评语:平时成绩:课程论文成绩:总 成 绩:评阅人签名:注:1、无评阅人签名成绩无效;2、必须用钢笔或圆珠笔批阅,用铅笔阅卷无效;3、如有平时成绩,必须在上面评分表中标出,并计算入总成绩。回归分析在油气储量密度影响因素分析中的应用摘要:在石油地质学和石油安全领域中,油气得以保存至今,是受油气的生、储、盖、运、聚五大作用共同控制的。本文运用多元线性回归的方法,研究油气藏储量密度与生油条件参数的关系。关键词:多元线性回归,储量密度1、回归分析模型原理回归分析法是一种处理变量间相关关系的数理统计方法,它不仅可以提供变量间相关关系的数学表达式,而且可以利用概率统计知识对此关系进行分析,以判别其有效性;还可以利用关系式,由一个或多个变量值,预测和控制另一个因变量的取值,进一步可以知道这种预测和控制达到了何种程度,并进行因素分析。回归分析法就是以统计回归概念为基础,采用多种类型的回归方法建立预测方程,包括一元线性回归方程、多元线性回归方程、非线性回归方程等。多元线性回归时要确定因变量与多个自变量之间的定量关系,它的数学模型为:y=0+1x1+mxm+。其中,0,1,m为待定参数;为随机变量,是除x以外其他随机因素对y影响的总和。其中,称E(y)=0+1x1+mxm为理论回归方程。在实际问题的研究中,事先并不能断定随机变量y与变量x1,x2,xm之间是否有线性关系,在进行回归参数的估计前,用多元线性回归方程去拟合随机变量y与变量x1,x2,xm之间的关系,只是根据一些定性分析所作的一种假设。因此,当求出线性回归方程后,还需对回归方程进行显著性检验,一般采用两种统计方法对回归方程进行检验,一种是回归方程显著性的F检验;另一种是回归系数显著性的t检验。2、案例分析背景历史已经证明,石油工业是推动人类文明进步与社会发展的主要动力之一。自1930年世界石油产量不足30亿到目前约500亿桶,从能源给人类社会带来的各种发展变化中,我们会发现石油工业做出的贡献是非常巨大的。随着市场需求增长、新技术出现与地缘政治事件等正一起改变着石油工业的作用与地位,石油已成为世界大国经济、军事、政治斗争的武器。虽然世界能源多样化是大势所趋,但是,石油依然是世界经济发展中的重要能源,在很长一段时间内仍将在世界经济舞台上扮演重要的不可替代的角色。石油的安全问题同时也是国家级的战略问题。在石油地质学和石油安全中,油气得以保存至今,是受油气的生、储、盖、运、聚五大作用共同控制的。据唐振宜等研究,在这五个条件互相结合形成油气藏的情况下,油气藏的储量密度(104t/m3)与一些生油条件参数有密切关系。本文运用多元线性回归的方法,研究这五大条件与油气藏储量密度的关系。3、数据来源表1数据来自我国东部15个勘探程度相对较高的中、新生代盆地、凹陷。包括了以下几个参数:(a)成油门限以下平均地温梯度to(用变量X1表示);(b) 成油门限以下总有机碳百分含量C%(用X2表示);(c) 生油岩体积与沉积岩体积百分比(用X3表示);(d) 砂泥岩厚度百分比(用X4表示);(e) 成油门限以下生油带总烃与有机碳的百分比即有机质转化率(用X5表示)。现试用回归分析求出储量密度y与这五个因素间的回归关系式,以用来辅助油气的进一步评价工作。表1 原始数据表指标样品X1X2X3X4X5Y13.181.159.4017.603.00.7023.80.795.1030.503.80.7033.601.109.209.103.651.0042.73.7314.5012.804.681.1053.401.487.6016.504.501.5063.201.0010.8010.108.102.6072.60.617.3016.1016.162.7084.102.303.7017.806.703.1093.721.949.9036.104.106.10104.101.668.2029.4013.009.60113.351.257.8027.8010.5010.90123.311.8110.709.3010.9011.90133.601.4024.6012.6012.7612.70143.501.3921.3041.1010.0014.70154.752.4026.2042.5016.4021.304、模型建立及数据分析 给定检验水平=0.05,作线性回归分析: 表2 Model Summary(b)ModelRR SquareAdjusted R SquareStd. Error of the Estimate1.946(a).896.8382.58199a Predictors: (Constant), X5, X1, X3, X4, X2b Dependent Variable: Y由表1、2可看出,该模型复相关系数R为0.946,拟合效果较好;且p值为0,该回归方程通过显著性检验。表3 ANOVA(b)ModelSum of SquaresdfMean SquareFSig.1Regression515.2695103.05415.458.000(a)Residual60.00096.667Total575.26914a Predictors: (Constant), X5, X1, X3, X4, X2b Dependent Variable: Y表4 Coefficients(a)ModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)-8.8735.772-1.537.159X1-.6112.319-.052-.264.798X24.0152.074.3401.936.085X3.384.117.4133.281.010X4.128.075.2321.708.122X5.560.170.4053.286.009a Dependent Variable: Y 由表3可以看出,在置信水平为0.05标准下,变量X1、X2、X4均不能通过检验,因此我们采用逐步回归法将显著性较差的变量剔除,并重新拟合模型。表5 Model Summary(d)ModelRR SquareAdjusted R SquareStd. Error of the Estimate1.742(a).550.5164.460832.852(b).726.6803.625433.926(c).858.8192.72351a Predictors: (Constant), X3b Predictors: (Constant), X3, X5c Predictors: (Constant), X3, X5, X2d Dependent Variable: Y表6 ANOVA(d)ModelSum of SquaresdfMean SquareFSig.1Regression316.5831316.58315.909.002(a)Residual258.6871319.899Total575.269142Regression417.5442208.77215.884.000(b)Residual157.7251213.144Total575.269143Regression493.6773164.55922.185.000(c)Residual81.593117.418Total575.26914a Predictors: (Constant), X3b Predictors: (Constant), X3, X5c Predictors: (Constant), X3, X5, X2d Dependent Variable: Y由表5、6可看出,逐步回归分析的最终模型(模型3)复相关系数R为0.926,拟合效果较好;且p值为0,该回归方程通过显著性检验。表7 Coefficients(a)ModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)-1.4072.338-.602.558X3.690.173.7423.989.0022(Constant)-4.5922.220-2.068.061X3.485.159.5213.049.010X5.655.236.4742.772.0173(Constant)-9.4992.264-4.195.001X3.424.121.4563.507.005X5.582.179.4203.249.008X24.4611.392.3783.204.008a Dependent Variable: Y 由表7可看出,剔除X1、X4后的模型中,X2、X3、X5等各变量均通过显著性检验,并且显著性较好。由此可得到回归方程如下: y=4.46 X2+0.42 X3+0.58 X5-9.495、案例分析结果该回归方程显著性很高(相关系数达0.926),说明储量密度y和有机碳含量X2,生油岩体积与沉积岩体积的百分比X3以及

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论