多元统计课程报告 刘辉_第1页
多元统计课程报告 刘辉_第2页
多元统计课程报告 刘辉_第3页
多元统计课程报告 刘辉_第4页
多元统计课程报告 刘辉_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中国地质大学研究生课程论文封面课程名称实用多元统计分析教师姓名向东进研究生姓名刘辉研究生学号120121825研究生专业石油天然气工程所在院系 资源学院类别硕 士日期2012.12.11平时成绩:课程论文成绩:总成绩:评阅人签名:注:1、无评阅人签名成绩无效;2、必须用钢笔或圆珠笔批阅,用铅笔阅卷无效;3、如有平时成绩,必须在上面评分表中标出,并计算入总成绩。多元统计方法在地层岩性识别研究中的应用以北部湾盆地海中凹陷HZ1井为例一、案例研究背景北部湾盆地位于欧亚板块内,属板内裂谷盆地,由于近板块边缘,也受到板块碰撞、分离的 影响,其构造活动比内陆盆地要强一些。整个盆地的构造演化可大致分为古新世

2、及始新世的 断陷期、渐新世的拗陷期。区域上,北部湾盆地以及其北的万山隆起区,其南的海南隆起区为 一级构造单元。在北部湾盆地中又划分出北部坳陷、企西隆起,中部坳陷、徐闻隆起、南部 坳陷五个二级构造单元。北部湾盆地是在海西一印支褶皱带上发育的中、新生代断陷盆地,盆地基底为上古生界碳 酸盐岩、碎屑岩。在此基础上发育中、新生界以陆相为主的陆相及海相碎屑岩。在勘查区内 除涠西南凹陷的部分地区渐新统涠洲组被抬升剥蚀外,其它地层均有分布。此次案例研究研 究区仅涉及到海中凹陷(中西部)。海中凹陷地处盆地西部,位于北部坳陷南段,其东北接涠西南凹陷,南西为企西隆起, 为一北断南超的箕状凹陷。凹陷长约80km,宽约

3、40km,面积约3694km2。凹陷油气勘探 和地质研究程度相对较低,所掌握的区域资料也较少,大致可划分出北部陡坡、南部斜坡等 次级构造单元。目前已在海中凹陷内发现了 HZ1井含油气构造。HZ1井位于北部湾盆 地海中凹陷中部地区,测井资料显示其电性特征表现为自然伽玛曲线较平直,呈低值小齿状, 电阻率曲线也较平直,为高值小齿状。所在地层厚度变化较大,在凸起上往往缺失,在凹陷 较厚。勘探区块内的HZ1井揭示该套地层厚达1710m,地震资料揭示深凹部位可达1800m。二、案例研究目的本文旨在采用多用统计分析方法中的聚类分析和因子分析,提取钻井地层地球质信息, 指导探区内油气勘探工作。聚类分析又称群分

4、析,是对多个样本(或指标)进行定量分类的一种多元统计分析方法。 对样本进行分类称为Q型聚类分析,对指标进行分类称为R型聚类分析。本案例运用R型 聚类分析方法,通过对地层和测井曲线进行分析,并结合其他的一些地质佐证,能够了解探 区内地层岩性类型,以及地层沉积环境,从而为找到探区内油气藏的圈闭空间分布规律提供 有用的信息。因子分析是一种研究分类和成因的数学地质方法。它从原始变量的相关矩阵出发,通过 对大量数据的浓缩,提炼出新的起主导作用的独立变量(因子),据此来揭示变量之间、样品 之间以及与地质作用之间的相互关系,为研究变量分类和成因提供依据。由于因子分析方法 根据现象的内在联系将变量进行综合归结

5、,能够归纳和提炼元素的组合,从而将混合型的原 始数据形态转换为反映不同地质成因的数据形态。因此,在地质学领域中,因子分析已被广 泛应用于矿产资源勘探等方面的研究。三、案例研究过程本次研究收集了海中凹陷HZ-1井各个层段的不同类别的测井曲线数据,选用比较有 代表性的33个层段以及18类测井曲线数据进行研究,根据样品的不同层段的测井曲线的数 据进行初步的分类,分作砂岩、细砂岩、粉砂岩、泥岩等方面的分类,通过对变量测井曲线 进行聚类,得出了 HZ-1井不同层段岩性的组合特点。3.1聚类分析3.1.1聚类分析的基本思想认为所研究的样品或指标之间存在着程度不同的相似性,根据一批样品的多个观测指 标,找出

6、能够度量样品或变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将 所有的样品或变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的 个体差异较大。3.1.2聚类分析的步骤:列出原始数组表。为了消除量纲和数量级的影响,对数据进行标准化变换。选择合适的聚类方法(系统聚类、快速聚类)。选择合适的统计量和聚类的参数。得出聚类分析结果。作出初步的地质解释。3.1.3、R型聚类分析的过程选取了海中凹陷 HZ1 井 33 个层段,AC、AZIM、CAL1、CAL2、CNL、DEN、DEVI、GR、ILD、ILM、LL8、SP、SH、MAGT、SWO、POR、Q 和 CL18 类测井曲

7、线数据做定量分析测试工作,得到了 33X18的原始数据矩阵,见表1-1:表1 HZ1井测井曲线数据分析结果矩阵检测项目及结果号层段ACAZIMCAL1CAL2CNLDENDEVIGRILDILMLL8SPSHMAGTSWOPORQCL150m7.98.4128475.52.7122228.10.663.2680.0664.99.70.014.211.060.4102100 m8.814.238399.12.615.82911.80.432.781.50.0575.211.80.0093.990.980.3103150 m30.723.251.7606.42.822.94234.20.693.5

8、126.60.1177.317.20.00921.91.380.3114200 m39.491.548.7461.925.319.73878.20.573.41081.2186.516.20.1541.31.630.3105250 m740.2136.43127.73.34.41097.50.772.18.42.65237.64.10.555.41.462.2106300 m78.5110.3171.2585.424.120.24820.60.543.9111.60.995.212.40.0430.21.30.3107350 m59.527.533.6527.618.921.53290.20.

9、583.7101.70.1591.316.30.00928.51.470.3108400 m27.618.278.1627.817.715.62812.20.73.677.40.2687.5130.009221.680.3109450 m14.2560.4439.611.211.32269.30.542.761.50.0864.29.50.009201.690.31010500 m32.65350.9491.713.414.52730.40.57372.70.2580.2130.00931.31.680.3101112550 m600 m13650 m14700 m15750 m16800 m

10、17850 m18900 m19950 m201000 m211050 m221100 m22101.46.212.84165.310.252.530.97.429.96.161.522.729.322.247.235.140.245.526.617.140.712.7201.146.43528.637.860.2103.594.859.871.2384.72710.91217.7609575.1251.1527.6595.810000508.3791.9572.518.33.237.32.82.62.72.52.93.28.34.228.522.823.914.327.1267.319.72

11、1.929.723881293.96117.84684.95382.52168.26211.759192376.81692.94989.86767.21.280.762.960.880.710.580.762.123.082.340.740.71231150 m 16.7 6.78.4 3541.9 3.26.2 1937.5 0.64241200 m37.320.244.4544.819.8265990.60.532.91.93.33.22.43.24.12.83.42.91.23.449.78.3116.6113.8105.581.5135.8140.313.642.6137.5100.5

12、10.9126127.251250 m 65.5 21.3 45.4 712.5 13.6 21.8 5576.5 0.53 3.5261300 m 10.6618.1 7509.754.59670.641.65.9271350 m 10.6 25.555516.5 2.84.1677.2 0.65 1.1281400 m46.5702.515.51823.226.852.69243.60.854.4291450 m165.22.11091719.432.722.44029.13.85301500 m20.441.2864.139.818.75106.81.47311550 m12.135.4

13、2519.748.515.31377.31.513.7321600 m98.749.21056.763.818.83540.61.576.2331650 m35.214.2213.5814.424.510.520371.023.20.210.30.9685.535.4284.56.93.918.50.1160.312.80.0675.114.40.0549.510.60.288.217.60.2117.1.723102.130.086466.5.80.20.10.080.190.420.125132.10.70.050.0090.090.0090.0090.0090.0090.0090.270

14、.2331.219.637.716.734.93.1224.431.840.233.92.131.323.861.430.991.222.42.371.910.880.30.30.30.30.40.30.30.30.30.4101010101511111210163246.890.5122.1148.274.3186.5 0.095224.61.97524.684.847.614.10.00926.90.940.31620.60.0093.280.760.3173.316.414.92.62.24.280.231.751.271.30.16247.30.8206.13.920.329.825.

15、544.316.214.414.50.320.210.0090.0090.0091.220.357.631.74.720.043.3123.228.11.73.1546.944.577.469.271.622.80.890.3101.10.3121.040.4130.80.3170.891.051.087.544.226.251.080.30.30.30.30.30.30.615141427151812从表1中可以看出,原始数据差别较大,为了消除量纲和数量级的影响,将数据做了标 准化变换,得到标准化数据矩阵。将标准化数据输入Spass,采用系统聚类法进行R型聚类分析,通过尝试不同的的方法, 发

16、现采用组内连接方法中的类平均距离度量标准与地质解释更吻合,所以采用了这种方法。 聚类的时候选择标定距离为1525位置,将变量曲线元素分为24类,根据相关距离系数 差异的显著性分为若干组,最后得出聚类谱系图(图1)。从聚类谱系图(图1)中可以看出在距离系数为10的水平下,可以将变量分为三类, 第一类为 DEN、SH、DEVI、ILM,第二类 ILD、AZIM,第三类为 MAGT、POR、CNL、 SWO、CL。根据这三类曲线组合的特点,我们可以看出第一类曲线组合主要是反映出在一些浅源的 偏砂类物质当中曲线变化特征明显;第二类曲线组合主要反映在细沙类岩性当中曲线变化较 明显,这两类曲线主要反映了再

17、砂岩性环境下曲线的变化规律。第三类曲线组合,主要反映 在沉积水动力环境较安静、埋藏比较深的条件下生成的泥岩物质对应的测井曲线变化规律。Rescaled Distance CIuster Comb i neCASE 05152025Label Num i11111AC6 AZIM13 CAL17ijCAL210 CNL9 DEN2 DEVI11 _GR4 ILD16 ILM 5 l_l LI815 SP18 SH1 MAGT8 SWO3 POR12 Q4CL17 图1: R型聚类谱系图从上述分析中我们可以看出测井曲线与不同层段岩性变化的对应关系:(1)受构造作用、气候变化、沉积物的供给速率以及可

18、容空间变化的影响,在盆地形 成演化作用发展的不同阶段,生成的沉积物在测井曲线上能够识别出其岩性类别。不同的岩 性在某些测井曲线上有不同于其它类别的显著变化特征,根据这一变化特征进而也能够从地 质学角度分析出不同岩性对应的古沉积环境特征。3.2因子分析由于前面所采用的R型聚类分析只是粗略的反映曲线的组合特征,再实际问题研究当 中有太大的误差,因此以下采用了因子分析,希望通过R型因子分析能够找出反映沉积岩 特征类别的主成因子,以此揭示测井曲线在油气勘查过程中,尤其是在判断岩性以及不同岩 性所处的沉积环境和恢复古地貌特征方面发挥着重要的作用。3.2.1、因子分析的基本思想:根据相关性大小把变量分组,

19、使得同组内的变量之间相关性较高,不同组的变量之间相 关性较低。每组变量代表一个基本结构,这个基本结构称为主因子或公共因子。对于所研究 的问题,就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原 来观测的每一分量。3.2.2、因子分析的步骤:(1)列出原始数据表;(2)将原始数据标准化;(3)求变量间的相关系数,列出相关矩阵R;(4)求R的全部特征值;(5)确定公因子个数m(6)求因子载荷,计算因子载荷矩阵A,对A作正交旋转(7)作出初步地质解释;3.2.3、因子分析的过程:将进行标准化变换后的曲线测试数据作为变量,应用spass进行R型因子分析。因子 载荷矩阵的求解方法采

20、用主成分分析,得出曲线之间的相关系数矩阵(表2)。表2相关矩阵ACAZIMCAL1CAL2CNLDENDEVIGRILDILMLL8SPSHMAGTSWOPORQCL相AC1.000.104.347-.233.524.410.364.599.567.333.048.215.351.090.354.183-.160.033关AZIM.1041.000-.091-.006.138.662.530-.036.264.556.742.269.584.026.184-.115-.028.002CAL1.347-.0911.000-.089.184-.014.008.387.297-.034.068.17

21、9-.006-.124.132.009.326-.203CAL2-.233-.006-.0891.000-.164-.445-.392.266-.431-.559.225.153-.513-.034-.049-.075.096.054CNL.524.138.184-.1641.000.233.161.329.658.118.391-.178.370.633.736.727-.137.360DEN.410.662-.014-.445.2331.000.919.094.624.910.366.247.949.079.225.054-.262.160DEVI.364.530.008-.392.161

22、.9191.000.051.558.904.307.111.861.115.183.101-.247.177GR.599-.036.387.266.329.094.0511.000.265-.127.145.299.032.164.430.299-.073.153ILD.567.264.297-.431.658.624.558.2651.000.631.294-.064.680.296.542.480-.187.082ILM.333.556-.034-.559.118.910.904-.127.6311.000.231.047.873-.007.100.001-.270.005LL8.048.

23、742.068.225.391.366.307.145.294.2311.000.153.379.411.625.315.369.183SP.215.269.179.153-.178.247.111.299-.064.047.1531.000.120-.254-.068-.319.196.104SH.351.584-.006-.513.370.949.861.032.680.873.379.1201.000.196.326.195-.269.194MAGT.090.026-.124-.034.633.079.115.164.296-.007.411-.254.1961.000.690.880-

24、.025.765SWO.354.184.132-.049.736.225.183.430.542.100.625-.068.326.6901.000.738.223.426POR.183-.115.009-.075.727.054.101.299.480.001.315-.319.195.880.7381.000-.078.550Q-.160-.028.326.096-.137-.262-.247-.073-.187-.270.369.196-.269-.025.223-.0781.000-.123CL.033.002-.203.054.360.160.177.153.082.005.183.

25、104.194.765.426.550-.1231.000KMO和Bartlett的检验取样足够度的.537Kaiser-Meyer-Olkin 度量。Bartlett的球形度检验 近似卡方631.097df153Sig.000对相关矩阵进行KMO检验与Bartlett球度检验(表3)。一般要求KMO值与1越接近 越好,当小到一定程度时认为不能认可;Bartlett检验偏相关矩阵是否为一单位阵,若是单 位矩阵,则认为不能接受。表中KMO=0.537,按照KMO置的要求,认为大于0.50.7就可 以做因子分析。0.5375,认为可以做因子分析。Bartlett值为631.097, p0.01,表

26、明相关 阵不是一个单位矩阵,可以接受。利用相关系数矩阵进行因子分析,计算其特征值及贡献率,选择特征值大于1作为提取 因子的参数,从中提取了5个主因子(表4)。旋转后最大主成分特征值为6.036,最小值为1.38; 根据样本数据和累计率大于一般要求的一般原则,累积因子特征值占总方差的83.51%,由 于地质事件的耦合因素太多,结合实际问题认为这一结果可以接受,显示这5个主因子承载 了大多数变量的全部信息,信息丢失量极少。故我们可取出因子个数为5。表4解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%16.03633.53433.5346.

27、03633.53433.5345.08928.27128.27123.53419.63453.1683.53419.63453.1684.07322.62850.90032.14511.91465.0822.14511.91465.0822.42113.45364.35241.95910.88475.9661.95910.88475.9661.7269.59073.94251.3587.54583.5111.3587.54583.5111.7239.56983.5116.9315.17088.6817.5152.86091.5418.4312.39793.9379.3151.74795.685

28、10.2601.44697.13111.170.94498.07512.135.74798.82313.083.46099.28314.055.30799.59015.032.17799.76716.024.13399.89917.011.06199.96018.007.040100.000计算其因子载荷矩阵,因子载荷反映了变量与公因子之间的相关程度,公因子的地质意 义是由载荷较大的元素表征的。通过尝试发现未旋转的因子载荷矩阵特表5表6成份矩阵a成份12345SH.875-.382-.107.049.003DEN.840-.499.006.082.117ILD.829.019.048-.333

29、-.195DEVI.784-.466-.074.053.090ILM.746-.602-.151-.015-.070CNL.665.551-.013-.195-.090SWO.646.626.134.115-.171AC.559.040.405-.526.197POR.518.746-.272-.070-.049MAGT.495.721-.342.186.041CL.366.488-.292.245.436CAL1.112.093.651-.402-.341SP.064-.236.638.211.415GR.282.384.587-.297.431LL8.540.208.313.683-.21

30、9AZIM.545-.371.198.590.002CAL2-.404.343.326.421.391Q-.192.200.476.348-.590成份中国地质大学(武汉)资源学:院1234 2)12512.11DEN.973.066.115-.065.080ILM.951-.050.035-.072-.182现对初始因子载荷矩阵进行正交旋转得到正SH.934.194.092-.039-.071交旋转矩阵(表6),各公因子的载荷向两极分化,DEVI.909.078.072-.097.008有的变量载荷接近于1,而另一些接近于0,公因AZIM.726.021-.170.366.363子的地质意义

31、更加明确。从表中可以看出,DEN、ILD.596.374.502.030-.300ILM、SH、DEVI、AZIM、ILD 在第一主因子 F1MAGT.027.952-.095.011-.041上有较大的载荷;MAGT、POR、SWO、CNL、CLPOR-.012.922.135-.018-.194第一主因子F2上有较大载荷,AC、CAL1、GR在SWO.160.799.295.346.013第二主因子F上有较大载荷;Q、LL8在四主因CNL.183.753.403.054-.164子F4上有较大的载荷,CAL2、SP在第五主因子CL.069.726-.176-.251.283f5上有较大的载

32、荷。AC.321.156.791-.186.071表7为变量的共同度,它的大小表示变量的信Pb-.070-.130.746.365-.100息被公因子所提取的方差,反映了公因子对变量GR-.074.284.728-.120.464的影响。例如DEN的共同度为0.976,说明5个公Q-.253-.073.051.836.021因子反映了变量DEN信息的97%。CL最小为LL8.391.439-.069.695.3390.707,说明GR曲线表征的信息还有近30%不能被SP.183-.265.257.086.712公因子说明。CAL2-.476.060-.137.113.676表7公因子方差初始提

33、取AC1.000.793AZIM1.000.822CAL11.000.722CAL21.000.718CNL1.000.793DEN1.000.976DEVI1.000.848GR1.000.846ILD1.000.839ILM1.000.947LL81.000.948SP1.000.683SH1.000.926MAGT1.000.918SWO1.000.870POR1.000.906Q1.000.772CL1.000.707为了更直观的看出各因子对变量信息的承载情况,做了旋转因子三维空间载荷分布图,从 因子旋转的空间分布图可以看出,它所反应的信息与解释因子总方差所反应的信息很吻合。图2:因子

34、旋转空间分布图3.2.4、因子分析结果解释根据Spas s提取的五个主因子,并结合因子旋转的空间分布图,根据已掌握的其他地质 资料可以得出以下地质解释:第一,第一主因子DEN、ILM、SH、DEVI、AZIM、ILD等6个类别的测井曲线组成, 这一主因子都是在沉积物含砂量比较大的情况下,其值得变化比较明显;同时这一因子也指 示出沉积物是在较强的沉积环境下生成的。我们可以将这一主因子命名为砂岩沉积物指示特 征因子。从因子分析结果还可以看出曲线的相关性,做出第一主因子曲线相关性地质解释。曲线 群投点在空间载荷分布图中心点的左下方,各曲线之间的点距较小,呈较紧密的分布,显示 本群曲线具有很强的相关性,其相关系数通常大于0.9,最高可达0.949。第二因子为MAGT、POR、SWO、CNL、等4个类别的曲线组成。该类别的曲线全部对应 泥质沉积物质,沉积环境弱水动力环境。我们将这一因子命名泥岩沉积物指示因子。该曲线群投点在空间载荷分布图中心点的右上方。各曲线点之间的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论