有序地质量最优分割法_第1页
有序地质量最优分割法_第2页
有序地质量最优分割法_第3页
有序地质量最优分割法_第4页
有序地质量最优分割法_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章有序地质量最优分割法第一节 概述地层划分与对比是煤田地质勘探的主要任务之一。在地质工作中,通常是寻找地层的不整合或假整合界线,或者利用古生物化石、岩石矿物等地质特征对地层进行划分与对比。 这种划分方法比较直观,适用于较大地层单元的划分与对比。当地质特征间的差异性不显著时,运用上述直观、定性的方法来解决较小地层单元的进一步划分就有一定的困难。因此, 近年来开始利用有序地质量,即运用数学方法,并借于电子计算机定量地划分地层,提出了“有序地质量最优分割法”。地质数据中有相当多是有序的。这些按一定顺序排列的地质变量,叫做有序地质量。例如,沿地层露头剖面采集的岩石标本;钻孔取出的岩芯样品;与这些岩

2、石、样品有关的岩性、物理化学和古生物数据;以及地球物理测井数据等。它们都是有序地质量。这类数据的所以,一些不考虑样品排列顺序的数学处理方法, (地质体)进行分段的统计方法。特点是样品的前后次序不能变更。所以,一些不考虑样品排列顺序的数学处理方法,对此不适用。有序地质量最优分割法,就是对一批有序数据设有n个按顺序排列的样品,每个样品测得 表示为P个变量,这批数据可用数据矩阵的形式k 1i 1X11X12X1PXX21X22X2pXilXn1Xn2XnpXil表示第i个样品第l个变量的取值。若对以上n个有序样品进行分割(分段),可能有1 2n 1cn 1cn2cn 1nxp其中,2n1种划分方法,

3、每一种分法称为一种分割。段(组)内部样品之间的差异性最小(即样品数据的组内离差平方和最小) 之间的差异性最大(即样品数据的组间离差平方和最大) 差平方和最小的分割方法,称为最优分割法。样品变量总离差平方和的分解式为T W B在所有这些分割中,存在这样一种分割,它使得各,而使段(组)。这种对n个样品分段并使组内离(7 1)式中,T为总离差平方和; W为组内离差平方和;B为组间离差平方和。由式(7 1)可知,如果n个样品分为K段,每段的样品个数为nk,若每个样品只取一个变量,则nk_(72)(Xik xk)2K %_K_(73)B(Xk X)2 n k (Xk X)2k 1 i 1k 1因此,寻求

4、最优分割,就是用计算的分法找出使组内离差平方和(W )最小的那些分割点。这与判别分析中费歇准则相似,所以有序地质量最优分割法, 有人又称为“F-分割法”或“有序样品的聚类分析”。第二节单元有序数据的最优分割若有n个有序样品,每个样品只取一个变量, 则有n个有序数据序列,为X Xi , X2 , ,Xn现在试图将这n个样品按顺序分割为K段,使段(组)内离平差和尽可能小,而组间离差平方和尽可能大。为此,用Xi'Xj,Xj表示从第i个样品数据开始至第 j个样品数据为止的某段样品,其中该段样品变量的离差平方和为d(i,j)2i, j(7-4)式中X i, j由于d(i,j)能够反映样品段Xi

5、, Xi 1,Xj内样品间差异的情况,d(i,j)愈小,表示段内各样品之间差异性愈小;反之,d(i,j)愈大,表示段内各样品之间差异性愈大。因此,又把d(i,j)称为i, j段的直径。若 n 个样品分为 K 段:X11,X12, X1n1X21 , X22 ,X2n211 >XK2 , XK2 , XKnk,为最优K段分割。其各段离差平方和(段直径)分别为:di(i, j),d2(i, j), dK(i,j)。根据最优分割的原则,其组内离差平方和必须满足K nk_2(7-5)WXik Xk i, jk 1 i 1dk i, j mind1 i,j d2 i.jK _ 2Bn k Xk i

6、, j X maxk 1(7-6)在实际应用时,往往事先不知道n个有序样品客观上究竟能划分为几段。因此,必须从最优分成二段、三段、一、最优二段分割K段进行分析。若把n个有序样品X1,X2, ,Xn分为两段,则有如下 n 1种不同的分法,即X1X2,X3, ,XnX1,X2X3, X4, XnX1,X2,X3 X4,X5, XnX1, X2, ,Xn 1Xn在上述n 1种分法中,究竟哪一种方法最优?只须计算出每一种分割的组内离差平方和,并从其中找出组内离差平方和W 最小的那一种分割,就是所求的最优二段分割。在n个有序样品中,对任意一个j 1 n 1都可以确定一个二段分割,即1,j 1, n。若把

7、对n个样品在第j个样品处进行的二段分割的组内离差平方和(7-7)记为Wn 2; j d 1,1 d 2,n式中,n表示被分割的样品数;2表示把n个样品分为二段;j表示以第j个样品为分割点。上述n 1种分割的组内离差平方和分别为Wn 2;1 d 1,1 d 2,nWn 2;2 d 1,2 d3,nWn 2;n1 d 1,n1 d n, n在i, , j中,当i j时,则d 1,1 d 2,2d n, n0假设当 j a1 时,Wn 2; j 达到最小,即Wn 2;a11mj inn 1 Wn 2;j则最优二段分割为x1, x2, ,xa1xa 1, ,xn ,其中 xai 为最优二段分割点。二、

8、最优三段分割若把 n 个有序样品 x1 ,x2 , xn 分为三段, 其中必有两个分割点。 假设第 a1 j 和第 j个样品为分割点,则三段分割为x1 , xa1xa1 1, xj xj 1, xn若把三段分割的组内离差平方和记为:Wn 3;a1,j ,其中 a1,j 为两个 分割点1 a1 j 1;2 j n 1 ,则Wn 3;a1,jd1,a1d a11, j d j 1, nWj 2, a1d j1,n显然,如果有 Wn 3; a1, j 为最优三段分割,则Wj 2; a1 必为最优二段分割,否则必存在另一个最优二段分割 Wj 2; a1 ,使Wn 3; a1, jWn 3;a1, j这

9、与Wn 3;a1, j为最优三段分割相矛盾。因此,如果对n个有序数据进行最优三段分割,必须对任意一个 j 2n 1 ,即前 j 个数据先求出其最优二段分割, 为Wj 2;a1 j d1,a1 jda1 1, jWj 2; a11 am1 jinj 1 Wj 2; a1 j则前 j 个样品的最优二段分割与 x j,xn 构成一个三段分割。 最后,找出一个适当的 j ,如 j a2 ,使得Wn 3; a1 , a2 min Wj 2; a1 d j 1, n则 x1, ,xaj xaj 1, ,xa22mj inn 1 Wn 3;a1 j,jxa2 1, , xn为n个样品的最优三段分割,其中a1

10、和32为最优三段分割点。三、最优 K 段分割若 对 n 个 有 序样 品 数据 x1,x2, ,xn 进行最 优 K 段分割 , 可先 找 出n 1 个样品的最优K 1段最优分割,即Wj K 1;a1,a2,ak 2从而得Xa1 1 , Xa2Xak 2 1 ,Xj与Xj 1, ,Xn构成K段分割,但不一定是最优K段分割。 可选择一个适当的 j Kn 1 ,如 j aK1 时,使得Wj K 1;a1,a2 , aKK m1 ijnn 1 Wn K;a1 jK 1 j n1, a2 jaK 2 ,可得最优 K 段分割为 x1 , xa1xa11 , Xa2XaK 1 1 ,xn,其中 Xai,X

11、a2, ,XaKi 为K 一直可做到所要最优 K 段分割点。 应当指出,分割的段数 求的段数 K 为止;或者可以预先给定一个小正 数 ,使 K 段分割的组内离差平方和Wn K;a1,a2, ,ak 1 后为止。这样得出的K 就是最后的分割的段数。由图 7 1 所示,组 内离差平方和是随分段段数 K 的增加而单调地 减少。所以当 K n 时,组内离差平方和Wn n;a1,a2, ,an 10 。因此,可根据组内离 差平方和随段数增加而下降到比较稳定的时候(即 图中曲线平缓时)再确定分段段数。例如,采集n个有序样第三节 多元有序数据的最优分割为了分层,有时需要汇集样品更多的信息, 采用多个变量指标

12、。品,每个样品测得 P个变量,原始数据可构成一个 n P阶矩阵,为X11X12X1pX21X22X2pXn1Xn2Xnpn P在多变量情况下,人们自然会联想到是否能将单元有序数据最优分割原理引申到多元 数据中来,以此对n个有序样品进行分割, 一般最简单有效的办法就是把一段样品多个变量 合并为一个变量来处理,统一定义“段直径”。但是,为了使不同变量间具有共同的数据基原始数据矩阵中元素记为:Xil i 1,2, ,n;l1,2, P,则正规化数据为Zi为 min Xilmax Xiimin xil(7-8)得正规化数据矩阵Z11Z12ZpZ21Z22Z2PZn1Zn2Znp的段直径定义为根据正规化

13、数据,将样品段i,d i, ji, j(7-9)础,事先要对各个变量进行数据规范化处理,如使数据作正规化变换。式中Z i, jn,1,2,(7-10)若n个有序样品分为K段,每段内有nk个样品,则多元有序数据最优分割的原理与单元有序数据最优分割一样,使组内离差平方和Wn K; 31,32 ,aK 1d1i, j d2 i, jdK i, jKnkpZk1Zk2i, jminK 1 j n1 Wn K;a1 j ,a2 j , ,aK 2 j , j(7-11)应当指出,样品的段直径除了用式(7-9)定义外,还可用其他方法定义。如用样品数据绝对值距离来定义,即jpD i,jX i, j(7-12

14、)ii也可用其他度量空间的距离来定义。第四节最优分割法的计算步骤1.数据正规化 设原始数据阵为X11X12X1pXX21X22X2PXn1Xn2Xnp将X中的元素Xil变换为ZiiXilmaxXilmin Xili 1,2,n;l1,2,得正规化数据矩阵Z11乙2Z1pZ21Z22Z2pZn1Zn2Znp其中因为2.计算段直径矩阵i, jz i, jZa2i, j0i,j dj,i故必须计算nn 1个d i, j,得2d 1,1 d 1,2d 2,2d 1, nd 2, nd n, n3.计算全部分割的组内离差平方和或段直径和)nn及各种分段的最优分割1)最优二段分割 由 D 矩阵对每一个 m

15、n, n1,2 计算相应的组内离差平方和,Wm 2; j d i, j d j 1,m1,2, , m 1找出最小值,确定相应的最优二段分割点,即Wm 2;a1 m1mj imn 1 Wm 2; j分割点为a1 n , a1 n1 , a1 2 。从而得到 n 个样品 m n 的最优二段分割为x1, x2, xa1 nx a1 n 1, xn ,其中 a1 n 为最优二段分割点。2)最优三段分割 根据 D 矩阵及最优二段分割结果,对每一个 m n, n 1,3计算相应的三段分割的组内离差平方和,为Wm 3;a1 j , jWj 2;a1 jd j 1,mj 2,3,m n, n, m 11,

16、,3然后求出最小值,并确定相应的最优三段分割点,为Wm 3;a1 m,a2 mmin Wm 3;a1 j ,j2 j m1a1n ,a2 n;a1 n 1,a2 n 1; ;a1 3,a2 3从而得到 n 个样品 m的最优三段分割为 x1,x2, ,xa1 n xa1n 1, ,xa2nx a2 n 1 , x n ,其中a1n , a 2 n 为最优三段分割点。3)最优 K 段分割根据矩阵D及最优K 1段分割计算结果,对于每一个m n,n 1, K 分别计算相应的 K 段分割的组内离差平方和,为Wm K;a1 j ,a2 j , ,aK2Wj K 1; a1 j ,a2 j , ,aK 2

17、j d j 1,nK 1,K,m 1;m n,n 1, ,K找出最小值,并确定相应的最优 K 段分割点,即Wm K;a1 m,a2 m, ,aK 1m K m1 ijnm1 Wm K;a1 j ,a2 j , ,aK 2 j , j从而得到 n 个样品 m n 的最优K 段 分割 为x1,xa1 nxa1 n 1,xa2 nxa1 K 2 n ,xa2 K 1 nxa1 K 1 n 1,xn ,其中,a1 n,a2 n , ,aK 1 n 为最优 K 段分割点。4. 绘制 W K 曲线作为最终分段数。在W K曲线上,选择曲线拐点对应的 K值(取整)例7 1某煤矿所采煤层的煤质牌号为主焦煤,在煤

18、巷中见一火成岩墙侵入煤层,致使煤质发生变化,为弄清楚煤质变化情况, 从火成岩附近每隔0.5 m依次取一煤样,获得6个有序煤样的镜煤最大反射率数据为R0 %x1,x2,x3,x4,x5,x6,3.20,2.95,2.35,1.80,1.50,1.45试进行最优分割。此样本最可能分割法共有 25131种,今要在这 31种分割中找出一种最优的分割 (类内差别小,(1)类间差别大) 。其作法如下:对原始数据进行正规化变换后得正规化数据,为Z 1.0000,0.8571,0.5143,0.2000,0.0286,0计算段直径矩阵 D, 即d 1,1 d 1,2d 1,3d 1,4d 1,5d 1,6d

19、2,2d 2,3d 2,4d 2,5d 2,6Dd 3,3d 3,4d 3,5d 3,6d 4,4d 4,5d 4,6d 5,5d 5,6d 6,60 0.01020.12460.38610.68800.913300.05880.21610.40000.528000.04940.12140.167300.01470.023400.00040最优二段分割。由 D 对于 m6,5,4,3,2 时,计算其中其中其中Wn 2;jd i, jd j i,nji,2,m i6时,则W62;4d i,4d 5,60.3865W62;3d i,3d 4,60.i480W62;2d i,2d 3,60.i776

20、W62;id i,id 2,60.5280叫 2; ai 6min. W6 2; jW62;30.i480ai 635时,则W52;4d i,4d 5,50.386iW52;3d i,3d 4,50.i393W52;2d i,2d 3,50.i3i6W52;id i,id 2,50.4000W5 2;ai5imjinW52;jW52;20.i3i6ai 524时,则W42;3d i,3d 4,40.i246W42;2d i,2d 3,40.0596W42;id i,id 2,40.2i6i当m当m当mW4 Zai 4ai 423时,则W3min W4 2;jW4 2;20.05961 J 32

21、;2 d 1,2 d 3,30.0102W32;1 d 1,1 d 2,30.0588其中W Zai 3min W5 2; jW3 2;20.010231 322时,则W2 2, ai 2W2 2;1 d 1,1 d 2,2031 11从而得到6个样品的最优二段分割为Xl,X2,X3 X4 , X5, X6。其中,X3为分割点。Wm 3; 31 j ,jWj 2; 31j d j1,nj 1,2, m1当m6时,则W6 3; 31 5 ,5W5 2; 31 5d 6,60.1316W6 3; 31 4 ,4W5 2; 31 4d 5,60.0600W6 3; 31 3,3W5 2; 31 3d

22、 4,60.0336W6 3; 31 2 ,2W5 2; 31 2d 3,60.1673其中3; a1 6 , a2 6 min W6 3; a j2 j 5,jW6 3,31 3,分割点为:31631 32;32 63。当m5时,则W5 3; 31 4 ,4W4 2; 31 4d 5,50.0596W5 3; 31 3 ,3W3 2; 31 3d 4,50.0249W5 3; 31 4 ,4W2 2; 31 2d 3,50.1214最优三段分割。即对于m 6,5,4,3时,计算(4)0.0366其中3Wi 3; a1 5 , a2 5 min W5 3;a1 j , jWs 3,a1 3 ,

23、30.0249其分割点为:a1 5 a1 32;a? 53。当m 4时,则W4 3; a13,3W3 2;a1 3 d 4,40.0102W4 3; ai2,2W2 2;ai 2 d 3,40.0494其中Wi 3ia1 4 ,a2 4 min W, 3;a1 j , jW, 3,a1 3,3 0.01022 J 3其分割点为:a1 3a1 2 1;a2 4从而得到6个样品的最优三段分割为:Xi,X2 X3X4,X5,X6。(5)最优四段分割。即对于m 6,5,4时,计算Wm 4;a1 j , a:j , jWj 3;a1 j ,a2 jd j1,mj 3,4, m1当m 6时,则4; a1

24、5 , a? 5 ,5W5 3; a1 5 , a2 5d 6,60.02494; a1 4 , a2 4 ,43; a1 4 , a? 4d 5,60.0106We 4; a1 3 , a2 3,3W3 3; a1 3 , a: 3d 4,60.0234其中4;a1 6 ,a2 6 ,a3 6min W 4;a1 j ,a2 j , j3 j 5W 4;a1 4 ,a2 4其分割点为:a1 6 a1 42!; a2 6a2 43; a3 54。当m 5时,贝yW5 4; a1 4 , a24,4W4 3; a 1 4 ,a2 4d 5,50.0102W5 4; a1 3 ,a23,3W4 3; a1 3 , a2 3d 4,50.0147其中W5 4; a1 5 , a2 5 ,a3 5W5 4;a1 4 ,a2 4,40.0102 min则分割点为:a1 5 a1 42:;a2 5a2 43; a3 54。当m 4时,贝y,40.0106W4 4; a1 3 , a? 3 ,3W3 3; a1 3 ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论