




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Good is good, but better carries it.精益求精,善益求善。数学地质2讲2地质数据及其统计分析-第二课地质数据及其统计分析讲5个方面的问题一、地质数据的概念、类型及属性二、地质数据的选择和整理三、地质数据的预处理四、地质数据的统计分布特征五、与油气地质有关的分布函数一、地质数据的概念、类型及属性1概念地质信息的数、字母和符号的集合。2类型按地质数据的特点分为观测、综合和经验数据三大类。观测数据对研究对象直接进行观测和度量所获得的数据。又分为定性和定量数据。=1*GB3定性数据用代码或字符等来表示某一地质特征及其相互间关系的一种“数据”。又分为名义型和有序型两种。
2、名义型数据通过鉴别区分不同的对象或个体并赋予不同代码后形成的数据。如:岩石的颜色、结构、构造等。有序型数据有次序的数码或代码并用次序来表示数码或代码间的一种单调升降关系的数据。如:生油岩的干酪根分成=1*ROMANI,=2*ROMANII,=3*ROMANIII级。又如:油气储量的级别等。=2*GB3定量数据具有数量概念的数据。分为间隔型和比例型数据。间隔型数据特点:不仅能比较其大小,而且能定量地表示数据间的差异;无自然零值,但有负值。比例型数据特点:具有绝对零值而没有负值的间隔型数据。大多数定量数据都属比例型数据。综合数据由观测数据经有限次算术或代数运算后,并具有明确地质意义的数据。如:甲烷
3、系数、时间温度指数值、平均值、均方差、相关系数等。经验数据根据大量实际观测值归纳出来或根据公式计算而得出的经验值。如:单储系数、排烃系数等。3属性统计规律性随机变量的性质,一次观测具有偶然性,多次重复观测,则具有规律性。函数规律性当自变量给定,函数就完全确定了,如:原子核发生衰变时,即子元素数量公式为:式中:衰变开始时原子核的总数衰变时间时间后母元素的数量系数二、地质数据的选择和整理1地质数据选择时应注意的问题根据研究目的和要求选择数据选择的数据反映指标的地质意义明确数据的水平要一致,可靠性要强能对数据的统计和函数规律性作出描述、数量应能满足数学模型的要求数据的分布均匀、合理2数据的处理原始数
4、据矩阵,即方法数据矩阵对原始数据矩阵按一定的方法进行变换,使其满足数学模型的要求,这种经变换后形成的数据矩阵称为方法数据矩阵。如对数变换、正规化变换等。3结构数据模型通常把表示实体及实体之间联系的模型叫做结构数据模型。结构数据模型包括:层次模型用树形结构来表示实体之间联系的模型。网络模型用丛结构来表示实体之间联系的模型。关系模型用表格数据表示实体之间联系的模型。三、地质数据的预处理1可疑数据的鉴别和处理方法肖维纳(chauvent)检验法步骤:计算观测数据的平均值计算单次观测的概率误差其中标准差计算可疑数据与平均值之偏差,并求其与的比值根据所观测次数()以及其对应的之比值决定数据的取舍。如下表
5、所示:5101520501002.52.93.23.33.84.2=5*alphabetice.若,则舍去这一观测值。格罗伯斯(grubps)检验法前提:当按小到大排列且服从正态分布时,构建检验统计量:式中:当时,则为外来值,舍去其值。2数据的简缩均匀化、缺值插补和删点(1)数据网络化方法公式为:式中:第个网格内的网格化值。第个网格内某地质变量第个观测值。第个网格内的观测次数。(2)缺值插补和删点删点:随机删去一些点,保持数据分布均匀。插值:数据平均值或统计方法进行插值。3数据变换(1)目的和要求目的:统一地质变量的量纲使地质变量呈正态分布使变量间的非线性关系转换为线性关系由一种新的独立变量代
6、替原有相关关系的变量要求:变换前后变量间的相关程度不变防止数据产生有偏估计,丢失信息(2)数据变换方法=1*GB3统一量纲的变换a标准化变换公式式中(标准差)性质:变量的量纲一致。服从正态分布,服从标准正态分布。=2*alphabeticb极差变换公式性质数据量纲一致=3*alphabeticc均匀化变换公式性质数据量纲一致,数据都在1附近变化。=2*GB3使数据成正态分布的变换=1*alphabetica对数变换公式式中常数性质使数据服从正态分布=2*alphabeticb广义幂变换=3*GB3线性变换方法=1*alphabetica幂函数方程方法:两边去对数令,则b指数函数方程方法:两边去
7、对数令,则c指数函数方程方法:两边去对数令,则d对数函数方程令,则e双曲线函数方程方法:令,则f抛物线函数方程方法:在曲线上取一点令,则四、地质数据的统计分布特征1概念数据的统计分布使指经频率曲线拟合后得到的样本频率曲线,称之为统计分布。2统计分布曲线的特性曲线的峰数样本的统计分布曲线有三种类型,即单峰、双峰和多峰。曲线的偏度按曲线的对称形态可分为两类,即对称、偏态曲线。=1*alphabetica对称曲线:单峰对称曲线、双峰对称曲线b偏态曲线:单峰、双峰或多峰,按主峰的位置确定为正偏或负偏。正偏:主峰位于均值的左侧,在大于均值的一侧有一长尾。负偏:主峰位于均值的右侧,在小于均值的一侧有一长尾
8、。偏态系数:式中:三阶中心矩当对称当轻微不对称当不对称当负不对称曲线的峰度曲线的峰度使指统计分布曲线的陡峭程度,常用峰态系数来表示:峰态系数式中四阶中心矩当,则为正态分布曲线当,比正态曲线较尖峭当,则较平坦曲线的统计特征数=1*alphabetica平均值公式:b中位数c众数频率分布曲线中具有最大频率的变量值称为众数。d极差公式:e方差和标准差方差:标准差:f变异系数公式:g偏态系数公式:h峰态系数注:平均数、中位数、众数反映数据的集中程度,称为整体代表性特征数;方差、标准差、极差、变异系数反映数据分散性特征,称之为离散型特征数。五、与油、气地质有关的分布函数1正态分布(高斯分布)函数随机变量(取值为)的密度函数:正态分布的分布函数为:当时,称之为标准正态分布密度函数为:分布函数为:2对数正态分布函数密度函数为:式中:3服从正态分布的油气地质变量有机地球化学指标=1*alphabetica干酪根中的碳、氮元素b饱和烃及其馏分正烃含量沉积学中负正态分布的变量a粒度(单位),即式中:颗粒直径,以为单位。=2*alphabeticb圆度(单位)=3*alphabeticc球度d斜层理的倾角物性参数孔隙度4服从对数正态分布的油气地质变量有机地球化学指标=1*alphabe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 猪肉收储知识培训课件
- 人教版(2024)七年级英语下册Unit 7 学情调研测试卷(含答案)
- 钢结构切割施工方案
- 2025年中考物理二轮复习:电磁学实验题 能力提升练习题(含答案)
- 合同范本融资租赁合同
- 课题2 原子结构(第2课时)(教学设计)九年级化学上册同步高效课堂(人教版2024)
- 如何评估品牌传播的效果与影响计划
- 提升产品质量的改进措施计划
- 学期目标与教学任务分解计划
- 实施素质教育的年度工作要点计划
- 2024年医用卫生材料敷料项目申请报告模板
- 《危险化学品企业安全生产标准化评审标准》
- 成人鼻肠管的留置与维护
- 国能辽宁北票 200MW 风力发电项目地质灾害危险性评估报告
- ISO22000:2018体系之食品安全管理手册含程序文件汇编2022版
- DZ∕T 0214-2020 矿产地质勘查规范 铜、铅、锌、银、镍、钼(正式版)
- QCSG1204009-2015电力监控系统安全防护技术规范
- (正式版)SHT 3158-2024 石油化工管壳式余热锅炉
- 新生儿传统四病筛查
- GB/T 41666.4-2024地下无压排水管网非开挖修复用塑料管道系统第4部分:原位固化内衬法
- 小班社会《多喝水身体好》课件
评论
0/150
提交评论