版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中华人民共和国地质矿产行业标准数字地质数据质量检查与评价中华人民共和国国土资源部发布IDZ/T0268—2014前言 Ⅲ 12规范性引用文件 1 13.1术语和定义 13.2符号 34总则 44.1数字地质数据质量检查与评价通则 44.2数字地质数据质量元素 44.3数字地质数据缺陷分级 54.4数字地质数据质量的衡量指标 54.5数字地质数据质量检查与评价的基本要求 65数字地质数据质量检查 75.1数字地质数据质量检查项 75.2数字地质数据质量检查方式 75.3数字地质数据质量检查方法 6数字地质数据质量评价 6.1数字地质数据质量评价结果的表达方式 6.2数字地质数据质量评价规则 7数字地质数据质量检查与评价的实施 7.1检查与评价流程 7.2检查与评价依据 7.3过程检查 7.4验收检查 7.5质量评价 7.6复核与复检 227.7监督抽检 22附录A(规范性附录)数据缺陷分级 23附录B(规范性附录)检查项及其代码表 26附录C(规范性附录)验收抽样方案表 附录D(规范性附录)监督抽样方案表 附录E(资料性附录)数据抽样方案示例 43附录F(资料性附录)数据抽样方法示例 45附录G(资料性附录)多级表数据抽样方案示 47Ⅱ附录H(资料性附录)数据质量报告格式 附录I(资料性附录)数字地质数据抽样方案特性 附录J(资料性附录)1:5万地质图数据库质量检查与评价示例 参考文献 76Ⅲ本标准根据提高科学性、准确性和实用性的原则,按照GB/T1.1—2009《标准化工作导则第1部分:标准的结构与编写》的要求编写。本标准由中华人民共和国国土资源部提出。本标准由全国国土资源标准化技术委员会(SAC/TC93)归口。本标准起草单位:中国地质调查局发展研究中心、山东省国土资源信息中心、同济大学。1数字地质数据质量检查与评价本标准规定了数字地质数据的质量元素、缺陷分级、检查项、验收与监督抽样检验方法、检查与评价的规则及方法,以及数据质量检查与评价的流程与实施等要求。本标准适用于已有资料数字化建库和基于野外或现场数据数字化采集建库的数据生产过程质量检查与控制,数据验收过程的质量检查与评价以及数据质量的监督检验,地质数据库(集)建设规范中相关质量要求的编写等。项目质量的监督抽样检验也可参照执行。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T2828.4—2008计数抽样检验程序第4部分:声称质量水平的评定程序GB/T2828.11—2008计数抽样检验程序第11部分:小总体声称质量水平的评定程序GB/T10111-2008随机数的产生及其在产品质量抽样检验中的应用程序GB/T13989—2012国家基本比例尺地形图分幅和编号GB/T18316—2008数字测绘成果质量检查与验收GB/T21336—2008地理信息质量评价过程GB/T21337—2008地理信息质量原则3术语、定义和符号下列术语、定义和符号适用于本文件。3.1术语和定义数据质量元素dataqualityelement说明对数据规范或用户要求符合程度的数据质量特性。质量检查的基本单元,又称检验单元。可以是图幅、要素、实体或数据项。根据同一技术要求生产并汇集在一起进行抽样检验的一定数量的个体,简称批。2批中所含个体的数量,从检验批中抽取的用于检查的一个或一组个体。样本量samplesize样本中所含个体的数量。质量元素不满足数据规范或用户要求。轻缺陷lightdefect个体的一般质量元素不符合规定,或个体的质量元素轻微不符合规定,对用户使用有轻微影响。个体的较重要质量元素不符合规定,或个体的质量元素较严重不符合规定,对用户使用有较大影响。个体的重要质量元素不符合规定,或个体的质量元素严重不符合规定,对用户使用有重大影响。极严重缺陷themostseriousdefect个体的极重要质量元素不符合规定,或个体的质量元素极严重不符合规定,以致不经返工处理不能提供用户使用。样本(或批)中缺陷数除以样本量(或批量),再乘以100。注1:根据GB/T2828.1—2012改写。不合格品nonconformingitem所含缺陷数不符合要求的图幅或实体。3不合格品百分数percentnonconforming(inalotorsample)样本或批中不合格品数除以样本量或批量,再乘以100。接收质量限acceptablequalitylevel可接收的批数据的最大每百个体缺陷数或不合格品百分数。抽样检验samplinginspection利用所抽取的样本对数据的一个或多个检查项进行检查。并与规定的要求进行比较的活动。抽样方案samplingplan规定每批应检查的样本量和有关批数据接收准则的具体方案,用(n,Ac)表示为样本量,Ac为接收数。监督批中允许的不合格品数前上限值L基于声称质量水平,对所研究的监督批的样本中允许出现的不合格品数的最大数自。数据集dataset可识别的数据集合:检查项inspectedentry数据质量的检查内容,是质量检查与评价的基本单元。3.2符号M全检/抽检中与单个检查项各级别缺陷等价的最低级别缺陷数之和。U◆全检/抽检中单个检查项的实际百单位个体缺陷数。S金/轴——全检/抽检中单个检查项得分。44.1数字地质数据质量检查与评价通则4.1.1数字地质数据包括以图形为主的空间数据、以属性为主的数据(包括点空间数据)、符号化制图数据和格网数据(包括影像数据和栅格数据)等类型。4.1.2数字地质格网数据质量检查与评价按照GB/T18316—2008的规定执行。4.1.3以图形为主的空间数据、以属性为主的数据(包括点空间数据)、符号化制图数据质量的检查与评价执行本标准。4.1.4本标准为通用标准,实施时应根据不同类数字地质数据的特点与检查评价的要求,按照选择、细化、扩展的原则,调整质量元素、缺陷分级、检查项和评价规则等,确定适用的质量检查与评价要求或编写实施细则。4.2数字地质数据质量元素数据质量元素是数据质量的描述框架,通常分为两级,一级数据质量元素是具有相同性质的二级质量元素的集合,二级质量元素描述数据质量的具体特性。本标准根据GB/T21337—2008,结合数字地质数据特点,确定了数字地质数据质量元素。数字地质数据质量元素包括数据完整性、逻辑一致性、空间定位准确度、属性数据准确性、图面整饰规范性和数据源有效性等一级质量元素及相应的二级质量元素,其组成与描述见表1。表1数字地质数据质量元素多余数据集(库)中存在不需要的数据,如多余图之间、属性及关系的逻辑规则的符合程度与标准或规范规定结构的符合程度,如与数据值对值域的符合程度,如代码在代码表范围内,值符合值域范围并满足值域运算关系拓扑特征的准确度,如要素类型定义正确、多边形封闭、多边形之间空间关系正确、结点关多数据集相关内容的一致性的多个数据集相关内容的一致性;相邻图幅间5空间位置的准确度空间定位基础坐标系、投影参数、图廓点、坐标网交点、控制点坐标等的准确程度定量属性的准确度、定性属性的正确性、要素及其属性图面整饰符号正确、定位准确、表示合理;线划形态符合要求、线型设置正确;网纹类型、颜色、高度、宽度和透明系数等参数设置正确要素压盖关系符号与符号、符号与其他要素以及要素之间的图廓整饰规范性图廓整饰符合有关标准或规定,图面结构搭配数据源完成的时间、介质、质量和资料分布状况等与4.3数字地质数据缺陷分级在数据质量检查与评价中,用“缺陷”量化检查中出现的各类不符合规定的问题。本标准用质量元素的重要程度和质量元素不符合规定要求的严重程度划分缺陷的级别,并将缺陷分为四级,即极严重缺陷、严重缺陷、重缺陷、轻缺陷。为便于质量评价,赋予除极严重缺陷以外的其他3个缺陷级别之间一定的等价关系,推荐等价换算比例为9:5:1,即1个严重缺陷相当于9个轻缺陷,1个重缺陷相当于5个轻缺陷。有些数据的检查需要将多个不符合规定的问题记为一个轻缺陷,使用者可根据具体情况进行调整。当被检查数据表中的数据项特别多时,为提高质量评价的准确度,可适当扩充缺陷级别,并根据评价需要给出不同级别缺陷之间的等价关系。例如,为了对矿产地数据进行更精细的评价,除极严重缺陷外扩充为五级,即严重缺陷、重缺陷、次重缺陷、轻缺陷、次轻缺陷,等价换算比例为16:9:5:2:1。以图形为主的空间数据、以属性为主的数据(包括点空间数据)和符号化制图数据的缺陷分级及不同级别缺陷的等价换算比例见附录A。4.4数字地质数据质量的衡量指标数字地质数据的质量采用计数的方法衡量,分为两种质量指标,即批中不合格品百分数和每百个个体所含缺陷数。多图幅数据使用前者,幅内数据及以属性为主的数据使用后者。对于监督抽样检验,由于样本量相对较小,本标准采用批中允许的不合格品数作为质量指标。64.5数字地质数据质量检查与评价的基本要求4.5.1数字地质数据质量检查与评价的主要阶段数字地质数据的质量检查与评价分为生产过程的质量检查与控制、验收过程的质量检查与评价、复核复检过程的质量检查与评价三个主要阶段。数字地质数据质量检查贯穿数据生产、验收、复核复检和监督抽检的全部过程,数据质量验收时进行数据质量评价,复核复检是否进行质量评价视具体要求而定。4.5.2生产过程中的质量检查与控制数字地质数据生产过程的质量检查与控制主要包括利用现有资料建库的过程检查与控制,野外数字化采集数据建库的过程检查与控制。生产过程中实行两级质量检查制度。一级检查是对数据生产过程如野外数据采集、样品测试分析和纸质资料的数字化等各种手段获取数据进行的质量检查,分为作业人员自检、互检和项目组抽检。二级检查是在数据生产完成后,在生产单位质量管理或相关部门监督或参与下,项目组(或委托其他人员)对准备提交验收的数据进行的质量检查。三级检查应覆盖全部数据集,可恨据具体情况确定全检或抽检。两级检查木可银失,旨在发现数据中存在的质量问题,不进行质量评价。对检查中发现的问题、错误要进行逐一修改,修改后进行复查,通过复查属方可进行下一级检查或验收。记录检查、修改及核实的情况与结果,由相关人员签字确认,格式参见表2。数据生责过程中作业人员要根据生产情况填写工作日志,格式参见表3。检查修改记录和工作自志作为数据质量检查记录。以备验收时审查表2×又×数据生产检查表阶段检查类别间题处理检查人签名.作业人签名检查人签名,表3×××数据生产工作日志表日期作业人签名4.5.3验收过程中的质量检查与评价数字地质数据实行两级验收制度,即生产单位组织的初审(预验收)和任务委托单位(机构)组织的验收。初审是在二级检查的基础上生产单位组织的预验收。通常采用全检和抽检相结合的方式进行,要求在检查与评价的基础上给出初审结论并对数据质量进行评述。初审重点是确定任务是否完成、质量7是否达到验收要求。验收是在数据质量通过初审后,由任务委托单位(机构)组织专家或委托有关机构按照相关标准或要求进行验收。通常进行抽检,要求在检查的基础上进行质量评价并给出验收结论与质量报告。4.5.4复核与复检的检查与评价经验收合格的数据,承担单位应根据验收结论与质量报告进行修改完善,完成后提交任务委托单位(机构)复核,复核只针对验收时发现的问题进行100%检查,根据检查结果可调整评价结论。验收不合格的数据返回项目承担单位修改或重做,完成后进行复检即重新检查和验收,复检时进行加严检查,由任务委托单位确定评价规则并给出评价结论。必要时复核与复检可以重复多次,4.5.5监督抽检数据质量监督抽检指由生产任务的下达单位(机构)组织的抽样检验。旨在发现数据质量及质量管理中存在的问题,督促生产单位采取改进措施提高质量,达到数据生产的技木要求。在数据生产的任何阶段都可能进行监督抽检5数字地质数据质量检查5.1数字地质数据质量检查项根据一级质量元素和二级质量元素划分出卷干检查项。其体检查项见附录B。为便于利用计算机进行质量检查和缺陷的归类统计,对检查项进行编码。检查项代码由五位数字码组成,结胸见图1。代码的第一位为一级质量元素代码第二位为一级质量元素代码,后三位为质量元素所含检查项的顺序码。代码表见附录B 图1检查项代码结构图在实际工作中可以根据需要对检查项进行选择或扩充。扩充检查项的代码应在现有代码表的基础上按顺序增加。5.2数字地质数据质量检查方式5.2.1.1全数检验和抽样检验数字地质数据质量的检查方式分为全数检验(全检)和抽样检验(抽检)。全检:对批数据中的所有个体进行逐一检查,并根据相关标准或要求判定其是否合格的检验。生产过程的数据质量检查主要采用全检,某些重要的数据在验收阶段也可能要求全检。抽检:从批数据中抽取适当数量的个体作为样本,对其进行全数检验,并根据相关标准或要求判定其是否可以接收的检验。抽检是用样本的质量判断批质量的一种方法。原则上能够用计算机自动检查的一律全检,对检查量大、检查过程复杂、需要人工检查的检查项一般采用抽检。5.2.1.2实施抽样检验的数据应符合的条件进行抽样检验的数据应具备相同或基本相同的质量特性,而且影响数据质量的主要生产条件应相8同或基本相同,即在统一的标准或规范指导下,由基本相同的数据源、在基本相同的时段以及相同或基本相同的软硬件条件下生产的数据。根据检验的目的,抽样检验分为验收抽样检验与监督抽样检验两类。验收抽样检验的目的是确定批数据是否可接收,以较低的耗费获取质量符合标准或要求的批数据,它主要关心肯定结论的正确性。监督抽样检验是由第三方对数据独立进行的检验,其主要目的不是评估批数据的质量水平,而在于发现不合格的批,它主要关心否定结论的正确性,而不保证肯定结论的正确性。数字地质数据的两级验收通常采用验收抽样检验,应按7.4.5规定的要求实施。数字地质数据质量的监督抽检应采用监督抽样检验,按本标准7.7规定的要求实施。抽样方案是规定批数据应检查的样本量和有关批数据接收准则的具体方案,用(n,Ac)表示,n为样本量,Ac为接收数。其含义是从批量为N的批中抽取n个个体构成样本,并对样本全检,样本中包含的不合格品数或缺陷数小于或等于Ac时接收该批。在批量小于8时由专家确定抽样方案。与验收抽样检验和监督抽样检验相对应,本标准提供验收与监督两种抽样检验方案。验收抽样检验方案包括连续性批正常、加严、放宽与一次性批检验方案。由多年持续生产的数据组成的批,称为连续性批数据,如国家1:20万区域地质图数据库。数据的验收抽样检验方案由下列内容组成:a)数字地质数据连续性批和一次性批检验的样本量表;b)与连续性批正常、加严和放宽检验对应的抽样方案表。一次性批数据采用连续性批正常检验c)连续性批数据的正常、加严与放宽检验规则。连续性批数据的抽样方案在GB/T21336的原则指导下,参考GB/T2828.1制定的计数抽样方案;一次性批数据的抽样方案采用样本量增大两级的连续性批正常检验抽样方案。AQL是确定验收抽样方案的重要参数。无论连续性批还是一次性批数据均使用AQL和批量查找抽样方案。本标准中AQL的取值范围为0.01~50。AQL的值等于或小于10时适用于不合格品百分数或每百个体缺陷数作为质量指标的检验,AQL的值大于10时适用于以每百个体缺陷数作为质量指标的检验。连续性批数据的样本量表见附录C的表C.1;连续性批正常检验抽样方案表见表C.2;连续性批加严检验抽样方案表见表C.3;连续性批放宽检验抽样方案表见表C.4。数据抽样方案的查找包括两个步骤,第一根据批量和检查的严格程度查找样本量表确定样本量;第9二根据样本量和AQL查找相应的抽样方案表确定接收数。连续性批抽样方案查找的具体步骤如下:a)查找样本量根据批量N和检查要求,从表C.1中的正常、加严或放宽列中查出相应的样本量n。b)查找接收数根据检查要求(正常、加严或放宽),在表C.2、表C.3或表C.4的样本量列确定样本量所在行,在AQL数值栏查找规定的AQL值所在列,样本量所在行和AQL所在列交叉处的数字即为接收数Ac,若交叉处为箭头则采用箭头所指的第一个有接收数的抽样方案。若交叉处为加粗的一组双格数字,这时需要进行样本量降级处理。双格处上格为接收数,下格为样本量,此时,应按查到的样本量重新查找接收数。样本量降级处理只进行一次。样本量n与接收数Ac构成抽样方案,示例见附录E的E.1。5.2.2.1.5连续性批数据正常、加严和放宽检验规则连续性批数据正常、加严和放宽检验规则如下:a)在生产过程中如果采用抽样检验方式检查数据质量,则应加严检验b)在数据验收检验的过程中,如果样本数据不符合质量要求,则应在后续检验中加严检验;如果样本数据质量普遍较好,则实施放宽检验;c)连续性批数据的首次验收应加严检验;d)验收阶段如果质量验收结论为优秀,复核时应放宽检验;如果质量验收结论为良好,复核时按正常检验;如果质量验收结论为合格,复核时按加严检验;如果验收结论为不合格,应进行复检,复检时采用加严检验。5.2.2.1.6一次性批数据的抽样方案一次性批数据抽样方案的样本量表见表C.1,抽样方案表见表C.2。一次性批数据样本量查找表C.1的一次性批列,接收数查找的步骤和方法与连续性批正常检验的查找方法相同,示例见E.2.1中的示例2。监督抽样以图幅或记录为个体进行抽样。监督抽样检验方案中,使用声称质量水平DQL作为质量指标,使用不合格品限定数L作为判定数。本标准给出的监督抽样方案将GB/T2828.11—2008抽样方案表的批量范围从250扩大到1000,采用与国标相同的超几何分布原理推导抽样方案,当批量大于1000时,符合GB/T2828.4—2008的要求。监督抽样检验方案分I级和Ⅱ级两个质量检验水平,Ⅱ级比I级高。Ⅱ级检验水平对应的样本量比I级检验水平对应的样本量大,对不合格批的漏判概率小。使用者应根据监督抽检的需要确定采用的检验水平。在第I级检验水平的抽样方案中规定L=0,在第Ⅱ级检验水平的抽样方案中规定L=1,即监督批样本中允许出现的最大不合格品数分别为0和1。5.2.2.2.3监督抽样方案查找方法第I级检验水平的抽样方案表见表D.1,第Ⅱ级检验水平的抽样方案表见表D.2。表D.1和表D.2中的第一行N为批量,DQL为质量指标,根据批量和质量指标DQL查找样本量。(n,0)或(n,1)构成抽样方案,含义是从批量N中抽取n个样品组成样本,对样本进行全检。对于前者,在检验中,只要出现一个不合格品,则判定该监督批不合格。对于后者,允许样本中存在1个不合格品。如果出现2个或2个以上不合格品,则整个监督批不合格。在查找抽样方案时,当实际批量小于1000,且与表中给出的批量值不相等时,采用与实际批量最接近的右侧值为批量。当实际批量大于1000时,则按7.7的规则处理。示例见E.2。数字地质数据的抽样方法包括统计抽样和非统计抽样。统计抽样方法包括简单随机抽样、系统抽样、分层抽样和整群抽样。非统计抽样方法主要指判断抽样,是应用专家知识和经验进行的抽样,也称目的抽样。在本标准中主要用于批量小于8或空间分布不均匀数据的空间抽样。选择抽样方法的原则是保证抽出的样本能够充分代表批。无论验收抽样还是监督抽样,选取与使用抽样方法的原则基本相同统计抽样方法的核心是随机抽样,即在抽取样本的过程中,使批中的每个个保都有同等被抽取的机会,以保证样水的代表性。本标准除采用了GRZT=OL12008中规定的简单随机抽样系统抽样与分层抽样方法外,还屎用了整群抽样方法,简单随机抽样是从批里随机地抽取个体组成样本的方法,也称单纯随机抽样。量是一种最基本的抽样方法,是其他抽样方法的基础一常用的实现方法包抵抽签法和随机数法。系统抽群将批中的所有个体按一定顺序排列,在规定的范围内随机抽取某个体作为初始单元,然后按事先确定的规则抽取其他样本单元。系统抽样方法可按时间、全间、图幅或记录编号的顺序抽取,其代表性强,实施简单,在数据质量抽样检验中常与整群抽样组合使用。见附录下的示例1分层抽样又称分类抽样,或类型抽样。将批分割成互不重叠的子批(层)然后从不同的层中独立、随机地抽取样本,各层的样本构成总样本。分层抽样适用于同一批数据是由不同单位或个人生产的情况。分层抽样方法的示例见附录F中的示例2和示例3。整群抽样是将批分为作多群,每群由个体按一定方式结合而成,随机地抽取若干群,并由所抽群中的所有个体组成样本。整群拥样适用于以表的形式存储的属性数据,如前产地、钻孔、自然重砂和地质灾害数据库等。整群抽样方法的示例见附录F中的示例4。空间抽样是基于空间分布形态在一定区域内抽取样本的方法。本标准的空间抽样方法是一种判断抽样,空间抽样适用于图幅数据(包括以图形为主的空间数据和符号化制图数据)组成的批。下述两种情况都需考虑空间分布,使抽出的样本能够代表批数据的质量。一是从多图幅数据中抽取一定数量的图幅(幅间抽样),二是从单图幅数据内选择一定区域抽取要素(幅内抽样)。空间抽样方法示例见附录F中的示例5。5.3数字地质数据质量检查方法数字地质数据质量的检查方法包括计算机软件自动检查、人机交互的计算机辅助检查和人工判别检查三类。在实施检查时应根据检查项选择不同的检查方法。计算机自动检查是指应用计算机软件对数据质量进行的检查,主要包括标准模板分析检查、约束条件分析检查和计算检查。具体描述如下:a)标准模板分析检查:根据相关标准、规范和要求规定的结构、命名规则或代码表等建立的模板与待检查数据进行对比分析。可用于检查数据库结构、数据表结构与相关标准的符合程度和数据的完整性等,如属性结构、属性设置、要素分层、文件命名及存储格式与相关标准符合程度。b)约束条件分析检查:可用于对空间要素拓扑规则、属性与要素的对应关系、属性表之间关系和属性数据项之间的关系等进行分析检查c)计算检查:采用统计等理论计算来判断数据的精度和准确度。主要用于空间定位基础精度、校正精度和通过计算获得的属性数据。如图廓点、坐标网交点控制点坐标、扫描或矢量化数据的校正精度等计算机辅曲检查是指在无法实现计算机自动检查时所采用的人机交互检查。计算机辅助检查主要包括放大漫游检查、数据关联检查和数据格式转换检查等。具体描述如下:a)屏幕显示检查:通过计算机屏幕显示(放大、缩小、拖动)对数据进行检查。可用于检查空间数搪的地理覆盖范围、套合程度和接边一致性等,如有描矢是化图和原图的套合程度、要素无遗b)数据养联检查:根据要素与要素之间要素与属性之间以及属性与属性之间的关联正确性来判断数据正确性的检查。如通过不同图层数据的登加显示,检查数据的正确性和一致性。通过(特别是多级表及外挂表数据)进行关联。c)数据格式转换检查:将空间数据转换成文本数据或将有空间特性的文本数据转换成空间图形数据,利用空间图形数据的可视性和文本数据的可计算性对数据进行正确建检查。如通过将带有坐标的属性数据转换成空间数据,并与其他图层套合,检查属性数据的正确性。检查人员根据有关标准或要求进行的数据检查。主要用于计算机软件难以实现的数据检查。人工检查主要包括实地检查、对比检查和打印输出检查等。具体描述如下a)实地检查:当野外调查数据的正确性在室内无法确定时,需进行野外实地测量或调查,以检查b)对比检查:检查人员通过与相应的数据源进行对比的检查。主要用于检查专业内容或文档描述和表达的准确性等。c)打印输出检查:将数据(图或表)打印输出检查其正确性和完整性。主要用于图幅接边、图层套6数字地质数据质量评价6.1数字地质数据质量评价结果的表达方式数字地质数据质量评价结果通常采用定性和定量两种方式表达。定量表达:根据百分制的得分划分质量等级,采用优秀、良好、合格、不合格等四个级别表征数据质量。具体描述如下:d)不合格S<60分6.2数字地质数据质量评价规则定性评价规则如下:a)检查过程中一旦出现极严重缺陷则判定数据不合格;当出现严重缺陷时可根据用户要求增加评价结论的限制条件,并在实施细则中明确规定;b)单个检查项数据合格的判定:全检检查项的每百个体缺陷数(换算为最低级别缺陷数后)不大于相应的质量要求时,判定合格;抽检检查项的缺陷数(换算为最低级别缺陷数后)不大于数据抽样方案表中质量指标对应的判定数时合格;c)数据集合格的判定规则:当数据集的所有检查项都合格时,数据集合格;对于个别检查项不合格的情况,依据检查项的重要性和数据集的质量要求,由任务委托单位适当调整判定规则,并在检查验收细则中明确规定;d)多个数据集综合质量合格的判定规则:当所有数据集的质量合格时,综合质量为合格;对于个别数据集不合格的情况,依据数据集的重要性和数据的质量要求,由任务委托单位适当调整判定规则,并在检查验收细则中明确规定;e)多图幅数据验收抽检时,数据集质量抽检合格的判定规则:若样本中的不合格品数小于或等于所选抽样方案中给出的接收数Ac,则判定该数据集抽检合格;否则为抽检不合格。6.2.2定量评价规则定量评价规则如下:a)在定性评价合格的基础上进行定量评价;当出现严重缺陷时,可根据用户要求增加评价结论为优秀的限制条件,并在实施细则中明确规定b)检查项得分预置100分,质量指标对应60分,采用扣分法计算检查项得分,详见7.5.2;c)数据集得分采用所有检查项得分的算术平均;d)多个数据集的综合得分为所有数据集得分的加权平均。质量评价前应赋予每个数据集一定的权重。7数字地质数据质量检查与评价的实施7.1检查与评价流程数字地质数据质量检查与评价一般需要经过下列步骤:确定检查与评价的依据、数据范围、数据检查项、质量指标、检查方式和方法,实施检查并记录检查结果,验收时对检查结果进行评价并编写评价报告。图2所示为数字地质数据质量检查与评价的基本流程,表达了对生产过程数据的两级质量检查、对成果数据验收的检查与评价、复核复检以及监督抽检。验收抽样过程见图3,监督抽检过程见图4。西否是否抽检?是样本(详见图3)否生成复核意见是是否有致命缺陷?否评价方式否是图2数字地质数据质量检查与评价流程>8幅?否是查出判定数选择检查方法图3数字地质数据验收抽样流程是样本量 是否题同样要求改正图4数字地质数据监督抽检流程确定数据检查与评价依据和要求,包括数据检查与评价所参照的标准规范、合同或任务书要求以及任务委托单位的验收要求等。通常,验收检验应根据本标准的要求制定数据质量检查与评价实施细则。根据数据生产过程情况,确定数据质量控制点,划分阶依据数据生产过程中各阶段数据内容、特点和质量要求,从附录B中选择检查项。根据检查项,从5.3重选取相应的检查方法,由作业员对数据进行100%全面检香,检查中发现的问题要全部修酸,并对检查发现的问题和修改情况进有记录。自检记录表见表2。的问题由催业员进行全部修改,并对检查发现的问题和修改情况进行记录。互检记录表见表2。经反复检查和修改,互检人员检查没有问题后,交由项且根据检查项由项目组根据需要自行规定抽检的比例随机抽取样本,并从6.3中选取相应的检查方法实施检查。抽检中发现的问题由作业员进行全部修改,并对所发现的问题和修改情况进行记录。抽检记录表见表2。二级检查是野外验收或数据初审之前的检查,应在生产单位质量管理或相关部门监督或参与下,项目组(或委托其他人员)组织人员对数据进行检查。根据检查项,从5.3中选取相应的检查方法,对数据进行全面检查,并对检查发现的问题和修改情况进行记录。根据数据质量检查与评价的要求确定数据集。空间数据集、属性数据集、制图数据集、元数据集与文档等是主要的地质数据集。此外,数据质量检查记录可以间接衡量数字地质数据质量,也可作为独立的数据集进行检查评价,参与数字地质数据质量的综合评价,所占权重由用户自定。验收检查通常涉及多个数据集,检查前应确定各数据集的权重。如地质图数据库可以划分为空间数依据各数据集的类型、特点和质量要求,从附录B中选择检查项。例如,检查制图数据时,不需选取属性数据准确性;检查矿产地数据时,不需选取拓扑关系和接边精度等;检查重砂和地质灾害点数据时,由于难以确定整个数据库应包括的重砂和地质灾害点的个数,数据完整性的检查项不需选取记录的遗漏或多余。野外调查成果数据验收与最终成果验收都涉及多个数据集,如野外手图库、野外总图库、实际材料图库及最终地质图及配套的空间数据库。除了分别检查每个数据库的完整性、正确性、结构的一致性等内容外,需要重点检查几个数据库中相关内容的一致性,如具有继承关系内容的一致性等。如果附录B的检查项不能满足需要时,可以按照5.1的要求进行扩展。质量检查记录和文档数据集的检查项由用户根据质量元素,参考附录B自行确定。根据确定的检查项,按照附录A的内容确定或调整缺陷分级。当调整现存缺陷级别或确定新增检查项的缺陷级别时,应保证不同质量元素的同一缺陷级别对数据质量的影响程度基本一致。AQL应由数据质量规范或用户要求给出。如果没有规定可将相关的质量要求转换为AQL或根据历年数据质量情况或预检结果确定。确定AQL应考虑的因素:质量要求、数据的复杂程度、检查项的数量以及检查验收的时间和经费等。多图幅数据的AQL需要确定两个值,一是数据集的接收质量限,即该数据集可接收的最大不合格品百分数。二是单图幅数据的接收质量限,即该图幅可接收的最大每百个体缺陷数。以属性数据为主的数字地质数据的AQL是该批数据可接收的最大每百个体缺陷数。根据5.2.1规定的要求参照附录B确定每个检查项是全检还是抽检。验收检查阶段的抽样检验采用验收抽样方案,主要分为三类:多图幅抽样、单图幅抽样和以属性数据为主的数据的抽样检验。多图幅抽样是将图幅作为个体的抽样,也称幅间抽样。单图幅抽样是以图多图幅数据包括标准图幅和非标准图幅数据。标准图幅指按GB/T13989—2012划分的图幅。非标准图幅指按行政区划、某种研究或统计区域等划分的图幅。野外数据采集中生成的图如野外手图库、实测剖面图库的抽样方法与多图幅和单图幅的抽检方法相同。本条给出实施数字地质数据验收抽样的要求和过程,主要包括选择个体、查找抽样方案、确定抽样方法并抽取样本,具体流程见图3。验收抽样方案包括连续性批与一次性批数据的抽样。7.4.5.1多图幅数据的抽样确定多图幅数据的抽样方案如下:a)图幅数大于1小于8时,采用专家判断法抽样。根据对图幅质量的要求和检验经验,确定抽取的样本数及AQL。b)大于等于8幅的数据则按下述步骤确定抽样方案:1)根据确定的该批数据可接收的最大不合格品百分数AQL,从附录C的表C.1中查找与总图幅数N对应的样本图幅数n。2)连续性批数据根据检验的严格程度要求从表C.2,表C.3或表C.4中查找与n、AQL对应的接收数Ac(图幅数);一次性批数据从表C.2中查找与n、AQL对应的接收数Ac。7.4.5.1.2确定抽样方法并抽取样本多图幅抽样通常采用分层抽样方法抽取样本。分层的具体原则如下:a)当批数据由不同单位生产时,将每个单位生产的数据作为层(子批),应保证每个单位的数据都必须抽到,且各单位数据之间样本量分配比例基本上等同于子批的比例,b)当个体的复杂程度和重要程度不同时,可按以下三个原则进行分层抽样:1)内容简单的图幅基本不抽。2)抽取单幅时,选择复杂程度或重要程度最高的图幅,3)抽取两幅以上时,复杂(重要)与中等复杂(重要)程度抽取概率相同。多图幅数据分层抽样方法的示例参见附录F中的示例2和示例3。7.4.5.2单图幅数据的抽样确定单图幅数据的抽样方案如下:a)根据确定的该批数据可接收的每百个要素所含最大缺陷数AQL、连续性批检验的严格程度及是否为一次性批数据,从表C.1中查找与该图幅内的总要素数N对应的样本量n。b)连续性批数据根据检验的严格程度从表C.2、C.3或表C.4中查找与n、AQL对应的接收数Ac;一次性批数据从表C.2中查找与n、AQL对应的接收数Ac。7.4.5.2.2确定抽样方法并抽取样本考虑要素空间分布的不均匀性,采用专家判断法选取抽取样本的一个或多个空间区域,并从中抽取样本,直到区域内的总要素数不小于n为止生,空间数据抽样方法见附录F的示例5。在野外数据数字化采集中,为检查多个数据集相关内容的一致性,采用判断法抽取选定区域的所有数据子集。7.4.5.3属性数据抽样属性数据可由单表、多级表或其组合构成。当数据是由多个单级表和/或多级表组成时,应将每个单级表和每个多级表都作为一个子集分别逐一进行抽样检验,然后再遵循一定的规则实施综合评价。属性数据的抽样以数据项为个体,采用整群抽样,即以数据项的个数计算批量和样本量,以表中的记录为群抽取样本。针对数字地质数据特点,采用统计与经验判定相结合的方法确定多级表的抽样方案和抽样方法。单表数据的抽样步骤如下:a)计算批量N:N=Na×m。Na为单表数据的总记录数,m为每条记录需抽检的数据项数。b)根据N,从表C.1中查出对应的要抽检的数据项数n,即样本量。c)计算抽取的记录数n₁,n₁=n/ms若π,为非整数,则取整加1。次性批数据从表C2中查找与A、AQL对应的接收数e)采用随机或系统抽样的方法抽取n₁个记录。多级表数据的抽样步骤如下:a)在一级表中以数据项为个体计算一级表数据的批量,按照比正常检验低二级的愿则从表C.1中查出样本量,除以一级表中需抽检的字段数,得出应抽取的记录数,并采用随机或系统抽样c)将抽出数据中需要抽检的所有数据项《包括一级表与所属表中需抽检的数据项)个数作为该多级表数据的样本量。d)使用该样本量和AQL,连续性批数据从表C.2表C.3或表C.A中查我接收数Ac;一次性批数据则凤表C²中查找接收效Ac。多级表数据的样不量和查出的接收数构成多线表数据的抽样方案。e)如果该样本量超出表C.1的范围,则应根据一级表记录的个数将该多级表数拥进一步划分为更小的子集分别抽样。多级表数据抽样方案示例见附录G。7.4.5.3.4由多个单表和多级表组成的数据的抽样将每个单表及多级表划分为单独的数据子集,按照7.4.5.3.2和74.5.3.3的方法分别对每个单表和多级表进行抽样。7.4.6确定检查方法并进行数据检查根据检查项特点从5.3中选取相应的检查方法,并对数据实施检查。抽检过程中如发现质量存在普遍较好或较差的趋势,则可对抽样方案进行调整。调整的原则是;若也可根据经验进行调整。数据质量检查结果的记录是数据质量检查过程中形成的原始记录凭证,是评价数据质量和编写质量报告的基础。应由质量检查人员根据检查结果填写,内容应详尽完整,检查说明和缺陷描述要客观准确。检查记录表的格式参见表4。记录表中有关人员需要有效(手工)签字。根据表4记录的检查结果和缺陷分级的规定,确定缺陷级别,统计各级别缺陷的数量,并按照表5表4数据质量检查记录表多数据集名称12需要特殊说明的问题:如表示缺陷实际状态的屏幕截取图审核人注1:所数据集名称为检查对象总称,数据注2:在亮全由计算机进行检查时表4可以不填,直接填写表5进行汇总表5数据集质量检查汇总表数据集名称缺陷缺陷以市缺陷(9)数重缺陷轻缺陷不合格品12陷描述审核人于9个轻缺陷,1个重缺陷等于5个轻缺陷7.5质量评价数据质量评价是按照一定的规则与方法,对数据质量检查的结果进行评价并得出结论的过程。检查项是数据质量评价的基本单位,通过对所确定的检查项进行综合评价来判定数据质量。生产过程中数据的一、二级检查不进行质量评价,但二级检查要根据检查情况对数据进行质量评述。根据表4记录的检查结果和缺陷分级的规定,确定缺陷级别,统计各级别缺陷的数量,并按照表5数据检查项的合格判定步骤如下:a)判定全检检查项是否合格根据各级别缺陷的等价关系,将单个检查项的各级别缺陷换算为最低级别缺陷数后相加,用M₄表示,M金除以该检查项批量N,再乘以100,得该检查项的每百个体缺陷数,用U全表按上述步骤判定每个全检检查项是否合格。b)判定抽检检查项是否合格根据各级别缺陷的等价关系,将单个检查项的各级别缺陷换算为最低级别缺陷数后相加,用M表示。当M≤Ac时,该检查项质量抽检合格;否则判定抽检不合格。按上述步骤判定每个抽检检查项是否合格。数据集的质量评价如下:a)单图幅或单表数据集质量的评价依据各检查项质量评价结果,按6.2.1的评价规则评价数据集质量。b)多图幅与多表数据集质量的评价1)按照a)的方法评价单图幅或单表数据是否合格。2)依据单图幅或单表数据质量评价结果,按6.2.1的评价规则评价数据集质量。c)元数据集、质量检查记录和文档数据集的评价元数据集按照属性数据的评价方法进行评价。质量检查记录和文档数据集的质量由用户参照6.2的规则评价。本标准规定数据集质量得分为60时合格,预置满分为100分,采用扣分法计算数据集得分。当数据由多个数据集组成时通过数据集的加权平均计算综合得分。根据得分按照6.1中定量评价规则,确定相关数据集质量等级。全检部分与抽检部分单个检查项得分计算方法如下:a)计算全检部分单个检查项得分全检部分某单个检查项的实际百单位个体缺陷数,用U金表示。全检时将U金等于AQL的数据得分定为60分,即扣除40分。按式(1)计算全检部分某单个 (1)按上述方法计算出所有全检部分每个检查项得分。b)计算抽检部分单个检查项得分抽检部分某单个检查项的实际百单位个体缺陷数,用U表示。M除以该检查项的样本量n,再乘以100,得单个抽检项数据的百单位个体缺陷数U抽。将抽检数据抽样方案中的Ac/n对应为60分,即扣除40分。按式(2)计算抽检部分某单个检S=100-U×[40÷(Ac/n×100)] (2)检查项得分最低为零分,低于零分按零分计算。按上述方法计算出所有抽检部分各检查项得分。数据集得分计算方法如下:a)单图幅或单表数据集得分的计算所有检查项得分的算术平均值。b)多图幅或多表数据集得分的计算1)计算单图幅或单表数据各检查项得分:方法2)计算单图幅或单表得分:对所有检查项得分进行算术平均3)计算多图幅或多表数据集得分:对所有单图幅或多表得分进行算术平均。c)元数据、质量检查记录和文档数据集得分的计算元数据集按照单表或多表数据集的评分方法进行计算,质量检查记录和文档数据集的评分由按照6.2.2的规定计算多数据集得分。按照表6的格式填写计算结果。表6多数据集综合质量评价表数据集1多数据集得分:S=S₁Xw₁+S₂×wz…+S。Xw,质量等级:注:S₁,…,S,为各数据集得分;w₁,…,w.为各数据集权重;S为数据总分值,根据得分确定相关数据集质量等级。数据质量报告是数据质量检查与评价过程、方法及结果的综合描述和评述,是数据集质量特性的综合反映。数据质量报告由正文和数据质量评价附表构成。数据质量报告的格式可采用文本或表格两种格式,参见附录H。数据质量评价附表是数据质量综合特性统计表,是对数据及其组成部分质量特性的描述和反映,其格式参见表2、表3和表4。7.6复核与复检复核与复检处理方法如下:b)复核与复检1)对验收合格的数据中发现的所有问题,要求生产单位进行处理并对处理结果进行复核;2)对验收没有合格的数据,要求生产单位返工或重作并进行复检。复检时应根据检查与评价结果调整复检的内容及抽样方案,按5,2.2,1.5执行。复检后进行重新评价。监督抽检的实施按照GB/T2828,11执行流程见图)具体描述如下a)确定监督批:1)|组成监督批的数据既可以是同一单位生产的数据,也可以是不同单位生产的数据,必要2)监督批可以是已经完成的成果数据,也可以是生产过程中的阶段性成果。b)监督抽样检验以图幅或属性表中的记录作为个体。c)规定监督抽检质量指标DQL。规定的DQL不宜小于相关标准或要求规定的AQL。d)根据监督抛检的严格程度,确定检验水平,检验水平Ⅱ的样本量大于检验水平I的样本量,需要更多的投入e)根据DQL值、抛量与检验水平从附录D查取样本量n,构成监咯检验方案(n,0)或(n,1)。当批量大于本标准的泡围1000,质量水平在0.15%~5%、6.5%和10%时,按如下规则处理:1)如采用Ⅱ级检验水平,采用批量等于1000的抽样方案2)如果采用I级检验水平,质量水平小于3%时,采用批量等于1000的抽样方案,若质量水平大于等于3%时,则转移采用Ⅱ级检验水平即L=1,批量等于1000的抽样方案;用专家判断抽样。g)实施检查并记录检查结果。依据检查项特性按5.3给出的检查方法实施检查,按7.4.7规定记录检查结果。h)若在样本中发现的不合格品数小于或等于不合格品限定数L,即抽检样本符合要求,则判抽检合格;若在样本中发现的不合格品数大于不合格品限定数L,即抽检样本不符合要求,则判抽检批不合格。(规范性附录)数据缺陷分级附录A给出了以图形为主的空间数据、以属性为主的数据(包括点空间数据)和符号化制图数据的缺陷分级。每类数据中不同数据质量的缺陷级别基本平衡,即不同数字地质数据质量元素的相同缺陷级别对质量的影响基本相同A.2缺陷分级表表A.1、表A.2和表A.3所给出了通用的数据缺陷分级。在实施过程中要依据数据特点进行适当调整。表A.1以图形为主的空间数据的缺陷分级极严重缺陷严重缺陷重缺陷数据库必选图层)透漏一般图层遗漏或多余重要要紫(如遗漏或多杂一般亚素内容不一致形之间空间关系不正确等);接边要素类型不一改);属性数据项值的范围错误数错误导致数据足精度要求需要的最少差图面距离大于规定值;点要素位置误差大于规定值(批量错误);(批量错误)点要素位置误差大于规定值(个别错误);(个别错误)表A.1(续)极严重缺陷严重缺陷重缺陷轻缺陷”合要求;完成时间·(9)、(5)、(1)为各级别缺陷与最低级别缺陷即次轻缺陷的比例,用于缺陷换当缺陷达不到轻缺陷级别时,几个缺陷换算为一个轻“一级、二级或三级数据项的级别可根据必填和重要程度等因素划分;划分级别多于3时应给出等价关系,极严重缺陷严重缺陷”重缺陷轻缺陷'遗漏规定的数据集;数据表文件;遗漏一般数据项的值多个数据集相关内容不符合规范要求的结构错误;数据项间的逻辑关系据集成影响大,但易于修改);数据项的类型错误;数据空间定位准确度准确度不符合量度的范围数据项的值错误或量误或量纲错误“·(9)、(5)、(1)为各级别缺陷与最低级别缺陷即次轻缺陷的比例,用于缺陷换算。b当缺陷达不到轻缺陷级别时,几个缺陷换算为一个轻缺陷。极严重缺陷严重缺陷重缺陷轻缺陷图层)多余重要要素(如面状等要素)不符合规范要求的结构据专业及建库的目的等因素确定重要程度)集成影响大,但易于修改);图廓点与理论值之差大于规定值;校正控制点的个数少于规定个数点要素位置定位误差大于规定值(整体错误)定值(整体错误)点要素定位误差大于别错误)记点位不准确图面整饰重要要素穿插压盖关系符号或线型设置错;图标网注记错配不合理性数据源内容不符合要求;(9)、(5)、(1)为各级别缺陷与最低级别缺陷即次轻缺陷的比例,用于缺陷换算b当错误达不到轻缺陷级别时,几个错误换算1多余数据集(库)多奈图层多余要素多余2概念一空间数据库结构计算机自动检查之间的关系)人工检查、属性与要素对应关系值域一代码(是否与字典相符)自动检查图层文件命名、数据格式自动检查拓扑一点、线、面建立拓扑关系拓扑正确性(多边形封闭、多边形之间空间小图元、自相交和悬挂弧段等)有向线状要素方向2多数据集的一致性相关的内容不存在矛盾3空间定影及其参数)误差校正精度(校正方法、控制点数目与分布的合理性册外数据采集精度(野外采集)准确度以及等值线封闭等)4定性属性值的正确燃5图面整饰压盖关系地物压盖关系图廓规格网和图廓(内外图廓整饰、公里网和经纬网线的合理性等)6数据源的注1:同一要素依据质量元素虽然出现在不同检查项中,但在检查时可归并检查并分别记录。如图层的多余和遗漏。注2:注记和符号的完整性没有在“数据完整性”中单列,归并在“图面整饰规范性”(规范性附录)验收抽样方案表本附录给出验收抽样方案的检索表。表C.1是样本量表,分连续性批与一次性批。批量范围的划分是根据各类数据抽样的要求设计。数据通常采用正常检验水平,只有当检查过程中发现质量具有普遍较好或较差的系统趋势时,可考虑放宽或加严。表C.2是连续性批(一次性批)正常检验抽样方案表;表C.3是连续性批加严检验抽样方案表;表C.4是连续性批放宽检验抽样方案表。表C.1样本量表N正常234534564568568688N放宽正常72vV0VV1W233**yv√001W2344VVV000个123455中**V004个个个V1234566+vW0W12V345678V00A4v2345678VV0个个V2345678V041W1112345678Vo个V2345678*个A中Y2222356780个V34678v个1183334578↓0个1224444568↓↓↓↓1√223455556780个↓2↓345566668↓↓个√233456677778个12Y345789↓0↓↓V3456777889↓个12345667889↓↓↓个↓4567789↓↓012356789表C.2n↓↓个4678↓↓0个235782↓个V1468ψ0个↓357↓个↓2468个1√57013681↓247ψ235812346个个个585个346ψ个572468注1:——使用箭头下面的第一个有接收数的方案。如果样本量等于或超过批量,则执行100%检验,抽样方案为(N,0)。个——使用箭头上面第一个有接收数的方案。注2:在表中数字加粗部分为需要样本量做降级处理的抽样方案,除最后一行单格只包括降级后的样本量外,其余双格处上格为接收数,下格为样本量量重新查找接收数。样本量降级处理只进行一次。n2vVV0123V中v01ψ24*W√+01235+V*0000V12346√000个个个个1V123458000个个个个个个V123456v00个41个1234568+00个↑个4个V1W234568V0个个个V1111234568+0个4+1111V2V34568**0个个√2222345680个↓1112222V*34568↓个个↓↓11↓333334568↓↓0个V11↓222333↓↓↓4568↓↓↓↓1↓↓1↓↓22↓3↓4444568↓↓√0个1ψ22334444555568↓↓↓↓12√3344555566678↓↓↓↓↑ψ1个2↓33445566678889↓↓0↓34455667889+个↓12345567889↓个42√45678987↓ψ↓0↓1ψ35689个23468↓ψ0↓↓↓458↓↓个123560个↓个↓468↓↑*358个ψ1246↓↓↓580↓12361个个58v↑23612↑48个35注1:——使用箭头下面的第一个有接收数的方案。如果样本量等于或超注2:在表中数字加粗部分为需要样本量做降级处理的抽样方案,除最后一行单格只包括降级后的样本量外,其余双格处上格为接收数,下格为样本量的样本量重新查找接收数。样本量降级处理只进行一次。n2Vv000000VV12343v00V中1↓2V34554V0W1个2345+65↓011A个2345676V01个2356788WV23456789Ww011↓22V3456789W个V112223567890个12356789个V2334V67890个22445W6789√22333455中6789ψ12385ψ↓689vV↓2V34566678↓↓√ψ234455667779↓3458889↓↓012345v6677888999W01245666788999↓0个↓↓35567788999表C.4品n个个124↓67889960w23567899↓457891↓↑↓1356890个24↓79↓15682个3↓79214↓1个2468个V↓579236812↓√7个个346458注1.使用箭头下面的第一个有接收数的方案。如果样本量等于或超过批量,则执行100%检验,抽样方案为(N,0)。个——使用箭头上面第一个有接收数的方案。注2:在表中数字加粗部分为需要样本量做降级处理的抽样方案,除最后一行单格只包括降级后的样本量外,其余双格处上格为接收数,下格为样本量的样本量重新查找接收数。样本量降级处理只进行一次。(规范性附录)监督抽样方案表本附录给出监督抽样的方案表。表D.1是第I级检验水平监督抽样方案表,表D.2是第Ⅱ级检验水平监督抽样方案表。表D.1第I级检验水平监督抽样方案表(L=0)(主表)Nn122233344556677892个11个222233334444556673个个111个22223333344454个个个11个个个2222个33345个个个个11个个个个个22个个36个个个个11个个个个个22个7个个个个11个个个↑28个个个个个个1个个个9个个个个1个个个个个个个个个1个个个个个个个个1个个个个个个个1个个个个个个1个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个Nn个表D.1(续)Nn12889356677899444556677889953个445567788996334555667788997个个3个4455个677788223个44个556个79个A33A4455个66个2本34车45个个个本3445个234个个个个2个441个个3个个个A23个个个个N3个↑个1李233个2个个个I个2个个个个1个个个2个个个A2个个个个1A个个个个2个个个个个个1个个个个个个个个个个个个个2个个个个个个1个个个个个个个个个2个个个个个个个个个个个个个1个个个个个个个个个个个个个个个个个个1个个个个个个个个个个个个个个1个个个个个个个Nn个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个个1个个个个个个个个个A个个个个个个1个个个个个个个个1个个个个个个个个个个1个个A个个1个个个个个奉个个1注1:横向为批量,若检查批批量不等于所列批量间隔深取靠石原则,取其所在范围右侧方案,注2:纵向为DQL,若要求的口O1不等于所列批量间隔,采取拿上原则,取其所在范围上方D方案。注3:人——使用箭头上面第一个有样本量的穷案注4;在批量从520至1000之同时,和应的DOL可扩至52~100,此时,样本量全部为Nn234568934566789445567895455678996个56778897566778898个56677899个556个7899个5个6678个9个个5个个个78个个个556个78Nn个个6个7个个5个6个5个6个个个4个5个54个个个4个4Nn23456789989个9个789个个个89个个个个7个个9个678个9个6个个8个个个个个7个89个个5个6个个个个个个个个个个个7个89个个个个个56个7个个9个个个个个个个8个个个个个个个个个6个7个9个个个个4个5个个8个9个个个个个个个6个7个个个个个个个个5个个8个个个4个个个个↑个个9个个个个个5个6个78个↑个个个个个个个个9个个个个4个个5个6个7个8个个个个个个个个个个个个9个个个个个个个7个8个个个个个表D.2(续)Nn个个个5个6个个个个个9个个个个个个个个个个个个个个个个个67个8个9个个4个个个AA个个个个个个个个A5个个个7个8个9个个6个个个个个个个个8个9个5个个7个A个个个个个个个6个个9车4李个8个↑4李个个6个87个个个个个86个7个个个455566664注1:横向为批量;若检查批批量不等于所列批量间隔,采取靠右原则,取其所在范围有侧注2:纵向为DQL,若要求的DQL不等于所列批量间隔,采取靠上原则,取其所在范围上方DQL值对应的抽样(资料性附录)数据抽样方案示例E.1概述本附录包括8个抽样方案查找示例。其中连续性批、一次性批数据验收抽样检验方案查找示例4个,监督抽样检验方案的查找示例4个E.2抽样方案查找示例E.2.1验收抽样方案的查拔示例示例1:正常检验示例给定批量为/600,规定AQL为1.0,查找正常检验的抽样方案。第一步,首无根据批量1600和正常检验要求,从附录C的表C.1正常列中查出样本量为125。第二步,在附录上的表C.2样本量列我到与样本量25对应的行,并在AQL数值栏查找10所在列,样本量125所在行和AQI为1.0所在列的交又处的数字3即为接收数,抽样方案为425.2。示例2:查找加严与一次性批检验示例给定批量2G0o,AQL为3.0,查我加严与一次性批检验抽样方案。第一步,查找的步骤与示例!相同区别在于加放宽与一次性批检验在确定样本量时,查我样基量表不同的列,确定接收数时加产与放宽检验外别查我表C.3与表C.而一次性批检验与正常检验使用相同的表,即表C.2,只是样本量不同。第二步,查找结果:加严抽样方案为(160.7),次性批的抽样方案(200.2示例3:抽样方案表中出现箭头时,抽样方案查找示例给定批量1600,AQL为0.05,查我正常检验的抽样方案。第一步,首先想据批量1600和正常检验要求,从附录C的表C.1连续性批正常列中叠出样本量为125。125所在行和AQL为005所在列的交叉处为箭头,此时应选择按箭头所指的抽样方案,即(250,0)。示例4:抽样方案表中需要作样本量降级处理时,抽样方案查找示例给定批量为1600,AQL为40,查找正常检验的抽样方案按照相同的方法查出样本量为125,但发现样本量125所在行和AQL为40所在列的交叉处包括上下两格,意思是样本量需要降级。此时上格为原样本量对应的接收数,下格为降级后的新的样本量。用新样本量与AQL查找对应的抽样方案为(80,44)。E.2.2监督抽样方案查找示例示例1:给定N=40,DQL=3,采用I级检验水平,查找监督抽样方案用批量40和I级检验水平(L=0),从附录D的表D.1中查出样本量为1。抽样方案(n,L)为(1,0),即样本量为1,接收判定数为0。示例2:给定N=450,DQL=6,采用Ⅱ级检验水平,查找监督抽样方案用批量450和Ⅱ级检验水平(L=1),查找附录D的表D.2。由于该表中批量没有450,按5.2.2.2.3中规定的查找方法取480作为批量,查出样本量为31。抽样方案(n,L)为(31,1)。示例3:给定N=1500,DQL=45,采用Ⅱ级检验水平,查找抽样方案用批量1500和Ⅱ级检验水平(L=1),查找附录D的表D.2。由于该表中不存在1500的批量,按5.2.2.2.3中规定的查找方法取1000作为批量,查出样本量对应的位置出现向上箭头,采用箭头所指的方案,样本量为9,抽样方案为(9,1)。示例4:给定N=1300,DQL=65,采用I级检验水平,查找抽样方案由于I级检验水平表中没有适合该给定条件的方案,转移至Ⅱ级检验水平方案,按7.7中规定的规则批量为1300时采用批量为1000的方案,查出样本量为6,抽样方案为(6,1)(资料性附录)数据抽样方法示例附录F包括5个数据抽样方法示例。示例1说明系统抽样方法的应用,示例2和示例3说明数据分层抽样方法的应用,示例4说明整群抽样方法的应用,示例5说明幅内专家判断空间抽样的应用。在下列示例中抽检样本量出现小数位时采用四舍五入规则。示例1:系统抽样方法示例系统抽样最常见的形式为等距抽样。给定1200个点的数据,序号依次为1~1200,查找抽样方案需要抽取45个点,可按如下步骤进行等距抽样:a)计算间距=1200/45=26.67≈27;b)在第一个间距点范围内(1~27)随机选取某点,如选定17;c)从第17个点开始,按照间隔27依次抽取:17+27,17+2×27,……,直到抽够45个点;若计算的序号17+m×27>1200,则抽取序号为17+m×27-1200的点作为最后一个样品。其中m为样本量。示例2:分层抽样方法示例某省提交了批量为56的数据,由三家单位完成,A单位完成32幅,B单位完成16幅,C单位完成8幅,此时查得对应于批量56的样本量应为13。按照如下步骤进行分配:A单位的抽取率=32/56=0.5714,A单位抽检样本量=0.5714×13≈7。B单位的抽取率=16/56=0.2857,B单位抽检样本量=0.2857×13≈4。C单位的抽取率=8/56=0.1428,C单位抽检样本量=0.1428×13≈2。并且能满足A单位抽检样本量+B单位抽检样本量+C单位抽检样本量=总样本量13。同时兼顾每个单位必须有数据被抽中,即方案为:A单位抽检样本量=7。B单位抽检样本量=4。C单位抽检样本量=2。示例3:分层抽样中保证抽取样本量满足要求的示例某省提交了由3家单位完成的批量为30幅的数据。A单位完成16幅,B单位完成5幅,C单位完成9幅,根据批量大小和规定的质量要求,查得对应的样本量应为8,则:A单位的抽取率=16/30=0.5333,A单位抽检样本量=0.5333×8≈4。B单位的抽取率=5/30=0.1667,B单位抽检样本量=0.1667×8≈1。C单位的抽取率=9/30=0.3,C单位抽检样本量=0.3×8≈2。由于小数误差,可能存在4+1+2<8,此时,可将最小的抽检样本量加1。因此B单位抽检样本量=1+1=2。示例4:整群抽样方法示例给定一个单级表,包括1600个记录,每个记录含12个要检查的数据项,AQL=4,确定正常检验的抽样方案及方法如下:a)以数据项为个体计算批量=1600×12=19200;b)查找样本量:根据批量,按照E.1验收抽样方案的查找示例1的方法查找样本量为400;c)计算抽取的记录数:400/12=33.3,取34作为抽取的记录数;d)根据AQL=4,n=400,查找表C.2正常检验方案表,接收数为25。示例5:幅内专家判断空间抽样给定一个图幅如图F.1所示,AQL=4,确定一次性批检验抽样方案步骤如下:a)以要素为个体计算批量为8743,查出一次性批检验的样本量为400;b)两个较大的方框为专家抽样区域,实际样本量为576,根据AQL,按实际样本量查找接收数。查表经过样本量降级最终的方案为(500,30)。(资料性附录)多级表数据抽样方案示例附录G给出一个多级表数据抽样方案示例。G.1数据集的描述某连续性批正常检验的数据集由图G.1所示的1个单级表和2个多级表数据组成。其中,子集1为单级表数据,子集2由1个一级表数据、3个2级表数据以及表2.2数据所属的2个3级表数据组成。表1数据表1数据表2.2.1数据表2数据图G.1由1个单表和2个多级表数据组成的数据集G.2确定该数据集的抽样方案确定该数据集的抽样方案步骤如下:b)将数据集分为3个子集,每个子集的AQL与数据集相同,均取4。c)确定每个表中的记录个数和所有表中需抽检的字段数,并列入表G.1。表G.1多级表中每个表中的记录数与需抽检的数据项个数表1数据表2数据表2.1数据表2.2数据表2.3数据表2.2.1数据数据数据表3.1数据需抽检的字段数(m)应抽出的注:表1、表2的记录数是计算得出的,二级与三级表的记录数是假设的d)分别确定每个子集的抽样方案1)数据子集1的抽样方案(1)根据批量10000,从表C.1中查出正常检验的样本量n为250。(2)从表C.2中查找与250和4对应的接收数Ac为17。(3)计算抽取的记录数n₁,n₁=250÷5=50。(4)从表1数据中抽出50条记录对需要抽检的数据项实施检验。2)数据子集2的抽样方案(1)一级表表2数据的批量Nz₁=1000×4=4000,根据7.4.5.3.3规定的原则和方法,从表C.1中查出样本量为125,计算出需抽检的记录数n₂为31,并抽出相应记录。(2)将与抽出的记录关联的所有下属表的记录抽出。(3)计算该多级表数据的总样本量nz:nze=m₂×n₂+mzi×nzi+mz₃×n2s+M22i×N21+M222×n22=124+3×+3×75+5×25=684,其中,m是抽检的字段数;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乐器修理或维护行业相关项目经营管理报告
- 矿车推杆项目营销计划书
- 婴儿用安抚奶嘴产品供应链分析
- 抽气机产品供应链分析
- 纸礼品袋商业机会挖掘与战略布局策略研究报告
- 药用苯酚项目营销计划书
- 废弃建筑材料回收利用行业市场调研分析报告
- 废纸篮产品供应链分析
- 微生物除臭剂行业营销策略方案
- 增强现实(AR)游戏行业相关项目经营管理报告
- 京东商城电子商务物流分析
- 我眼中的语言学
- 海南省天一大联考2022-2023学年物理高一第二学期期中经典试题含解析
- 豆腐供货协议书
- 新疆维吾尔自治区2021定额建筑及装饰工程计算规则
- 中国古代文学史(全套)课件
- 面试真题及答案销售类结构化面试题目
- 基本建设项目竣工财务决算审核表
- 人教版数学五年级上册课堂作业
- 社交APP产品需求文档-“SOUL”
- 2023年陕煤集团招聘笔试题库及答案解析
评论
0/150
提交评论