![信息技术 生物特征识别 用于技术评估的指纹数据库的难度度量 征求意见稿_第1页](http://file4.renrendoc.com/view8/M01/38/01/wKhkGWcZ84aAKpABAAFwreDUMIU213.jpg)
![信息技术 生物特征识别 用于技术评估的指纹数据库的难度度量 征求意见稿_第2页](http://file4.renrendoc.com/view8/M01/38/01/wKhkGWcZ84aAKpABAAFwreDUMIU2132.jpg)
![信息技术 生物特征识别 用于技术评估的指纹数据库的难度度量 征求意见稿_第3页](http://file4.renrendoc.com/view8/M01/38/01/wKhkGWcZ84aAKpABAAFwreDUMIU2133.jpg)
![信息技术 生物特征识别 用于技术评估的指纹数据库的难度度量 征求意见稿_第4页](http://file4.renrendoc.com/view8/M01/38/01/wKhkGWcZ84aAKpABAAFwreDUMIU2134.jpg)
![信息技术 生物特征识别 用于技术评估的指纹数据库的难度度量 征求意见稿_第5页](http://file4.renrendoc.com/view8/M01/38/01/wKhkGWcZ84aAKpABAAFwreDUMIU2135.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1GB/ZXXXXX—XXXX/ISO/IECTR29198:2013信息技术生物特征识别用于技术评估的指纹数据库的难度度量本文件基于相对样本质量、相对旋转、变形和指纹印迹重叠等因素,为评估指纹数据集对于指纹识别所具有的挑战性和压力程度提供指导。此外,还建立了构建不同难度水平数据集的方法,定义了用于指纹识别算法技术评价的指纹数据集的相对难度水平。难度水平取决于参考样本和探针样本在上述因素上的差异。本文件包括以下内容:——描述了由同一手指采集的不同样本之间的差异引起的难度水平;——汇总影响因素,建立了评价整个指纹数据集难度水平的统计方法;——比较不同指纹数据集的难度水平;——定义了用于技术评估的指纹数据集难度水平的测试和报告流程;——根据比对得分分析配对样本对数据特性;——描述了建立评估数据集的归档数据选择方法。本文件为比对指纹数据集的相对难度水平提供指导。本文件不包括:——定义单个指纹图像的质量;——定义评价或预测指纹识别算法性能的方法或明确指标。2规范性引用文件本文件没有规范性引用文件。3术语和定义下列术语和定义适用于本文件。3.1生物特征采集样本capturedbiometricsample原始的生物特征样本rawbiometricsample(弃用)由生物特征采集过程产生的生物特征样本。3.2生物特征参考biometricreference属于生物特征数据主体并作为生物特征比对对象的一个或多个已存储的生物特征样本、生物特征模板或生物特征模型。注1:生物特征参考的产生可能或隐或显都要借助于使用辅助数据,例注2:在比对中标记的主体/对象可能是任意的。在一些比对中,生物样本进行比对的主体,并输入到生物特征比对算法中。例如,在重复注册检查中,生物特征参考被用作与数23.3生物特征探针biometricprobe输入到算法的、与生物特征参考进行生物特征比对的生物特征样本或生物特征项的集合。3.4技术评价technologyevaluation使用预先或专门收集的同一生物特征样本集,对一种或多种算法进行的离线评价。3.5注册失败率FTERfailure-to-enrolrate(FTER)指定的一组生物特征注册事务中注册失败的比例。注2:原文缩写为FTE,参照GB/T5271.37-2021(ISO/IEC2382-37:2017,MOD),33.6获取失败率failure-to-acquirerate(FTAR)注1:观察到的失败获取率不同于预测/预期的失败获取率(前者),3.7误不匹配率falsenon-matchrate(FNMR)在生物特征识别配对比对试验中,误不匹配的数量与完成的试验数的比例。3.8误匹配率falsematchrate(FMR)在生物特征识别不配对比对试验中,误匹配的数量与完成的试验数的比例。3.9错误拒绝率falserejectrate(FRR)在生物特征识别配对比对试验中,误不匹配的数量与完成的试验数的比例。3.10错误接受率falseacceptrate(FAR)在生物特征识别不配对比对试验中,误匹配的数量与完成的试验数的比例。3.11接受者操作特性曲线receiveroperatingcharacteristiccurve(ROCcurve)以假阳性率(即错误接受)为横坐标,以真阳性率(即正确接受)为纵坐标的决策阈值函数。3.12检测误差权衡曲线detectionerrortrade-offcurve(DETcurve)修正的ROC曲线,在两轴上都绘制了错误率(x轴为假阳性率,y轴为假阴性率)。3.13性能performance错误率和吞吐率方面的能力。3.14质量quality用以完成或实现生物特征比对决策的生物特征样本适应度的度量。3GB/ZXXXXX—XXXX/ISO/IECTR29198:20133.15质量得分qualityscore用以完成或实现比对决策的生物特征样本的适应度值。3.16匹配度matchability两个配对指纹样本能通过多种比对算法比对成功的程度。3.17配对样本对matedpair从同一来源采集的相同生物识别特征的两个样本集,其中一个用于参考,另一个用于测试。3.18难度水平levelofdifficulty衡量生物特征数据集的指标,表示指纹数据集相对于其他数据集在识别方面的“挑战性”或“压力程度”。注1:如果对于所选指纹比对算法,其在数据集A上的性能显著低于数据集B,则指纹数据集A比数据集B更难识别。关于如何评估给定比对算法的性能,见ISO/I注2:为了评估指纹数据集的难度水平,在测试指纹比对算法对本数据集和其他数据集的性能之前,本文件定义了3.19奇异点singularpoint指纹中心点或三角点。3.20对齐点alignmentpoint用于对齐指纹配对样本对的点,为奇异点或特定的细节点。4缩略语下述缩略语适用于本文件。AP:对齐点(AlignmentPoint)CA:共有区域(CommonArea)DF:相对变形(RelativeDeformation)LOD:难度水平(LevelofDifficulty)RSQ:相对样本质量(RelativeSampleQuality)SP:奇异点(SingularPoint)5指纹样本的差异因素5.1概述如ISO/IECTR19795-3中所述,指纹数据集的下列属性会影响指纹识别的性能:——传感器类型(例如全内反射、电容、热感、刮擦、非接触式的、超声波等);——印迹类型(如平面、滚动、分割的连指、扫描的油墨印迹等);——图像分辨率;4——环境条件(如温度、湿度等);——人口统计特征(如年龄、性别、职业等);——手指指位(如拇指、食指等);——模板老化;——生物状况(如皮肤水分);——主体积极性、习惯等。如果数据集在传感器类型和印迹类型方面是相同的,则其余的属性可以通过指纹样本质量得分来表示和量化。按照ISO/IEC29794-1的定义,生物特征样本的质量是指生物特征样本满足目标应用的指定要求的程度,质量分数是质量的定量表达,然而,质量分数与每个个体的生物特征样本相关,因此它不包含参考样本和探针样本之间的差异。正如参考文献[7]Hicklin和Reedy指出的,指纹匹配的能力取决于三方面特性:(1)手指数(在十指指纹辨识的情况下);(2)参考和探针图像之间的相关性;(3)参考和探针图像的质量。两个指纹之间的相关性是参考和探针图像重叠程度、畸变程度、以及固有摩擦脊线特征的函数。图像质量得分可以用来分别量化参考图像和探针图像的质量。如图1和图2所示,即使两张指纹图像的质量都很好,如果它们的共有区域很小(图1)或者相对变形较严重(图2),则比对得分较低。此外,两个低质量样本的比对得分可能比一个高质量样本和一个低质量样本的比对得分更高。图1比对较小共有区域的样本对,相似度得分较低图2比对变形严重的样本对,相似度得分较低考虑到这些情况,ISO/IEC29794-4中定义的质量在技术测试中不足以评估指纹数据集的LOD。此外,考虑配对指纹对的其他差异的影响,还需要定义相对质量。相对难度水平可应用于选择用于性能评估的数据。在资源有限的情况下进行互操作性性能测试时,可能需要关注具有挑战性的数据集,因为通过相对比较少地比对可能产生有意义的结果。进一步,还可以用于评估数据集对于此类评估的适用性。实验人员可以专注于少量的匹配样本对数据,以对给定的数据集做出是否适用此目的的初步评估。5GB/ZXXXXX—XXXX/ISO/IECTR29198:20135.2共有区域5.2.1概述配对指纹样本对之间的共有区域可能会因人为因素而有所不同。一般来说,共有区域越大,比对得分越高。图3描述了配对指纹对的重叠区域。共有区域可能的度量项包括:a)共有区域与配对指纹样本对所覆盖的总面积之比(首选方法,将在下文讨论);b)每个印迹上细节点凸包的重叠区域。图3基于配对印迹前景区域的共有区域的一种可能定义无论比对算法是基于细节点还是图像,共有区域都是影响指纹识别中匹配性能的主要因素之一。一般来说,配对样本对的共有区域越大,相似度得分越高。图4显示了使用商用指纹比对算法得到相似度得分的配对样本对示例。图4共有区域较低且相似度得分为0的配对样本对示例;(a)和(b)是一对配对指纹对,(c)和(d)为(a)和(b)经过细节点提取处理后的图像,(e)是使用中心点作为(a)和(b)对齐点对齐的结果65.2.2共有区域的定义在本文件中,配对样本对的共有区域的度量定义为共有区域面积与配对样本对所覆盖的总面积之比,如公式(1)所示:P∩PCA=参考探针………P∩PP参考UP探针…(1)其中,P表示分割提取的指纹前景。将该度量指标归一化为[0,1],其中0表示没有找到相应的AP对。5.2.3配对样本对共有区域的定位给定用于匹配的分割指纹配对样本对,为了定位配对样本对的共有区域,应该定位相应的对齐点对。对于非弓型指纹,可以从相应的像素级奇异点中找到对齐点对。对于包含弓型而没有奇异点的指纹,可以从相应的细节点得到对齐点对。图5、图6和图7分别显示了对缺少奇异点对的螺纹型、弓型和环型指纹对计算共有区域的示例。注意在每种情况下可能有多个AP对。每个AP都有位置和方向。通过对齐位置和方向,可以校正参考样本和探针样本之间的旋转和平移差图5螺纹型共有区域的可能定位;(a)和(b)是一对配对样本对,(c)(d)和(e)表示基于不同AP对得到的共有区域7GB/ZXXXXX—XXXX/ISO/IECTR29198:2013图6通过对齐相应的细节点对得到弓型指纹共有区域的可能定位;(a)和(b)是一对配对样本对,(c)显示得到的共有区域图7对缺少相应的奇异点对的环型共有区域可能的定位;(a)和(b)是一对配对样本对,(c)显示共有区域5.2.4配对样本对共有区域的计算AP的计算是测量共有区域的关键步骤,需要在像素级精度检测AP。由于大多数非弓型指纹包含至少一个SP,因此像素级SP是候选AP的首选。为了保证配对指纹对的对准精度,SP的检测在像素级进行。同时,对弓型指纹和未能找到相应SP的指纹,则使用相应的细节点替代。图8给出了计算共有区域的流程8图8共有区域计算流程图如图5所示,当在一对配对样本对中发现多个AP候选对时,选择具有最大共有区域的AP作为最终AP。注1:对于样本质量差的指纹,尽管相应的SP或细节点对存在,但也可能无法找到正确的AP,在这种情况下,将共注2:由于弓型指纹没有奇异点,因此可以使用任何比对算法从一组对应的细节点对中获得AP对。当有多个对应AP5.2.5共有区域与相似度得分的关系直观地说,共有区域和相似度得分之间存在比例关系。然而,相似度得分还受到其他因素如变形、样本质量等的影响。图9显示了在FVC2000数据集上配对样本对的共有区域与相似度得分的散点图。相似度得分高的配对样本对通常具有较大的共有区域,而相似度得分低的配对样本对不一定具有较小的共有区域。此外,具有较小共有区域的配对样本对往往会产生较低的相似度得分,而具有较大共有区域的配对样本对则不一定产生较高的相似度得分。9GB/ZXXXXX—XXXX/ISO/IECTR29198:2013图9在FVC2000数据集上的共有区域与相似度得分的散点图;(a)2000-1a,(b)2000-2a,(c)2000-3a5.3相对变形5.3.1概述由于手指和皮肤是有弹性的,在采集过程中手指的压力会导致指纹变形,因此,阻碍了即使有100%共有区域的配对样本对的完美匹配。变形的存在使得指纹匹配更加困难。配对样本对之间的相对变形越高,指纹匹配越困难。因此,配对样本对的总体相对变形能间接反映指纹数据集的难度水平。虽然很难测量单个指纹的变形程度,但比较容易度量一对配对样本对之间的相对变形程度。通过定位相应的点或模式,如细节点、奇异点、脊线和其他的拓扑模式,然后测量位置和方向的差异,能计算相对变形。指纹的变形可以是线性的,也可以是非线性的。线性变形的例子为刚性的变形(平移和旋转)和剪切。非线性变换的例子包括样条变形。线性变形的一个简单度量是指纹面积变化的程度(能够用等效线性变形矩阵的行列式进行估计)。弹性变形的度量方法有多种,如弯曲能。对配对指纹对相对变形的可能度量为:a)配对样本对对齐后对应点的方向差异的平均值;b)利用薄板样条法测量变形。5.3.2基于方向场的变形测量假设指纹方向的连续性,当配对指纹对对齐之后没有相对变形,相同位置的方向将重合。然而,在大多数的匹配情况下,配对样本对之间存在相对变形,这种变形可以通过整体的方向差异表示。基于方向场的变形在对齐的共有区域上进行测量,像素级方向场的计算可以通过多尺度高斯滤波器来实现。基于方向场的变形被定义为在对齐共有区域方向差的平均值,如公式(2)所示:DF=平均值(∆θi,j)…………(2)Δθi,j=abs(θi−θj),θi和θj为配对样本对对齐位置的脊线方向。图10到14示例了配对样本对通过不同的AP对对齐来计算共有区域和相对变形。配对样本对之间的旋转差异通过使对应的AP对的方向重合来补偿。它们表明共有区域比率和相对变形随AP对的不同而不同。当在配对样本对中找到多个AP候选对,选择共有区域最大的AP作为最终AP。然后,使用最终AP计算相对变形。图10以右侧三角点为AP对齐后共有区域和相对变形的计算:(a)和(b)为配对样本对,(c)共有区域,(d)像素级方向差异(暗-小,亮-大),(e)按块的方向差异GB/ZXXXXX—XXXX/ISO/IECTR29198:2013图11以左侧三角点为AP对齐后共有区域和相对变形的计算:(a)和(b)为配对样本对,(c)共有区域,(d)像素级方向差异(暗-小,亮-大),(e)按块的方向差异图12以上侧中心点为AP对齐后共有区域和相对变形的计算:(a)和(b)为配对样本对,(c)共有区域,(d)像素级方向差异(暗-小,亮-大),(e)按块的方向差异图13以下侧中心点为AP对齐后共有区域和相对变形的计算:(a)和(b)为配对样本对,(c)共有区域,(d)像素级方向差异(暗-小,亮-大),(e)按块的方向差异图14共有区域小但相对变形小的例子:(a)和(b)为配对样本对,(c)共有区域,(d)像素级方向差异(暗-小,亮-大),(e)按块的方向差异GB/ZXXXXX—XXXX/ISO/IECTR29198:20135.3.3基于薄板样条的测量基于薄板样条的方法是测量配对指纹样本对变形的方法之一。为了利用薄板样条来测量配对指纹样本对的变形,宜对相应的细节点集进行鲁棒检测。Bazen等人提出了基于三角局部结构检测相应细节集的方法,称为细节邻域法,因为局部结构起源于指纹中的一小部分,可能不因塑性变形而严重变形。因为通过局部比对算法检测罗列出的潜在相应细节邻域可能含有错误匹配对,因此每对的正确性需要通过形状上下文方案和RANSAC技术进行进一步验证。检测出正确对应的细节点对后,即可应用薄板样条法计算出弯曲能,其可用于度量指纹对之间的变形。5.3.4基于方向场的变形与相似度得分的关系图15显示了在FVC2000数据集中配对样本对的相对变形(从方向场计算)和相似度得分(由一种商用指纹比对算法获得)的散点图。在某种程度上,相对变形和相似度得分呈反比关系。这种关系并不是很明显,因为相似度得分也受其它因素影响,如共有区域、样本质量等。图15中,相似度得分高的配对样本对有较小的相对变形倾向,但是相似度得分低的配对样本对不一定有很高的相对变形。此外,相对变形较高的配对样本对其相似度得分有偏低倾向,但是相对变形较低的配对样本对不一定会有很高的相似度得分。图15FVC2000数据集相对变形与相似度得分的散点图;(a)2000-1a,(b)2000-2a,(c)2000-3a5.4相对样本质量5.4.1概述指纹样本质量是影响指纹识别系统匹配性能的关键因素之一。因此,某一指纹数据集样本质量的分布成为该数据集LOD的指标。在技术评价中,参考样本的质量可能较低,则在配对样本对中必须考虑两个样本的质量,而不仅仅是探针样本的质量。5.4.2相对样本质量的测量从配对样本对的相对样本质量方面来看,在比对中有四种情况:——(情况1)高质量的参考样本和高质量的探针样本;——(情况2)高质量的参考样本和低质量的探针样本;——(情况3)低质量的参考样本和高质量的探针样本;——(情况4)低质量的参考样本和低质量的探针样本。假设其他的影响因素如共有区域、相对变形,对匹配性能的影响可以忽略不计,一般来说,以上情况的相似度得分可以排序为:案例1>案例2≈案例3>案例4因此,给定一对配对样本对,相对样本质量的度量可以由单个样本质量得分的任何类型的平均值来定义,可以是算术平均值、几何平均值或调和平均值,样本质量得分由ISO/IEC29794-4中描述的指纹质量度量产生。5.5计算数据集的LOD5.5.1概述考虑到配对指纹对之间的共有区域(CA),相对变形(DF),相对样本质量(RSQ)是影响比对算法性能的主要因素,随着CA和RSQ的增加以及DF的降低,配对样本对的相似度得分也随之增加。对于单配对样本对,一般来说,难度水平与相似度得分成正比,并且是影响因素的函数,如公式(3)所示:LODp=f(CA,RSQ,DF−1,v)∝相似度得分………………(3)其中LODp为单对指纹对的难度水平;ν为未知的影响因素,DF−1表示相对变形与难度水平的反比关系。5.5.2测量单对的LOD为了测量LODp,即单指纹配对样本对的LOD,从多个因素来看,建模如下,即LODp与CA、RSQ和DF−1之间存在多元非线性回归关系,如公式(4)所示:LODp=β11CA+β12CA2+β21RSQ+β22RSQ2+β31DF−1+β32(DF−1)2…………(4)其中,βij(i=1,2,3,j=1,2)是对给定的训练数据集进行实验估算的系数。在实践中,由于LOD是未知的,LODp被替换为每对配对样本对的相似度得分,其由现有的比对算法得到。βij在经多元非线性回归估计后得到,并用于上述模型来计算未知待评价数据集的LOD分布。在将由训练数据集获得的系数βij应用于未知测试数据集的LOD计算模型时,基本的假设是每个因素对匹配错误率的影响程度相似。由于LODp与相似度得分成正比关系,因此可以采用线性函数对LODp进行归一化处理,使LODp与相似度得分呈反比关系。归一化的LODp,NLODp定义如公式(5)所示:NLODp=…………GB/ZXXXXX—XXXX/ISO/IECTR29198:2013其中LODmax和LODmin分别为LODp的最大值和最小值。采用FVC2000、2002和2004的9个非合成数据集验证上述模型的有效性。每个数据集包含从100根手指采集的800个指纹。仅对真正的配对样本对测量LOD。图16-图18比较了三个FVC数据集(2000-DB2,2004-DB1,2004-DB3)分别通过上述方法计算得到的CA、DF和RSQ的分布,图19显示了数据集中单个对的LOD分布情况。图16三个FVC数据集2000-DB2、2004-DB1、2004-DB3的CA直方图图17三个FVC数据集2000-DB2、2004-DB1和2004-DB3的DF直方图图18三个FVC数据集2000-DB2、2004-DB1和2004-DB3的RSQ直方图图19三个FVC数据集2000-DB2、2004-DB1和2004-DB3的归一化LOD直方图GB/ZXXXXX—XXXX/ISO/IECTR29198:2013对LOD分布采用单因素ANOVA(ANalysisOfVAriance,方差分析)和TukeyHSD(HonestlySignificantDifference,真实显著差异)测试以检验它们的差异是否显著。图19显示了ANOVA测试的结果,以及使用TukeyHSD测试对三个不同难度级别的数据集进行分组的结果。在此图中,不同颜色的数据集有显著差异。由于数据集的LOD是基于CA、DF和RSQ计算的,所以它独立于比对算法。然而,期望LOD与匹配性能的指标间具有某种单调关系,例如,某种“通用”比对算法的等错误率(EER)。采用两种广泛使用的比对算法(VeriFinger5.0和Bozorth3)作为所有数据集的通用比对算法。表1还将排序的平均归一化LOD和这两种比对算法在相应数据集上获得的EER和FRR进行了比较。LOD等级分为三类:简单、中等和困难。从表中可以看出,除2000-DB3和2002-DB3数据集外测得的归一化LOD与实际EER基本吻合,这还需进一步研究。图20说明了归一化LOD和用Bozorth3测量的EER之间的线性关表1数据集的归一化LOD和对应的通过比对算法得到的EER图20归一化LOD和Bozorth3EER之间关系的示例6根据比对结果分析配对样本对数据特性6.1概述通过使用比对得分,而不是图像质量得分,可以实现技术测试数据集生成方法,该方法可以提取和组织有意义的数据以进行实际准确性评估。而且,该方法非常直接,可以观察到以下情况:——一般来说,每种比对算法都有不同的评分特征,即使对于具有相同图像质量得分的配对样本数据,不同的算法的得分也不相同;——基于多种比对算法的结果来度量“匹配度”是可行的。6.2匹配度6.2.1匹配度的概念匹配度的概念包括:——对于单个配对样本对的数据,每个供应商算法的匹配度是确定的;——被标记为能够匹配的配对样本对数据称为“可匹配的”。6.2.2判定匹配度的准则匹配度是配对样本对通过匹配的算法比例的函数,判定匹配度的准则如下:——通过大量算法匹配的配对样本对比通过少量算法匹配的配对样本对更具匹配度;——总的来说,通过大量算法匹配的数据集比通过少量算法匹配的数据集更具匹配度;——如果可以使用更多具有不同特性的算法,可以期待实现更通用的匹配度;——对所有供应商软件的每个比对算法分配每对配对样本对数据的匹配度标签;GB/ZXXXXX—XXXX/ISO/IECTR29198:2013——本文件不提供评估不同传感器类型或传感技术对匹配度影响的指导。但是,可以设计测试来检测传感器变化对匹配度的影响,例如使用不同的传感器来收集探针和图库数据。6.2.3匹配度的判定根据算法的不同,配对样本对比对可能得到匹配/不匹配决策或是比对得分。为了评估匹配度,强烈建议获得比对得分。特定匹配器决策阈值可用于确定给定的配对样本对比对是否被判定为匹配。这种方法的好处是,可以使用相对较少的配对样本对来描述数据集的LOD。阈值的确定可以基于测试组织以前对给定算法的经验。理解特定算法的比对得分分布通常会简化基于匹配度的LOD评估。这种理解也将提高组织间的协作:共享基于分数的决策准则比共享不透明的、基于排名的结果更有用。为了充分理解阈值,通常需要执行大量非配对样本对比对。示例:测试组织可能之前已经确定,对于比对算法B,比对得分为100通常对应的错误匹配率为0.01%,因此100在某些情况下,对配对样本对进行基于排名的分析是合理的或有用的,例如测试仅在辨识模式下运行的算法时。在这种情况下,匹配决策是基于正确的参考样本是否以排名第一与给定的探针样本匹配。在匹配度判定中使用的比对算法不宜产生高度量化的比对得分。量化削弱了对比对得分的洞察力;这种洞察力对区分配对样本对比对得分的细微差异可能是必要的。例如,一些比对算法只在比对成功时返回分数,而在比对失败时返回空或失败结果。这种行为是不可取的,因为它降低了边界比对的可见性,而边界比对通常可能与匹配度和LOD特别相关。表2提供了一个使用多种比对算法来确定匹配度的示例。表2匹配度示例表格高中低LOD可以与某个性能测试相关联,并通过测试名称进行区分,例如“NIST的MINEX2004”和“MTIT”。比对算法可以由性能测试主办方收集。假设有M种算法可用来评估某数据集的LOD,该数据集中的配对样本对数为N,对于给定的配对样本对,如果某算法生成的比对得分大于声明的阈值,或者将正确的配对样本对识别为排名第一匹配,那么该算法将产生+1的分数。否则,该算法将产生−1的分数。通过这种方式,可以为每个比对算法和每个探针样本生成一个分数,将其写为sn,i,其中n指第n个比对,i指第i个算法。因此可以构造下列矩阵系统:记左边的矩阵为S,未知权重的向量为w,右边的目标是t。注意矩阵S的元素全部由+1和−1组成。假设采用最小二乘法求解上述方程组并得到w的最小范数解,即找到能最小化||Sw-t||并具有最小||w||的w值。此解揭示了该数据集可匹配的容易程度,考虑以下极端情况:——如果所有的数据都很容易匹配,那么所有的比对算法都会得到正确的答案,w的元素都是1;——如果数据无法匹配,那么所有的比对算法都会得到错误的答案,w的元素都为−1。因此,建议使用以下指标来衡量数据集的匹配度,如公式(6)所示:这个量的最小值为零,即所有的比对算法都得到了正确的比对结果。这个量的最大值是所用算法数的两倍,即2M。这个度量可以通过除以2M归一化到[0,1]。考虑更多的例子。假设有三种比对算法,其中算法1在大多数比对中都是正确的,而算法2和算法3在大多数的比对中是错误的。因此期望解向量接近[300],数据集难度将是(|1-3|+|1-0|+|1-0|)=4。现在假设算法1和算法2在大多数比对中都是正确的,那么期望解向量为[1.51.50],将得到(|1-1.5|+|1-1.5|+|1-0|)=2的难度水平。这是直观上正确的结果,因为如果两种算法得到正确的答案,那么该数据集要比只有一个算法得到正确答案更容易。上述示例的微妙之处在于,如果两种算法达成一致(即系统未完全确定那么如果只是最小化||Sw-t||,在两种情况下,[300]的解都是可以接受的。然而,因为坚持得到使||w||最小的w的解,那么将产生[1.51.50]的解。众所周知,矩阵解的最小范数最小二乘解有一个精确解,可以用奇异值分解(SVD)来计算。使用SVD还有一个优点,它可以处理S为非满秩的情况,例如当所有算法对所有数据都产生相同的输出时会出现非满秩的情况。6.2.4控制单个因素对整体性能的影响假设对指纹样本质量的所有影响因素都能反映在比对结果中,通过仔细构建评估数据集,可以估算出单个因素对总体性能的影响程度。例如,为了分析老化的影响,需要收集指纹,以便计算老化周期与比对得分之间的相关性。同样方式可以评估传感器类型和其他因素的影响。但是,为了将传感器属性的差异反映到数据集中,宜尽可能使用不同传感器获取的相同测试主体的数据样本。另外,当使用同一个人的多个手指的指纹数据时,认为手指的模式是相似的。但是,本文件并没有明确地专门处理这些数据特性。这是因为,如果能够正确区分具有高模式相关性的手指,就适合于检测模式间识别的性能特性。6.3构建不同难度水平的数据集不同难度水平的数据集可以按如下方法建立:——通过为所有供应商算法选择正确匹配的配对样本对数据的交集,能够建立一个“简单”的标准数据集;——通过选择至少通过两种算法得到匹配结果的配对样本对数据,能够建立一个“中等”的标准数据集;——通过选择至少通过一种算法得到匹配结果的配对样本对数据,能够建立一个“困难”的标准数据集。数据集的LOD与对所有配对样本对正确匹配或得到排名第一匹配的算法数量的分布相关联。排名或得分信息也可以用于指定更具挑战性的LOD。例如,排名第二的结果表明,与排名第一的结果相比,给定的配对样本对更难匹配。图24展示了构建不同难度水平指纹数据集的实验结果,其中使用了三种比对算法,85对配对样本对,图25比较了在两种不同难度水平,“容易(绿色)”和“困难(红色)”上由单一比对算法获得的DET曲线。注1:虽然匹配度成功地提供了数据集中难以匹配配对样本对的数量的度量,但它不提供任何关于容易被错误匹配GB/ZXXXXX—XXXX/ISO/IECTR29198:2013注2:匹配度作为数据集LOD的一种度量方法是与模态无关的,能应用于人脸等其图21“简单”标准数据集概念图图22“中等”标准数据集概念图图23“困难”标准数据集概念图图24构建不同难度水平的指纹数据集的实验结果GB/ZXXXXX—XXXX/ISO/IECTR29198:2013图25在两种不同难度水平上的DET曲线比较该DET曲线显示了使用传感器A采集的数据在供应商B参考模板和供应商A验证程序之间进行互操作性测试的案例。实验结果表明以实验为依据的LOD概念在互操作性测试方面得到了有效的应用。参考文献[1]ISO/IEC19795-1,Informationtechnology—Biometricperformancetestingandreporting—Part1:Principlesandframework[2]ISO/IEC19795-2,Informationtechnology—Biometricperformancetestingandreporting—Part2:Testingmethodologiesfortechnologyandscenarioevaluation[3]ISO/IEC19795-4,Informationtechnology—Biometricperformancetestingandreporting—Part4:Interoperabilityperformancetesting[4]ISO/IEC29794-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Module1(单元测试)英语五年级下册-外研版(一起)(含答案)
- 2025年建筑玻璃夹行业深度研究分析报告
- 2025年江苏南通交通建设投资集团有限责任公司招聘笔试参考题库附带答案详解
- 电子工程基础数学建模的核心概念
- 2025年轴承双头压入机行业深度研究分析报告
- 电影中的教育启示与现代教育的融合
- 2025年吸尘机项目可行性研究报告
- 2025年广西河池市天峨县投资发展集团有限公司招聘笔试参考题库附带答案详解
- 知识经济背景下电商平台的版权意识培养策略
- 环境艺术引领的未来医疗花园景观设计探索
- (完整word版)Word信纸(A4横条直接打印版)模板
- 论文写作与学术规范 课程教学大纲
- 向高层销售:与决策者有效打交道
- DB32/T 4443-2023 罐区内在役危险化学品(常低压)储罐管理规范
- 尼泊尔简介课件
- 婴幼儿托育机构管理与运营实务高职PPT完整全套教学课件
- 新能源汽车电池石墨类负极材料一体化项目环境影响评价报告书
- 小学家长接送学生协议书
- IT服务连续性实现指南
- OEM合作协议(定稿)
- 微电网市场调查研究报告
评论
0/150
提交评论