信息技术 可扩展的生物特征识别数据交换格式 第17部分:步态图像序列数据 征求意见稿_第1页
信息技术 可扩展的生物特征识别数据交换格式 第17部分:步态图像序列数据 征求意见稿_第2页
信息技术 可扩展的生物特征识别数据交换格式 第17部分:步态图像序列数据 征求意见稿_第3页
信息技术 可扩展的生物特征识别数据交换格式 第17部分:步态图像序列数据 征求意见稿_第4页
信息技术 可扩展的生物特征识别数据交换格式 第17部分:步态图像序列数据 征求意见稿_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1GB/TXXXXX.17—202X/ISO/IEC39794—17:2021信息技术可扩展的生物特征识别数据交换格式第17部分:步态图像序列数据本文件规定了适用于步态图像序列数据采集中的特定应用要求、建议和最佳实践示例。其典型应用包括:a)支持对高分辨率视频和静态图像的人工检测;b)支持基于视频和静态图像的人工生物特征识别验证和辨识;c)自动的步态图像序列验证和辨识。本文件确保视频监控和其他类似系统生成的图像序列适用于人工辨识和人工验证。以下内容不在本文件的范围内:——人脸和/或全身图像相关的生物特征识别配置文件的定义分别在ISO/IEC39794-5和ISO/IEC39794-16中进行了介绍。——安全方面,例如数字图像序列电子签名、呈现攻击检测(PAD)和防变形。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。ISO/IEC2382-37信息技术词汇第37部分:生物特征识别(Informationtechnology—Vocabulary—Part37:Biometrics)注:GB/T5271.37-2021信息技术词汇第37部分:生物特征识别(ISO/IEC2382-37ISO/IEC10918-1信息技术连续色调静态图像的数字压缩和编码第1部分:要求和指南(Informationtechnology—Digitalcompressionandcodingofcontinuous-tonestillimages—Part1:Requirementsandguidelines)注:GB/T17235.1-1998信息技术连续色调静态图像的数字压缩和编码第1部分:要求和指南(ISO/IECISO/IEC10918-5:2013信息技术连续色调静态图像的数字压缩和编码:JPEG文件交换格式(JFIF)(Informationtechnology—Digitalcompressionandcodingofcontinuous-tonestillimages—Part5:JPEGFileInterchangeFormat(JFIF))ISO/IEC14496-1信息技术视听对象的编码第1部分:系统(Informationtechnology—Codingofaudio-visualobjects—Part1:Systems)ISO/IEC14496-2:2004信息技术视听对象的编码第2部分:视觉(Informationtechnology—Codingofaudiovisualobjects—Part2:Visual)ISO/IEC15444-1:2019信息技术JPEG2000图像编码系统第1部分:核心编码系统(Informationtechnology—JPEG2000imagecodingsystem—Part1:Corecodingsystem)2GB/TXXXXX.17—202X/ISO/IEC39794—17:2021(Informationtechnology—Computergraphicsandimageprocessing—PortableNetworkGraphics(PNG):Functionalspecification)ISO/IEC39794-1信息技术可扩展的生物特征识别数据交换格式第1部分:框架(Informationtechnology—Extensiblebiometricdatainterchangeformats—Part5:Faceimagedata)(Informationtechnology—Extensiblebiometricdatainterchangeformats—Part5:Faceimagedata)注:GB/TXXXXX.5—XXXX信息技术可扩展的生物ISO/IEC39794—16信息技术可扩展生物特征识别数据交换格式第16部分:全身图像数据(Informationtechnology—Extensiblebiometricdatainterchangeformats—Part16:Fullbodyimagedata)XML模式第0部分:入门(第二版W3C建议书,2004年10月,/TR/xmlschema-0////TR/xmlschema-1////TR/xmlschema-2/3术语和定义ISO/IEC39794—1、ISO/IEC39794-16和ISO/IEC2382-37界定的以及下列术语和定义适用于本文件。ISO和IEC在以下地址维护用于标准化的术语数据库:——ISO在线浏览平台:/obp——IEC电子百科:/3.13D模型3Dmodel已弃用:3D图像3Dimage3D生物特征识别采集主体表征,可在3D空间中编码表面或立体形状。注:3D模型可以是经过大量处理的生物特征识别主体的3D形状。3.2生物特征识别配置文件biometricprofile符合特定生物特征识别功能的基础标准的子集或组合。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021[来源:ISO/IEC24713-1:2008,3.9]3.3全身识别fullbodyrecognition基于形态学的个体自动识别。3.4步态识别gaitrecognition基于行走方式的个体自动识别。3.5人体辨识humanidentification在生物特征识别采集主体图像列表中搜索与输入图像匹配的过程。3.6渐晕vignetting与图像中心相比,朝向外围的图像亮度或饱和度降低。4缩略语下列缩略语适用于本文件。AVC高级视频编码(AdvancedVideoCoding)BAP身体动画参数(BodyAnimationParameter)BDB生物特征识别数据块(BiometricDataBlock)BER基本编码规则(BasicEncodingRules)CCTV闭路电视(Closed-CircuitTelevision)CEN欧洲标准化委员会(EuropeanCommitteeforStandardization)CIE国际照明委员会(InternationalCommissiononIllumination(CommissionInternationaledel'Eclairage))CNN卷积神经网络(ConvolutionalNeuralNetwork)DCI数字电影倡导联盟(DigitalCinemaInitiativesconsortium)DCNN深度卷积神经网络(DeepConvolutionalNeuralNetwork)DER非典型编码规则(DistinguishedEncodingRules)DL深度学习(DeepLearning)EXIF可交换图像文件格式(ExchangeableImageFileFormat)FAP面部动画参数(FaceAnimationParameter)FFM面部特征运动(FaceFeaturesMotion)FOV视场(FieldofView)GEI步态能量图(GaitEnergyImage)4GB/TXXXXX.17—202X/ISO/IEC39794—17:2021GHM手势运动(GestureHandMotion)HD高清或水平偏角(HighDefinitionorHorizontalDeviationAngle)HDR高动态范围(HighDynamicRange)HMD头部运动动态身体(HeadMovementsDynamicBody)HMS头部运动静态身体(HeadMovementsStaticBody)ICS实现符合性声明(ImplementationConformanceStatement)INTERPOL国际刑警组织(InternationalCriminalPoliceOrganization)ISO国际标准化组织(InternationalOrganizationforStandardization)JFIFJPEG文件交换格式(JPEGFileInterchangeFormat)JPEG符合ISO/IEC10918的图像压缩格式(ImageCompressionStandardSpecifiedasISO/IEC10918)JPEG2000图像压缩标准,符合ISO/IEC15444的图像压缩格式(ImageCompressionStandardSpecifiedasISO/IEC15444)JTC联合技术委员会(JointTechnicalCommittee)MP4音视频存储数字多媒体文件格式,符合ISO/IEC14496-14(ISO/IEC14496-14DigitalMultimediaFileFormatusedtoStoreVideoandAudio)MPEG运动图像专家组(MovingPictureExpertsGroup)MPEG-4符合ISO/IEC14496-2的视频压缩格式(ISO/IEC14496-2videocompressionformat)MTF调制传递函数(ModulationTransferFunction)MTF20MTF为20%或以上的最高空间频率(HighestSpatialFrequencywheretheMTFis20%orabove)NTSC美国国家电视系统委员会模拟电视彩色系统(NationalTelevisionSystemCommitteeanaloguetelevisioncoloursystemPAD呈现攻击检测(PresentationAttackDetection)PNG便携式网络图形格式(PortableNetworkGraphicsformat)RGB红绿蓝颜色表征(RedGreenBlueColourRepresentation)SD标清电视(Standard-DefinitionTelevision)SFR空间频率响应(SpatialFrequencyResponse)THz太赫兹(Terahertz)UBM2D2D上半身运动(UpperBodyMovementin2D)UHD超高清(Ultra-highDefinition)USAF美国空军(USAirForce)VGA视频图形阵列,图像格式为宽640px,高480px(VideoGraphicsArrayImageFormathavingWidth640PixelsandHeight480Pixels)XML可扩展置标语言(ExtensibleMarkupLanguage)XSDXML模式定义(XMLSchemaDefinition)5符合性如果生物特征识别数据块(BDB)满足下列条款对应的所有关联要求,则符合本文件:——其数据结构、数据值及其数据元素之间的关系,符合第16部分中的规定;——其数据值与输入的生物特征数据之间的关系,符合第16部分中的规定;——符合第8章规定的应用配置文件特定的符合性规范。5GB/TXXXXX.17—202X/ISO/IEC39794—17:2021如果一个生成BDB的系统,像在其关联的实现符合性声明(implementationconformancestatement,ICS)里声称的那样,其输出的所有BDB都符合本文件的要求(如上述定义则该系统符合本文件。该系统不需要能够生成涵盖本文件所有可能方面的BDB,只需要能够生成那些在ICS声称的能够被该系统支持的BDB。如果一个使用BDB的系统,像在其关联的ICS里声称的那样,为了达到系统的预期目的,其能够读入、使用所有符合本文件要求(如上述定义)的BDB,则该系统符合本文件。该系统不需要能够使用涵盖本文件所有可能方面的BDB,只需要能够使用那些在ICS里声称的能够被该系统支持的BDB。符合本文件的同时还需要符合ISO/IEC39794-16中定义的记录格式规范。6模态特定信息本章包含特定模态的信息,其中生物特征识别模态是人类特征的信息类别。通常,人类存在多种特征可以作为生物特征识别的模态。人类特征分为三类:生理、行为以及生理和行为方式的组合。步态和上半身运动是行为模态。本章还描述了在特征数据库的生物特征参考数据注册应用案例中,步态和上半身运动图像序列采集的要求和最佳实践建议。采集条件的详细情况见附录A。6.2实践从图像序列中可靠地提取特征及识别是步态和上半身运动识别中的重要问题。基本的身体运动视频或一系列静态图像序列构成了进一步分析处理步骤的基础。本文件中,步态和上半身运动被认为是人体运动中协调且循环的运动组合。对于某些准则,可能有两个不同的级别:最低要求和最佳实践建议。用语见表1。该要求给出了为达到符合性所需的最小可接受值或值范围。最佳实践建议所提供的值可带来更好的整体性能或质量,并且鼓励用户尽可能采用最佳实践值。表1最低要求和最佳实践建议的用语摘要应宜6.3步态识别数据模型6.3.1通则根据使用的传感器的不同,步态识别系统可以分为三类,即:基于运动成像(视觉)、基于可穿戴传感器和基于空间(地面)传感器。运动成像(视觉)可以分为两类,即:基于外观的方法和基于模型的方法。基于外观的方法也可以细分为两种类型:状态空间方法和时空方法。如范围所述,本文件仅限于基于运动成像的步态识别,它可能使用整个可用的电磁频谱,而不仅是可见带宽。本文件的范围如图1中用粗体和实线框表示。6GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图1步态识别系统的分类6.3.2基于模型的方法基于模型的方法可构建人体步态模型,并将提取的步态序列特征拟合到该模型。这些方法对个人的外表和服装不敏感,但计算成本很高。使用机器学习将增强模型的创建和最小误差模型的选择。基于模型的特征项提取用于提取人体关节(顶点位置)。基于视觉的人体运动分析系统由三个主要阶段组成:检测、跟踪和感知。在最后一个阶段,根据在先前阶段从时间视频流中提取的特征生成高级描述。基于标记的解决方案主要依赖于附着在人体关键位置的标记或传感器。使用视觉监测进行步态图像序列注册和辨识需要部署自动无标记视觉系统来提取关节的轨迹。自动提取关节的位置是一项艰巨的任务,因为非刚性的人体运动由于其高度灵活的结构和自遮挡而包含了多种可能的运动转换。服装类型、分割误差和不同的视角对准确的关节定位提出了挑战。对于基于模型的方法,形状模型是先验建立的,以将真实图像与该预定义模型进行匹配,从而在获得最佳匹配后提取相应的特征。6.3.3基于外观的方法基于外观的方法或无模型的步态识别方法直接作用于步态序列,它们不使用人体模型来重建人类的行走步骤。与基于模型的方法相比,这些方法的优点是计算成本低,但缺点是对穿着外观变化敏感。在步态周期中应用生物特征识别主体的平均轮廓或使用从亚毫米级图像获得的信息可以增强轮廓图像的准确性。本文件范围中略去状态空间是由于当前状态空间结果的使用与现状不符。系统状态变量的各种线性组合可用于跨越其状态空间,并且不同的重构方法可能会产生不同的解决方案[11],这就使得不同状态空间比对成为一项挑战。宜对如何重建步态动力学的状态空间达成共识,以规范状态空间方法。6.4步态识别数据流图2说明了生物特征步态图像序列处理系统中组件和组件之间的数据流。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图2步态图像序列生物特征识别系统的组件比对方法可以采用常规的基于特征的模板集或深度卷积神经网络(DCNN)特征向量。使用步态签名和DCNN处理生成特征向量后,基于某种基本的机器学习分类算法进行比对,如贝叶斯分类器或欧几里得分类器。见A.2深度卷积神经网络(DCNN)演示。6.5步态人体树概念步态成像系统利用2D记录或3D模型进行人工检测和自动步态验证以及步态辨识。与其将人体表征为孤立实体,更有条理的方法是利用人体树结构。例如:多模态生物特征人体验证或辨识可以使用面部特征、全身特征、步态特征和头部运动。验证或识别结果宜在不同的融合级别进行融合,例如比较得分层、特征层和决策层。宜使用亚毫米解决着装变化对步态匹配影响的问题。图3说明了全身图像和视频提供的可能性,这些图像和视频为各种步态相关过程提供了广泛的生物特征项选择。8GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图3适用于多种流程的全身特征标准姿势、元素结构和数据格式有助于将人体树数据解析为身体部位表征和标记点。可以使用算法的方法进行解析,这些算法将人体处理为部件的组合。分割可用作预处理步骤。人体生物特征的静态全身和动态步态信息都可以独立用于识别。例如,如果仔细平衡组合策略并使用基于分数求和的规则,则将静态和动态的人体生物特征融合可以得到更好的步态识别结果。6.6摄像机图像序列要求尽可能保存原始摄像机图像序列,无需任何额外的裁剪、旋转或其他图像处理。注册过程中,全身姿势应为图像垂直长度的60%至95%。全身的高度和宽度应可见。对于视频录制,方向为纵向和横向的摄像机均可接受。一组照片应包括至少一次主体以标准行走姿势的记录(正面完整轮廓,左侧完整轮廓,右侧完整轮廓,背面完整轮廓)。另外,还可以包括亚毫米波长记录。步态识别、上半身识别和全身识别可以组合以形成多模态生物特征识别过程,以提高生物特征识别系统的性能。如果人的面部不可见、视频监控或其他安全摄像机静态图像中的像素数太低,则可以使用人体轮廓进行辨识或验证。为了满足任何摄像机系统的要求,都需要进行测量和分析。图像序列采集测量要求见附录C。6.7步态识别记录6.7.1通则步态剪影是以单色实心形状表示的人形图像,通常为黑色。图像轮廓的边缘与主体轮廓相匹配。推荐使用自然行走的视频数据进行步态识别,以提高步态识别和全身光度识别的性能。6.7.2步态和上半身运动图像编码应使用以下几种图像编码来代替非标准格式,如以特殊或模糊的格式定义的位图,例如TIFF:a)JPEG图像序列:连续基准操作方式(符合ISO/IEC10918-1以JFIF文件格式编码符合ISO/IEC10918;b)JPEG-2000图像序列:第1部分代码流格式符合ISO/IEC15444-1,有损或无损,并以JP2文件格式(JPEG2000文件格式)编码;c)PNG图像序列:可移植网络图形格式(符合ISO/IEC15948无损并根据可移植网络图形(PNG)功能规范进行编码;d)MPEG-4视频:AVC/H.264格式,符合ISO/IEC14496-10格式定义;e)MP-4视频:符合ISO/IEC14496-14格式定义。在应用压缩之前,宜在图像上确定步态识别标记点。如果标记点已经准确确定,则宜将其包括在记录格式中,从而提供了一种选择,即在处理图像进行身体识别任务时,无需重新确定这些参数。标记点宜通过计算机自动检测机制确定,然后根据合规要求进行人工验证。目前,关于步态识别标记点尚无统一建议。6.7.3步态和上半身摄像机图像分辨率9GB/TXXXXX.17—202X/ISO/IEC39794—17:2021数字视频录制中最常用的帧率是25帧/秒。像素宽高比通常为1:1。但是在一些视频标准中,像素被定义为非正方形。例如,对以4:3格式显示720px×540px,NTSC使用0.90的像素宽高比来显示720px×480px(DV)或720px×486px(D1)的帧大小。大多数数字静态图像摄像机能够录制视频。由于太赫兹波长分辨率的限制,亚毫米(THz)摄像机和扫描仪的图像尺寸(px)有限。THz帧通常为DV大小。图像方向通常不是问题,因为JPEGEXIF元数据显示了摄像机方向。用于视频编码的MPEG-4AVC/H.264(ISO/IEC14496-10)允许进行帧提取以进行生物特征样本比对处理。MPEG-4第14部分或MP4是最常用于存储视频和音频的数字多媒体格式。根据ISO/IEC14496-1和ISO/IEC14496-2,MPEG-4第14部分(正式名称为ISO/IEC14496-14)是被指定为MPEG-4标准的一部分。MP4是相关的文件格式。表2展示了常用的数字视频格式和对应的分辨率,显示比例和像素信息。图4展示了放置在8K帧上的VGA、HD、4K帧。表2数字视频录制格式对比图4数字视频帧大小对比6.8步态模态6.8.1通则步态识别和全身识别可以组合成多模态生物特征识别,以提高生物特征识别系统的性能。如果人的面部区域不可见、视频监控或其他监控摄像机中静态图像的像素太低,则可以使用人体剪影进行辨识或验证。50级和4K高分辨率静态图像更适用于面部生物特征识别过程。在自动化处理流程中,可能需要先解析人体树,在实践中涉及检测所有身体部位并形成人体树模型。在这种情况下,面部和上半身用于获GB/TXXXXX.17—202X/ISO/IEC39794—17:2021取面部图像。一些人脸识别程序包括此类功能。例如,为了比较两个视频帧,其中一个是以各种全身姿势看到的人的参考视频流,另一个是仅显示上躯干和头部的CCTV视频探针,对两个视频流应用头部运动分析是正确的。6.8.2步态剪影步态剪影是表示为单一颜色实心形状人的图像,通常为黑色。图像轮廓的边缘与主体轮廓相匹配。推荐通过使用自然行走视频数据进行步态识别,以提高步态识别和全身光度识别的性能。为确保步态序列详细采集身体运动,建议以30帧/秒的速率采集序列。这是步态研究数据库(例如CMUMoBo数据库和USFHumanID步态数据库)中使用的典型帧频。为了采集步态特征的所有细节,应采集至少一个完整的步态周期,即两个完整的步长。图5展示了一个完整步态周期的剪影,从左到右是站立的阶段(1、3、5),以及这些阶段之间的摆动阶段(2、4)。图5完整步态周期各阶段示意图有多种自动化步态识别方法。有些方法使用步态图像作为输入,有些仅使用步态剪影。此外,自动化方法可以使用对齐的或不对齐的图像。采集过程宜允许使用任何方法进行自动识别,因此宜使用固定式摄像机采集步态序列。侧视图是步态序列最具判别性的视图。主体宜至少使用侧视图。宜指示主体在垂直于摄像机视线的直线上行走,如图6所示。当使用跑步机用于行走时,更容易在画面中央保持人的固定视图。作为一种选择,除了侧面(横向)视图外,还可以录制类似的视频,显示正面和背面(背侧)视图。图6摄像机和人员行走路径的俯视图在极端场景中,外观和动力学都有变化,通过时空方式结合外观和运动,可能获得比使用单一模态GB/TXXXXX.17—202X/ISO/IEC39794—17:2021更好的效果。如果将照明和背景变化减到最小,则视频分析耗时更少。现有一些方法可以减少视频监控素材中照明变化和动态背景的影响。但背景减除是一项艰巨的任务,尤其是在包含运动背景,植被,涟漪水等复杂动态场景下。为了采集有质量的视频建议设置专门的视频采集室,这样就不必为了纠正这些问题而对保存的视频进行预处理。6.8.3监控系统在视频监控系统中,多摄像机操作对于多个采集区域至关重要。这可能包括沿着目标主体预期要走的路径上的摄像机“层”,以获得多种检测机会(例如,当目标主体沿着走廊朝摄像机走去时)。这不仅有助于处理帧频和丢帧问题,而且在触发警报时有助于跟踪目标主体,尤其是当存在明显的检测延迟时。多摄像机还用于任何单个视频监控采集区域,该区域对于一个摄像机而言太宽,无法为所需的性能水平提供足够的面部分辨率,并且在穿越特定摄像机的视场或景深时,试图补偿可能面向不同方向的目标主体。这些目标主体可能有意避开摄像机,也可能根本不知道它们的存在。步态分析用于在多摄像监控场景中的人员辨识。例如,采用视点独立校正的方法计算多摄像机视频帧的侧视图坐标。使用静态图像摄像机或视频监控系统采集的低帧率(1fps~5fps)录像与标准的步态剪影序列兼容。注册的典型时间约为6s。5fps后的辨识率提高接近较高帧率视频的识别率。在相同的录制时间内,低帧率、高分辨率的50级和4K视频存储大小比全帧率视频小得多,因此使低帧率对于数据库存储更加经济。SD分辨率(64px×480px)或更高分辨率可用于步态序列注册记录。低帧率步态序列能通过以指定间隔对30fps注册数据库序列进行下采样来构建。这样,可以将视频监控摄像机的低帧频视频数据作为探针,而无需时序重建。6.9上半身运动模态6.9.1通则使用上半身动力学的生物特征辨识技术集中于头部区域和面部特征运动,如图7所示。典型的动态面部特征有眨眼、眼球运动和凝视。头部的运动要么是静态的(人不走路时要么是动态的(由于步态)。手的运动也可以是无序的或动态的自由运动或更多的控制手势。图7上半身运动:关键部位和标记点6.9.2面部特征运动(FFM)在人脸上,我们可以识别出许多独特的部位,如眼睛、鼻子、嘴唇。这些部位的大小和它们之间距GB/TXXXXX.17—202X/ISO/IEC39794—17:2021离的组合是人脸识别的基础。这些部位之间的动态是独一无二的。面部特征运动包括典型的眨眼、眼球运动、目光变化和嘴唇运动。在某些情况下,例如当一个人说话或微笑时,面部特征运动可能是疤痕和皮肤特征的运动,例如皱纹和皮肤上的其他痕迹。6.9.3头部运动识别头部运动识别分为两个独立的部分:——典型的头部微运动。在所有的身体姿势中,无论站立不动、移动或坐着,都可以注意到典型的微型头部运动。每个人都有独特的颈部和头部运动,即头部姿势是以颈部为基础的头部俯仰、偏转和侧倾的运动。——当人走路时,头部和身体的运动是步态的结果。当人的腿在移动时,身体就会移动,由于头部与身体的其他部分连结,它会随着身体移动。每个人都有独特的头部运动,这是基于他们独特的步态。这些动作可以通过头部在整个视频全部帧中上下和左右方向的位置变化进行分类。6.9.4头部运动静态身体(HMS)每个人都有独特的颈部和头部微动作,或头部姿势,当一个人不走路或身体不动时,这些动作可能很有价值。HMS姿势是以颈部为基础的头部俯仰、偏转和侧倾的运动以及肌肉的自然反射。在HMS中,使用动态DL和光流来获得微头部运动相对于静态体的独特性。第一步需要辨识准确的头部姿势。6.9.5头部运动动态身体(HMD)每个人都有独特的头部运动,这是由行走身体的运动产生的特定步态的结果。利用动态DL和光流来获得人行走时头部运动的独特性。识别头部运动动态身体(HMD)的挑战之一是需要从一个人走路时的总的头部运动中动态地减去头部运动静态身体(HMS),并留下干净的HMD作为步态结果。这个HMD对这个人来说是典型的特征。提取的头部运动静态体(HMS)本身是一个额外的识别因素。HMS和HMD通常可以很好地分开,因为它们通常处于非常不同的机械频率范围和非常不同的振幅。6.9.6手部运动每个人都有自己独特的移动双手的方式,尤其是在走路和站立不动的时候。动态DL和光流用于获得手部运动的独特性。在许多情况下,这种手部运动也可以作为手势运动(GHM)来识别特定的手势。7特定配置文件信息7.1.1通则本章概述了步态和上半身运动记录配置文件。有关数据元素的说明见ISO/IEC39794-16。数据元素符合ISO/IEC39794-16标准中的定义。7.1.2步态表征每个步态图像序列数据块应属于一个生物特征主体,并且应包含一个或多个人体的2D图像序列和/或与人体相关信息。因此,每个BDB可以包含零个或多个几何表征(区域图像,点图,顶点表征,神经网络表征)。样本可包含后处理的数据,因为视频记录设备具有模式识别、分类以及嵌入在摄像机软件中的其它GB/TXXXXX.17—202X/ISO/IEC39794—17:2021处理功能。在这种情况下,MPEG-4样本可能包含面部动画参数(FAP)或身体动画参数(BAP)。当使用摄像机软件中的神经网络进行进一步处理时,处理后的最终结果可以是神经网络特征向量表征。在这种情况下,应使用步态神经网络特征向量表征配置文件。对于这些情况,所有必需的数据元素均在ISO/IEC39794-16中进行了描述。使用基于卷积神经网络的方法,可以从步态剪影序列图像中提取和聚合有用的信息,而不是通过平均剪影图像来表示步态过程。可用的生物特征样本格式用于决定应采用哪种配置文件。7.1.3场景要求特定的背景要求对于步态图像序列创建的要求不是规范性要求。考虑背景对基于计算机的步态识别很重要,因为计算机步态识别过程的第一步是从背景中分割出人体。光线宜均匀分布在人体上,以便进行精确地剪影处理。从摄像机的角度来看,光线不宜有明显的方向。剪影是场景的图像,表示为单个生物特征主体的实体形状,通常为黑色,其边缘与主体的轮廓匹配。7.22D步态图像序列配置文件7.2.1通则Gait2D配置文件适用于摄像机生成连续图像的情况。可能需要处理数据以获得必要的身体动画点或将数据压缩为面部或身体标记点格式。当仅需要面部或身体动画参数时,则经过后处理的步态视频和/或静态图像包含一组标记点坐标或类似信息,用于重建面部或身体运动。本文件中BDB应符合ISO/IEC39794-16中BDB记录格式。7.2.2步态图像序列表征配置文件要求本节规定了所需的输出图像或图像序列属性,而不是强制使用特定的硬件和照明采集系统。这些要求和建议适用于摄像机系统输出的数字图像。神经网络处理的视频和/或静态图像序列既可以用重构的视频和/或静态图像序列表示,也可以用神经网络特征向量格式表示。如果样本以上述图像格式之一表示,则应满足本节的要求。第6章中介绍的模态特定信息适用于此配置文件。7.2.3采集后处理通常通过去除背景并在每个视频帧上对全身图像进行剪影来对基本记录进行后期处理。这可以通过摄像机固件使用常规方法或神经网络来实现。使用神经网络进行局部处理时可以使用局部特征向量或张量格式。但是,使用ASN.1或XML进行信息交换的步态图像序列输出数据应符合ISO/IEC39794-16中规定的格式规范。虽然传统方法通常从二值剪影序列中获得步态特征,但也可以使用卷积神经网络(CNN)从低级运动特征(即光流分量)中学习高级描述符。一些实验结果表明,使用光流的时空立方体作为CNN的输入数据,可以在低于低分辨率VGA帧8倍的图像分辨率,即80px×60px情况下获得最先进的步态任务结果。视频分类的双流架构如图8所示。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图8视频分类的双流架构通过基于深度卷积神经网络(CNNs)的相似性学习进行基于步态的人体辨识,在OU-ISIR数据集上的识别率超过90%。OU-ISIR有4,007名主体,是目前文献中最大的步态识别数据集之一。在此数据集上,在相同视图条件下所用方法的平均识别率高于98跨视角场景的平均准确率高于91%。所描述的方法在南佛罗里达大学(USF)步态数据集上也取得了很好的结果,该数据集中包含在真实室外场景中成像的步态序列。为了使用生物特征向量进行识别,对参考和探针使用相同的CNN架构非常重要。例如,如果在数据库中创建参考向量时使用的架构是基于某种卷积层和全连接层的特定集合,则应以相同方式创建探针向量。如果没有标准化的架构,使用CNN进行步态识别将仅限于使用相同架构的本地数据库。7.2.4神经网络训练与测试广泛使用的一些数据库包括南佛罗里达大学(USF)步态数据库,中国科学院(CASIA)步态数据库,大阪大学(OU)和科学与工业研究院(ISIR)联合的OU-ISIR步态数据库,以及南安普敦大学(SOTON)步态数据库。这些数据库可用于神经网络训练和测试。通过一组标记的多视角人类行走视频,可以训练神经网络识别用于辨识主体有区分度的步态模式。神经网络能够自动学习识别最有区分度的步态特征变化,以预测给定的一对步态特征的相似性。CASIA步态数据库有四类数据集:数据集A、数据集B(多视角数据集)、数据集C(红外数据集)和数据集D(足压测量数据集)。CASIA数据集A(以前的NLPR步态数据库)创建于2001年12月10日,包括20人。每人有12个图像序列,三个方向,即与图像平面平行,45°和90°,每个方向有4个序列。数据集B是大型的多视角数据库,创建于2005年1月。有124名主体,步态数据是从11个视角中采集的。分别考虑了三种变化,即视角,着装和携带物的变化。除视频文件外,该数据集还提供了从视频文件中提取的人体剪影。数据集C由红外(热)摄像机于2005年7月至8月采集。该数据集包含153名主体,并考虑了四种行走条件:正常行走,慢速行走,快速行走和带包正常行走。红外视频全部在夜间拍摄。数据集D于2009年7月至8月通过摄像机和足部扫描同步采集的。它包含88名主体,并考虑了真实的监控场景和广泛的年龄分布。图9中,CASIA数据集GEI剪影示例行图像显示了一名主体从不同的视角行走。步态能量图表征是通过对一个步态周期的剪影经过尺寸归一化和中心对齐后进行平均形成的。图9CASIAGEI数据集图像示例OU-ISIR步态数据库包含一个由10307名主体(5114名男性和5193名女性,年龄从2到87岁不等)组成的数据集,分布在0°~90°和180°~270°的14个视角。七个网络摄像机(Cam1-7)以25fps的速度拍摄1280px×980px的步态图像,这些摄像机以15度方位角的间隔沿四分之一圆放置,其中心与步行路线的中心重合,其半径约为8m、高度约为5m。整个OU-ISIR步态数据集分为两个不相交的子集,即训练集和测试集,两个子集的大小几乎相同。南安普敦大学3D步态数据集使用8个同步摄像机采集步态,当主体通过多生物特征识别通道时,使用额外的摄像机在通道尽头朝向主体面部以及在通道侧面单耳侧采集图像。当主体在通道内时,他们的步态由八个摄像机采集,从而可以重建3D立体数据。步态摄像机的分辨率均为640px×480px,并GB/TXXXXX.17—202X/ISO/IEC39794—17:2021以30帧/秒的速度采集。它们通过同步单元的网络连接在一起,以确保摄像机之间的精准计时。还使用高分辨率1600px×1200px摄像机采集主体的面部和上半身的视频,从而实现面部识别。采集主体头部一侧的1600px×1200px快照,可用于人耳识别。为对事件精确计时,采集日期/时间块抽象值宜以UTC(见ISO8601系列)指示完成采集表征的日期和时间,精度为1ms。7.3UMB2D上半身运动配置文件上半身运动(UBM2D)表征包含2D表征数据、2D采集设备技术和2D图像信息。2D步态表征中描述了2D表征数据、2D采集设备技术和2D图像信息元素。上半身运动子类有:——面部特征运动(FFM):——头部运动静态身体(HMS——头部运动动态身体(HMD——手势运动(GHM)。8编码8.1已标记二进制编码ISO/IEC39794-16附录AA.1规定了一种ASN.1模式,其中抽象数据元素由ASN.1类型约束,此类型在以下标准之一中定义:ASN.1标准ISO/IEC8824-1,ISO/IEC39794-1、ISO/IEC39794-5、ISO/IEC39794-16或本文件。全身图像和步态图像序列数据的已标记二进制编码应通过将ISO/IEC8825-1中定义的ASN.1非典型编码规则(DER)应用于给定ASN.1模块中定义的BodyImageDataBlock类型的值来获得。每个数据对象的DER编码包括三个部分:以八位位组形式编码的标记,用于辨识数据对象;以八位位组形式编码的长度,用于提供后续以八位位组形式编码的值;以及以八位位组形式编码的值。根据ISO/IEC8824-1,每个ASN.1模块都以一个模块名称开头,该名称用于人辨识该模块。ASN.1类型名称采用大驼峰命名法,该名称源自抽象数据元素子句中的子标题。如果名称以数字开头,则将此组件放在名称的末尾。结构化类型的组件名称使用小驼峰命名法,并且在此结构化类型的范围内是唯一的。ISO/IEC39794-16中定义的ASN.1模块可按ISO/IEC8824-1中规定的前后兼容方式扩展定义。ISO/IEC39794-16新版本中可规定新的附加数据元素和数值,并弃用以前定义的可选数据元素和数值。ISO/IEC39794-16中的ASN.1模块应包括上一版本中指定的所有数据元素和数值。ASN.1模块见/iso-iec/39794/-16/ed-1/en/。编码示例见附录B。8.2XML编码XML文件的编码主体数据应遵循ISO/IEC39794-16A.2中给出的XSD。B.2的示例使用了XSD模式,其中抽象数据元素受到以下标准之一中定义的XML类型的约束:W3C推荐标准、XML模式第1部分和第2部分、ISO/IEC39794-1、ISO/IEC39794-5、ISO/IEC39794-16或本文件。二进制数据只应以base64编码,并以文本字符串的形式存储在xs:element中,该元素本身具有‘xs:base64Binary’的基础类型。示例1:<xs:elementname=“d为避免疑义,不允许使用其他编码二进制数据的方法,例如xs:hexBinary或支持二进制数据编码GB/TXXXXX.17—202X/ISO/IEC39794—17:2021的专有扩展(即XOP)。SPARQL(SPARQL协议和RDF查询语言)不支持XML数据类型“base64Binary”。ITU-TX.694建议书和相同的ISO/IEC8825-5定义了将XSD模式(符合W3CXML规范的模式)映射到ASN.1模式的规则,以便使用ASN.1编码规则,例如用于传输由XSD信息的基本编码规则(BER非典型编码规则(DER紧缩编码规则(PER)或XML编码规则(XER)。XSD模块见http:///iso-iec/39794/-16/ed-1/en/。编码示例见附录B。9注册的BDB格式标识符ISO/IEC39794-16中列出了注册信息,用于识别本文件中引用的全身图像数据交换格式。有关详细信息见ISO/IEC39794-16。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021附录A(资料性)采集条件A.1步态记录系统建议A.1.1架构ISO/IEC39794-16中所述的全身摄影系统架构定义需考虑的要求也适用于步态记录。包括:——由视频采集单元执行的生物特征采集子过程;——由视频应用程序执行的图像格式化子过程;——过程和结果的可视化,包括操作员和生物特征鉴别过程的主体;——视频系统的完整性;——拒绝服务(系统仅由授权操作员使用),例如,可以通过对操作员进行生物特征验证来实现;——与其他系统(数据库等)的连接,重点在于协议和此类连接的完整性。本文件仅涵盖前两个方面。其他方面的内容见参考文献,在本文件中未作详细考虑。A.1.2可用性和可访问性无障碍系统的设计宜公平地适用于具有永久性或暂时性身体疾病和心理残疾的主体。这些系统宜使用简便,并具有良好的操作容错。对于无法使用生物特征识别系统的主体,宜提供必要的替代系统。ISO/IECTR24714-1中给出了有关这些方面的一般指南。图示建议见ISO/IEC24779系列标准。A.1.3实际应用A.1.3.1通则在实践中,从犯罪嫌疑人那里获取全身图像和演练视频,并将其保存到数据库中。生物特征采集过程可涉及单个或多个生物特征采集设备(摄像机)。生物特征识别特征项是从高分辨率样本中提取的。高分辨率图像和4K视频可为各种生物特征识别过程提供足够的信息。当存储的生物特征样本归属于生物特征识别数据主体并用作生物特征比对的对象时,形成生物特征参考。A.1.3.2身体和步态步态图像序列代表了行为步态特征,与单帧中的全身识别特征相比,更容易从低分辨率的记录中提取出来。高质量的全身图像甚至可以显示面部特征,为面部识别所用。目前,视频监控系统很少能生成清晰的面部图像。高质量的全身图像更容易从高清视频帧中提取。在监控视频中,身体图像比清晰的面部图像出现的频率更高。通过观察视频材料中的行为,将面部和身体图像添加到监控列表中。为了提高生物特征样本的国际互操作性,有必要创建一个描述全身图像和视频记录的生物特征样本格式的标准。值得注意的是,视频始终是通过以帧率定义的特定时间间隔所拍摄的静态图像来创建的。静态图像和视频帧之间的差异主要是单个图像之间的时间。通过正确设置时间线,可以比较静态图像和视频帧,以进行辨识或验证。时间值宜以UTC(见ISO8601系列)指示完成表征采集的日期和时间,精度为1ms。根据不同的文化要求,拍摄对象会穿着衣服或近乎裸体。根据INTERPOL指导原则,在灾难现场和停尸房内对尸体进行照相和录像对于证据和确定事件原因都非常重要。步态图像序列不一定需要高质量的记录。先进的生物特征识别算法可选择那些面部几乎没有任何有用识别信息的人的图像。根据德克萨斯大学达拉斯分校的一项研究工作,在这种情况下,仅进行人脸识别是偶然的,但是基于身体更大部分的识别是准确的。自动人脸识别领域的假设是所有重要的身份信息都在面部。这些结果宜为我们指出改进自GB/TXXXXX.17—202X/ISO/IEC39794—17:2021动识别的新方法。与比较两个SD级图像相比,将SD视频帧与高质量参考图像进行比较可获得更好的结果。目前,能够拍摄高分辨率静态图像和4K视频的4K单反相机的价格合理。视频监控系统在不久的将来将从高清发展到4K,因此静态图像的分辨率水平宜很高。通过裁剪人的4K全身正面图像可以获得护照质量的面部图像。视频监控系统(ISO/IEC30137-3)和高效编码(ISO/IEC23008-12)已对生物特征识别数据格式进行了标准化集成工作。步态视频成像技术要求见ISO/IEC39794-16,该技术要求与注册时的全身摄影要求相同。A.1.3.3识别方法在基于剪影的识别中,对摄像机数据进行后处理以获得所需的序列,并分清改变步态外观的、与身份无关的因素。这些因素可以分为:——与生物特征主体相关的因素,例如步行速度、穿着和携带物;——与设备相关的因素,例如不同的帧率和成像分辨率;——与环境相关的因素,例如照明条件和摄像机视角。在剪影情况下,数据将被保存为一种后处理步态视频录像,其中包含了本文件所述的一组图像。基于模型的识别主体模型表征形式仅使用本文件中指定的那些数据类型。强烈建议将其他制造商特定的数据类型转换成符合本文件中提供的标准数据类型之一。上半身运动识别使用本文件描述的方法进行后处理。A.1.4亚毫米成像太赫兹(THz)辐射被称为亚毫米辐射,由ITU指定的0.3太赫兹~3太赫兹(300GHz~3000GHz)频段内的电磁波组成。太赫兹波段的辐射波长相应地在1mm到0.1mm范围内,且该波长也为图像设定了理论分辨率限制。太赫兹辐射位于电磁波谱中微波和红外光波的太赫兹间隙中。本文件中的成像仪分为两大类:有源系统和无源系统。有源成像仪基于雷达配置,采用合成或光学成像方案,而无源成像仪则与摄像机相同。所有这些系统的主要挑战是在获得令人满意的空间分辨率和快速图像采集的同时实现大视场(FOV)。在图A.1中,一幅亚毫米图像显示了主体衣服中间隐藏的可疑物质。图A.1三个主体的亚毫米成像GB/TXXXXX.17—202X/ISO/IEC39794—17:2021THz光束可以穿过非金属材料,例如服装面料,纸张和纸板,塑料和陶瓷。它不能穿透液态水或金属。成像区域深度通常小于10m。在5m的距离处,可以使用无源系统拍摄2m高的亚毫米级照片。本文件主要介绍由成像现象学塑造和驱动的无源亚毫米/THz成像系统要求。尽管在世界范围内已构建了许多无源亚毫米成像系统,能够在几秒到几分钟的帧时间内生成高质量、合理对比度和低噪声的图像,但很少有无源系统能够在实时视频码率下产生有用的图像。以下简要描述了在所探讨场景中、提供有用的实时视频速率的无源图像所需的关键接收器灵敏度水平。这些测量在美国陆军研究实验室进行。测量表明,衣服在达到约300GHz的频率下具有足够的透明度(基于3-dB标准)。显微照片显示的粗糙度与THz波长相当,特别是在尼龙的粗丝状图案以及人造丝和丝绸的交织编织中。由于发现这些样品类型是透明度最高,可以推测任何表面散射都必定相当弱。由于一般要求使用较小孔径的成像设备,检测和辨识安全间隔距离的人员携带的隐蔽武器,因此假定针对这种情况设计的成像系统最有可能在亚毫米/THz范围内工作,可能在320GHz或640GHz大气透射窗口之一。成像系统满足分辨率要求,以便在所需的间隔距离对主体进行足够的空间循环,使观察者能够在典型背景材料下充分执行探测或辨识隐藏的武器或其他目标的任务。此外,这种系统能够采集具有足够信噪比的图像帧,以在视频帧率下产生良好的图像。图A.2说明了结合可见光和亚毫米波长图像用以检测、定位和识别右边第一和第二个人衣服下隐藏的武器。图A.2四个主体的可见光和亚毫米组合成像A.2全身视频录像的建议本建议提供了被摄主体和摄像机定位,以及照明设备部署的示例。本建议的目的是确保主体全身位置正确并光照均匀,从而生成符合本文件的图像,并且身体任何部位都没有阴影或亮斑。不允许出现人工检查时可察觉的失真。特别是不允许出现由广角镜和相机放置太近造成的鱼眼效应。图A.3说明了50mm摄像机镜头焦距的FOV、相机与主体距离和主体高度之间的关系。摄影和视频工作室通常是一家专业运营的机构,配备数码相机,多个可调光源,合适的背景或背景布,以及用于获得高质量全身成像的主体定位设备。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021拍摄全身图像和视频时,建议使用垂直方向的相机,有三个方面原因:——允许以经济的方式在垂直方向使用可用像素;——垂直相机方向用于全身图像;——在后处理中视频帧旋转易于实现。建议小型录影棚设置使用跑步机,以获得高质量的步态识别视频记录或步态图像序列。图A.3主体和相机的位置在规划工作室时,要考虑安全和安保规则。工作室宜是人感到安全的地方。虽然不可能完全消除暴力和火灾等其他事件的风险,但通过采取一套适当的程序将这些风险降至最低。无法确定哪些事件会引发特定个体突然的暴力或攻击行为。从安全的角度来看,体系结构决策很重要。例如,主体始终位于工作室的某个地方,以便操作员能够通过他们身后的门快速撤离。这种安排在监狱、警察局和类似设施中尤其重要。A.3步态记录--技术建议A.3.1通则实践中,与其他环境相比,在工作室或办公室安排良好的注册工作条件更为容易。较差的注册和监控条件会造成创建的生物特征识别参考和探针质量低劣。当有可能参与监控环境的规划时,例如当规划新机场、翻新或扩建现有机场时,最容易安排监控。尽管有多种方法可以减轻环境误差因素,但正确建造人行道对于步态识别匹配质量至关重要。在影响步态的因素中,由视角改变引起的变化被认为是最大的挑战之一。有多种方法可以通过不同的预处理方法和卷积神经网络架构,来解决由跨视角和交叉行走条件引起的问题。无论采用何种处理方法,限制跨视角和交叉行走条件都可以提供更好的识别条件。建议参考和探针间的视角差小于20度。A.3.2误差因素限制为了获得最佳的步态辨识结果,必须限制已知的误差因素。为了达到基于视觉的步态识别目标,有必要分离出与身份无关的因素,这些因素会改变步态外观。这些因素的稳定性和整个步态识别系统各因素的优化都影响着整个系统的识别质量。例如,适应步行速度是一种稳定方法,而将步行速度限制在系统的最佳检测范围内则是一种优化方法。已知因素可以分为三个独立的因素组,即与主体相关、与设备相关和与环境相关。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021与主体相关的因素包括:——步行速度;——着装;——携带物。与设备相关的可变因素包括:——帧率;——图像分辨率。与环境有关的因素包括:——照明条件;——摄像机视角。在这些因素中,视角的改变是一个重要的因素。跨视角变化是视频相关任务中关键的问题之一。如果系统忽略跨视角变化,当视角改变时,步态识别系统的性能会急剧下降。一种可能的步态人体辨识方法是通过深度卷积神经网络(CNN)进行相似性学习。这可以利用标记的多视角人类步行视频训练深层网络来实现,以识别步态模式最具区分性的变化,从而表明人的身份的变化。另一种跨视角动作识别的方法是使用“虚拟视图”,该虚拟视图将一个或多个探针视图中提取的动作描述符与参考视图中提取的动作描述符连接起来。这其中的一个变化是使用“虚拟路径”,其中虚拟路径上的每个点都是一个虚拟视图,该虚拟视图是通过动作描述符的线性变换获得。A.3.3人行道建设无论是注册还是监测,环境因素对于步态视频记录站点的质量都至关重要。宜遵循以下设计规则:——用于主体的笔直人行道;——地板无凹凸不平;——人行道上无留言板、标志或人员等干扰;——地板或墙壁上无纹理、海报或其他物体;——地板和墙壁采用中性灰色哑光材料;——主体的路径照明均匀。如果室外照明超过200lux(1勒克斯等于每平方米1流明),则用屋顶遮挡;——均匀照明水平宜约为500lux或更高,具体取决于出入口的环境照明情况;——控制色温,以使摄像机的白平衡算法能够适应光线。视频记录为中性色并正确曝光。重要的是,整个身体和背景之间的界限宜可以清楚地识别整个主体。人体图像后面的背景上不宜有可见的阴影。背景宜为纯色,且不宜包含任何可能引起计算机模式识别算法混乱的线条或曲线的纹理。因此,背景宜为均匀的颜色。在注册工作室中,摄像机会跟随主体,或跑步机与固定摄像机配合使用。对于行走困难的人,跑步机速度宜设置为正常行走速度,即5Km/h或更低。跑步机对于不习惯的人来说可能会对平衡带来真正的挑战。因此,有时需要一名助手来确保主体的安全。10到79岁的健康主体的正常自选步速为1.3m/s~1.5m/s(4.7Km/h~5.4Km/h)。80岁以上的人的自然步速可能较慢,约为1m/s(小于4Km/h)。长步道的步速可能高于短步道。遵循ISO/IEC39794-16附录C中规定的工作室设置指南。A.3.4摄像机布置A.3.4.1通用摄像机布置注册和监测在许多方面互不相同。一个重要的因素是摄像机的视角。在注册过程的参考记录中,基本视角是横向,即侧视图。在受控环境中安装监控摄像机时,可以使用与注册时相同的视角。图A.4显示了一个超分辨率图像的亚毫米成像细节分辨率的近似值。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图A.4正面和侧面摄像机视图A.3.4.2注册摄像机布置A.通则沿步道的摄像机布置宜能够采集主体的运动,如在单摄像机设置中获取矢状面(横向图或侧视图)的运动,以及在双摄像机设置中,还可选正面(前视图)的运动。矢状面是将人体分为左右两部分的解剖平面。额平面平行于身体的长轴且垂直于矢状面,将身体分为前部和后部(背部)两部分。A.单视角注册注册时单摄像机设置类似于拍摄正面面部图像时使用的设置。主体在摄像机前面从右向左行走。如果使用跑步机,则主体在摄像机前行走,摄像机记录的是行走中主体的侧视图。A.双视角注册双摄像机设置利用两个摄像机同时记录主体行走时的情况。主体在第一台摄像机的前方从右向左行走,然后走向第二台摄像机。如果使用跑步机,则主体在第一个摄像机前行走,该摄像机记录行走主体的侧视图,而第二个摄像机则在主体前面记录。当仅使用一台摄像机时,主体在摄像机前方从右向左行走时进行第一次记录。当主体走向摄像机时,进行第二次记录。记录的顺序不重要。A.多视角注册多摄像机设置使用多个摄像机同时记录主体行走时的情况。当仅使用一台摄像机时,主体从图A.5中的侧视图摄像机1开始,沿着摄像机前方旋转45o角的路径行走多次。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图A.5多个摄像机视角A.3.5工作室灯光和布局人行道或跑步机的照明需要使用多个光源。光线的主要方向是从摄像机朝向主体。为了减少长距离走动时背景上的阴影,建议使用单独的灯光来照亮背景。步态识别步行视频记录可能需要比图A.6更多的水平空间,图A.6给出了使用大型表面光源时步态记录工作室的最小推荐尺寸。图A.6步态记录工作室的最小推荐尺寸A.3.6行走步态记录走廊照明和布局GB/TXXXXX.17—202X/ISO/IEC39794—17:2021为步态记录建造监控步行走廊,使得每次只能有一个人走过摄像机。背景和前景照明可以使用条形灯、大型照明光板或间接照明,以保持主体和背景之间的均匀照明和良好的对比度。最佳走廊构造允许记录所有通过监控走廊的主体的完整步态周期。走廊的设计足够灵活,以满足不断变化的需求和硬件。走廊附近任何座位的地点和位置宜考虑步行走廊内主体的安全和畅通无阻。当将走廊链接到ABC门时,可以自动将主体的辨识数据与走廊的成像和识别结果联系起来。图A.7显示了当使用大型表面光源时,步态监测走廊的最小推荐尺寸和摄像机放置位置。图A.7最小的走廊尺寸和摄像机放置位置宜事先使用实物模型对摄像机位置进行测试。摄像机与主体的距离短(如2m)、使用未校正的广角镜头会降低步态识别效率。使用步态识别和面部识别,可以构建基于多模态生物特征验证的步行访问控制系统。如果使用矢状步态识别,面部视频记录需要第二个面向目标的摄像机。亚毫米记录设备可能需要对图A.7中所示的走廊设计进行修改。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021编码范例B.1二进制编码示例B.1.1通则A.1中的ASN.1模块中定义了这些编码示例中使用的步态图像序列数据块。数据以DER编码。DER是BER的子集,提供了一种精确的编码ASN.1值的方式。DER适用于需要唯一编码(例如在加密中)的情况,并确保需要进行数字签名的数据结构产生唯一的序列化表征。所有的ASN.1模式元素都与XML模式元素相一致。B.2中更详细地描述了模式依赖关系。B.1.2使用必选数据字段的二进制编码示例用于步态静态图像序列的此数据示例结构与ISO/IEC39794-16数据结构和数据内容兼容。下面使用ASN.1表示法对其值进行形式化描述。valuelBodylmageDataBlock::={versionBlock{generation3,year2019representationBlocks{{representationId1}}图B.1显示了必选元素和底部DER十六进制视图。图B.1步态图像序列的ASN.1必选元素可以在/iso-iec/39794/-16/ed-1/en/检索示例编码。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021B.1.3使用JPEG图像序列元素的二进制编码示例第二个示例包含几个可选元素和一个空的imageRepresentation2DBlock。下面使用ASN.1中的值表示法形式化描述第二个示例值。{}month7,day24,minute47,}}{}month7,day24,minute47,GB/TXXXXX.17—202X/ISO/IEC39794—17:2021}}}}图B.2说明了此示例ASN.1JPEG图像序列元素和一些最常见输入字段的DER编码数据示例,其中显示了典型的占位符测试值作为示例。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图B.2ASN.1JPEG图像序列元素和DER编码数据示例可以在/iso-iec/39794/-17/ed-1/en/检索示例编码。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021B.1.4使用MPEG-4的二进制编码示例MPEG-4是数码摄像机中最常见的视频格式之一。以下示例显示了步态MPEG4ASN.1文件推荐的最小数据内容。valuelBodylmageDataBlock::={versionBlock{generation3,year2019representationBlocks{{representationId1,imageRepresentationBlockrepresentation:imageRepresentation2DBlock:{representationData2D‘00'H,captureDevice2DBlock{captureDeviceTechnologycode:videoFrameFromDigitalVideoCameraImageinformation2DBlock{ImageDataFormatcode:mpeg4,ImageKind2Dcode:gait2DcaptureDateTimeBlock{year2020,month8,hour12,minute51,second18,millisecond778}}}图B.3展示了此示例ASN.1MPEG-4视频图像序列元素和一些最常见输入字段的DER编码数据示例,其中显示了典型的占位符测试值作为示例。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图B.3MPEG-4ASN.1的分层显示示例可以在/iso-iec/39794/-17/ed-1/en/检索示例编码。B.2XML编码示例B.2.1通则编码示例中使用的身体图像数据块是ISO/IEC39794-16中定义的BodyImageDataBlock类型。所有的ASN.1模式元素都与XML模式元素相一致。本文件定义了用于步态图像序列数据的配置文件。所有元素均在ISO/IEC39794-16中定义。ISO/IEC39794-16中的ASN.1示例适用于本文件中单个图像的应用测试。图B.4说明了本文件中的步态配置文件和XSD依赖关系如何基于ISO/IEC39794-16元素定义,并与ISO/IEC39794-5和ISO/IEC39794-1XSD元素定义相关。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图B.4基于ISO/IEC39794-16XSD的步态配置文件和XSD依赖关系图B.5强调了XSD模块化结构如何基于ISO/IEC39794-16XSD定义的主要元素,并可用于本文件中定义的生物特征识别模态和应用配置文件。ISO/IEC39794-16XSD中定义的XSD模块化结构建议将任何运动JPEG步态图像序列处理为一组单独的JPEG图像,或将序列转换为单个MPEG-4文件。运动JPEG(M-JPEG或MJPEG,.MJPG或.MJPEG文件扩展名)是一种视频压缩格式,其中数字视频序列的每个视频帧或隔行扫描场都分别压缩为JPEG图像并存储在单个文件中。可以在/iso-iec/39794/-16/ed-1/en/检索包含图像数据编码的完整示例,可以在/iso-iec/39794/-17/ed-1/en/检索包含图像序列数据编码的完整示例。B.2.2使用必选数据字段的XML编码示例这种用于步态静态图像序列的数据示例结构与ISO/IEC39794-16数据结构和数据内容兼容。下面使用XML表示法形式化描述其值:<?xmlversion="1.0"encodinGB/TXXXXX.17—202X/ISO/IEC39794—17:2021<bim:bodyImageDataxmlns:cmn="/iso-iec/39794/-1"xmlns:fac="/iso-iec/39794/-5"xmlns:bim="/iso-iec/<cmn:generation>3</cmn:步态静态图像序列的数据示例结构与ISO/IEC39794-16的数据结构和数据内容兼容,图B.6中突出显示了必选的XML元素。GB/TXXXXX.17—202X/ISO/IEC39794—17:2021图B.6XML必选的序列结构B.2.3使用JPEG步态序列元素的XML编码示例静态图像序列的数据示例结构与ISO/IEC39794-16数据结构和数据内容兼容。使用XML表示法形式化描述其值如下:<?xmlversion="1.0"encodin<bim:bodyImageDataxmlns:cmn="/iso-iec/39794/-1"xmlns:fac="/iso-iec/39794/-5"mlns:bim="/iso-iec/39794/-<cmn:generation>3</cmn:<bim:imageRepresent<bim:imageRepresentat<bim:representationData2D>AA==</bim:representa</bim:imageInformat</bim:imageRepresentat</bim:imageRepresentGB/TXXXXX.17—202X/ISO/IEC39794—17:2021<cmn:millisecond>389</cmn:m<bim:imageRepresent<bim:imageRepresentat<bim:representationData2D>AA==</bim:representa</bim:imageInformat</bim:imageRepresentat</bim:imageRepresent<cmn:millisecond>790</cmn:m可以通过查看两个静态图像序列中最常用的元素,来查看ISO/IEC39794-16中XSD元素层次结构。图B.7显

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论