异常检测和监控系统_第1页
异常检测和监控系统_第2页
异常检测和监控系统_第3页
异常检测和监控系统_第4页
异常检测和监控系统_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

异常检测和监控系统美国5666157A摘要监控系统有至少一个主摄像机将真正的区域的图像转换成电子视频信号的第一级分辨率。该系统包括用于所在的区域内从所述至少一个摄像机输出的视频信号的个人或个人取样的动作。个人采样运动的视频信号被电子与运动这是表示有犯罪意图的人已知的特性比较。个人或个人的犯罪意图的电平,然后确定与一个适当的报警信号。说明本发明的技术领域本发明一般涉及监视系统,并且更具体地,涉及检测和特定异常的视频和音频输入信号作出响应可训练监控系统。发明背景现今的监控系统中的复杂性,效率和精度而变化。早期的监控系统使用多个闭路摄像机,每个连接到一个专门的监控。这种类型的系统的工作原理以及足够低的覆盖位点,即需要高达或许6摄像机的地方。在这样的系统中,一个人可以扫描6显示器,在“真实”时间,并有效地监控整个(尽管小)的保护区,将提供准备的一个相对高的水平,以向内所观察到的异常行为或情况响应保护区。在这个简单的监控系统,它是留给保安人员的自由裁量权来决定,第一,如果有正在进行中的任何异常事件的保护区域内,第二,关注的层面放在那个特定的事件,第三,什么应采取行动以响应特定事件。整个系统的可靠性取决于工人观察监视器的警觉性和效率。许多监控系统,但是,需要使用更多数量的摄像机(例如,超过六)向警方更大的区域,如至少每间客房设在一个大型博物馆。为了充分保证保护区内可靠和完整的监督,无论是更多的人员必须被用来不断地观察了额外要求的显示器(每台摄像机之一),或较少的显示器可以在一个简单的轮换计划使用其中显示器按序显示输出的图像的多台摄像机,显示每个相机的也许只有几秒钟的图像。在另一种现有技术的监视系统(简称为“四边形”系统),四个摄像机连接到单个显示器的屏幕连续和同时显示四个不同的图像。在“quaded四”现有的监控系统,16相机连接到一台监视器的屏幕上现在显示,连续和同时所有十六个不同的图像。这些改进流动人员少,以充分监督监测,以覆盖更大的保护区。这些改进,但是,仍然需要至少一个人的持续关注。上述multiple-image/single屏系统的分辨率差和复杂的视觉受到影响。整个系统的可靠性仍依赖的警觉性和安全人员看着监视器的效率。正在观看的显示器的人员仍背负着识别在监视器上的一个显示不正常行为或状态,确定哪一个摄像头,并且该保护区的相应的区是记录了异常的情况下,确定关注的水平放置在特定事件,最后,当确定必须采取的响应特定事件相应的操作。最终,人们认识到人类的人员不能可靠地监测“实时”影像从一个或几个相机的时间长“手表”的时期。这是很自然的,任何人要成为无聊而进行单调的任务,如在一个或几个连续监测凝望,等待着一些不寻常或异常发生时,一些东西,可能永远不会发生。如上面所讨论的,它是这降低了整个监控系统的整体可靠性人类链路。美国专利号4737847授予Araki等。公开了一种改进的异常的监视系统,其中运动传感器被定位在保护区域内,首先确定感兴趣的地方,例如入侵者的物体的存在。在该系统由美国专利中披露。4737847号,并在规定的“警告级别”区域被保护区域内定义。这取决于这些区域中的物体或人在检测到的,移动到和时间的长度所检测的物体或人保持在一个特定的区域中确定物体或进入该区域的人是否应该被认为是一个异常事件或威胁。在美国专利中公开的监视系统。4737847号并删除一些监察的责任,否则放在人类的人员;然而,这样的系统可以通过他的存在相对于特定区域只确定入侵者的“意图”。入侵者的实际动作和声音都没有测量或观察到。一个熟练的犯罪分子可以很容易地确定明显的区域的警告级别的受保护区域内,并采取相应的行动;花一点时间在区具有高警戒水位,例如。因此,它是本发明的一个目的是提供一种监视系统,该系统克服了现有技术中的问题。它是本发明的目的是提供这样一种监测系统,其中潜在的异常事件是由一个计算机之前召唤人类监督员确定的另一个目的。本发明提供一种监测系统,比较特定人士或特定的测量运动与训练的,预定的一套碘型”的运动,以确定犯罪或恶作剧事件的级别和类型的另一个对象。它是本发明的另一个目的是提供一种监视系统,传送来自各种传感器的数据,以在那里它可以被记录,以作为证据的位置。它是本发明的目的是提供这样的一种监视系统,该系统是可操作日日夜夜的另一个目的。它是本发明的另一个目的是提供一种监视系统,该系统可以剔除出实时事件这表明犯罪意图使用武器,通过解决武器相对的低温,以较高的体温,通过识别所采取的姿态人与武器。这又是本发明的另一个目的是提供一种监视系统,可消除或减少目前需要确定异常事件的电视显示器和守卫的数量,因为这个系统将在接近实时执行此功能。发明内容在本文所公开的本发明的优选实施例包括具有至少一个主摄像机用于转换的区域的真实图像转换成电子视频信号,在分辨率中的第一级的监视系统和装置,用于从摄像机输出的视频区域内的采样动作。这些元素相结合,与用于电子比较采样的运动与运动这是指示从事犯罪活动,并用于确定这种犯罪活动的个人水平的已知特征。与其相关联的装置,用于激活至少一个次级检测器,并具有分辨率更高的第二级相关联的记录装置,所述起动装置响应于确定犯罪活动的预定电平之中。具体实施方式的详细描述参照图如图1所示,图像输入装置10,可以是包括一个光导摄象管和中等分辨率的CCD/电视摄像机,例如,约11/2英寸,一个相机的任何常规的电子图像拾取设备的红外或可见光谱中的操作(或两者)长度约1英寸,直径,重量约3盎司,包括特定部署的变焦透镜安装。此装置适用于连续操作,并在第一观察区域进入常规视频电子信号内翻译的视图(“真实的”)图像的字段。另外,高速率摄/录,高达300帧/看(类似于那些由伍德兰希尔斯,加利福尼亚州,索尼和其他NAC视觉系统制造)可作为图像输入装置10。这将使检测身体部位是指示性犯罪意图,即使是非常迅速的运动,他们的记录,如下文所述。比较常用的相机以每秒30帧,并不能提供足够的分辨率捕获如此快速的全身运动。图象输入装置10,而不是连续操作,也可以由一个“警报”信号从低分辨率摄像机的处理器或来自音频/字识别处理器检测到可疑事件时激活。图象输入装置10包含一个预处理程序它规格化了广泛的照度水平,尤其是对于外观察。预处理器模拟一个脊椎动物的视网膜上,其具有高效率和准确的归一化处理。一个这样的预处理器(VLSI视网膜芯片)是由加州技术研究所加利福尼亚州帕萨迪纳使用这个特殊的预处理器芯片的卡弗•米德实验室制造会增加本发明的自动视觉能力变化时光照强度和光反射可否则削弱图像分辨率。表示从图像输入信号10顷转换成数字化的信号,然后发送到图像处理装置12,处理器装置控制每个组摄像机将通过人工智能系统,基于动态模式识别原则处理,将进一步描述下文。图像处理装置12包括一个图像分析器光栅,有效地细分每个图像以隔离每对人。图像处理的图像栅格分析子系统是指12段,每段采样图像识别和隔离每对物体(或人),并且每个“二对一”组的三个人分开。在“二对一”分组代表共同抢劫的情况,其中两个人接近一个受害者,一个来自于受害者和其他前面从后面。向前抢劫犯告诉潜在的受害者,如果他不放弃他的钱,(或手表,戒指等),第二抢劫犯会拍他,刺或以其他方式伤害他。本组有三人将因此被认为是一个进展中的潜在犯罪,因此将被分割和图像处理方法进行分析。对于变焦镜头系统中的图片元素有用的输入装置10,变焦镜头子系统的要领编写由L.莫茨和L.伯格斯坦三篇论文,在文章中标题为“变焦镜头系统”中描述美国,卷光学学会杂志。52,四月,1992,这篇文章在此通过引用并入。变焦系统的本质是,以改变焦距,使得被观察的物体将被聚焦和放大在其像平面。在自动版本变焦系统,一旦一个目的是在相机的视场的视场(FOV),透镜移动到对象聚焦在摄像机的图像平面上。由CCD阵列产生的,用于由所述图像平面,以校正聚焦误差信号分为两半,并测量差异,在每个分段,直到该对象是在中心。划分CCD阵列成两个以上的段,说四个象限,是一种能够实现自动定心,这与单脉冲雷达的情况下。无论段的数目时,误差信号被用于产生对象的期望的跟踪。在宽视场中(WFOV)的操作,可能会有一个以上的对象,因而特别注意了变焦系统的设计和其相关联的软件和固件的控制。假设三个对象,由于是“二对一”上述潜在威胁抢劫,那三个人都在一个平面上,可以编写一个转移从一个对象到下,从一个面到另一个面,在规定的顺序排列。另外,作为对象的WFOV内移动它们会被自动跟踪的方位角和仰角。原则上,变焦将集中最接近的物体上,假设光的每个对象上的安装是相同的,使得从闭合开始的规定序列对象将进行从剩余的对象,例如,从右到左。然而,当这三个对象都位于不同的平面上,但仍然在相机的WFOV内,变焦,从图像分析的分割子系统的输入装置12将集中的最接近像平面的右侧的对象上,然后继续将焦点移动到左边,着眼于下一个对象,并在接下来的顺序。在上述所有情况下,自动变焦可以更自然地选择在家中的人与最明亮的发射或反射,然后继续下一个亮度等等。这将是一个强度/时间选择多路变焦系统的一种形式。输入相机相对于被监视的区域的相对定位将影响精度由该图像分析器光栅段的每个图像。在本实施例中,有利于对输入摄像机从位于正上方的点监视查看的区域,例如,与输入摄像头安装在高墙上,实用塔,或者一个红绿灯支撑塔架。输入摄像机的高度最好是足够的,以尽量减少输入摄像机和监视的个体的移动之间闭塞。一旦每个采样视频帧中的对象进行分割(即,检测和隔离的),分析是由位于各图像的每一个特定的段中的每个对象的详细的动作,以及它们相对于其他对象的相对运动。每个图像帧段,一旦数字化,通过图像的帧存储器的存储处理装置12存储在帧。从图像输入每个帧单元10从已经存储在处理的前一帧中减去装置12使用任何常规的差分处理。涉及多个差分步骤的差分过程发生在该处理部分12。各图像所得到的差值信号(从装置12的差分的子单元输出)指示所有已发生从一帧到下一帧的变更。这些变化包括位于该段内的个人和他们的四肢,如武器的任何变动的任何动作。参照图3,差分信号对图像的后续采样帧的每个移动对象(称为“轨道”)的集合,使得每个参与运动的类型,速度和方向(向量)的测定,处理,将提取的加速度,即,注意变化速度的:和加速度变化相对于时间(称为“抽筋”),并与已知的物理犯罪行为存储关联的签名本。例如,后续的差分信号可以揭示一个人的手臂被移动到一个很高的位置,如手臂的运动的上限,也就是说,在他头顶)以较快的速度。这种特殊的运动可以被感知,如下所述,作为一种敌对的运动与需要保安人员的专家分析可能的犯罪活动。的两个轨迹的交点表示两个移动物体的交点。相交的对象,在这种情况下,可能仅仅是两只手的两个人相互问候,或根据其他特征,如下面描述的,交叉的对象可以被解释为一个攻击者在接触受害者的面部的拳头一个不太友好的问候。在任何情况下,两个轨道的交叉点立即需要进一步分析和/或安全人员的召唤。但报警的生成,打击和位置,例如,在监视器上的声音设备将打开一个后卫的注意力只到显示器,因此节省劳动力。一般来说然而,个人之间的友好交往是一个慢得多的物理过程比物理攻击VIS-A-VIS身体部位有关人士的。因此,友好的交互可以容易地从基于实验的参考数据使用目前的低通和高通滤波器敌对物理行为,目前的模式识别技术区别开来。当被分配了大量的传感器(称为传感器套件)在大量的设施,例如,一些自动取款机(自动取款机),特别银行分行及在特定状态或状态相关联,并在所有的操作单一银行网络控制,那么只有一个显示器是必需的。市售的软件工具,可以提高帧之间的物体运动分析(称为光流计算)。与光流计算,具体的(通常是亮的)反射元件,被称为farkles,从一帧的一个人的服装和/或身体部位发射的是减去前一帧。亮部将固有提供更清晰的细节,因此将产生有关的相对移动物体的速度的更精确的数据。额外的计算,如下所述,将提供有关的加速度数据,甚至在加速各运动部件的采样或“急动改变。参与相互作用的个人的身体运动,将通过首先确定的成像每个人的边缘来检测。和身体各部位的运动便会通过注意身体各部位参与相互作用的个体的边缘的运动进行观察。在差分过程将使速度和加速度以及这些身体部位的加速率的测定。现在处理过的信号被发送到比较装置14,其对从图像输入的视频信号的选定的火焰装置10与存储在存储器16中的“签名”的视频信号。签名信号代表的各种位置和身体端口变动有不同程度的犯罪意图的人。该方法用于获得这些签名的视频信号的数据的基础上按照本发明的另一个方面在下文中更详细地描述。如果比较是正与一个签名的视频信号的一个或多个,输出“警报”信号是从发送的比较装置14到控制器18,控制器18控制的一个次要的,高分辨率图象输入装置(操作视频摄像头)20和常规的监视器22和录像机24。视辅助摄像机20的字段是优选最多,相同的视图中的主摄像机10的视场,测量的第二观察区域。录音机5月24日在法院办公室或法律设施,以防止不利的资料的损失,由于篡改设在现场和/或在两个执法机构(未显示),并同时进行。辅助摄像机20的目的是提供一种具有假定犯罪意图的个体的详细的视频信号,并且还提高假阳性和假阴性的性能。这个信息被记录在视频记录器24和一个监视器22上显示出来。的警钟或光(未示出)或两者可被从控制器20提供并通过一个输出信号被激活到召唤主管立即查看相关的视频图像显示进行中的明显犯罪并访问其准确性。在本发明又一实施例中,一个录像机26的连续操作(使用6小时的环带,例如)。录像机26正在由录像机控制器28控制。直接从图像输入所有的“实时”影像装置10被立即记录并存储为至少6小时,例如。一旦确定了犯罪的过程中,从控制器18的信号被发送到VCR控制器28改变拍摄模式从磁带的循环模式,以非循环模式。一旦录像机26变为非循环模式下,磁带将不会重新循环,因此将保留被调查网站的或许重要记录的视频信息,包括犯罪本身,并导致对犯罪的事件。当启动非循环模式下,视频信号也可以被发送到位于别处录像机;例如,在一个执法机构,并同时向法院及其相关办事处的其他安全地点。前的视频信号与存储在存储器中的“签名”信号被比较,每个视频帧采样是“分段”成份与检测在其中的物体。到段的视频信号,从光导摄象管或CCD/电视摄象机所产生的视频信号的一个图像光栅分析仪进行分析。虽然这个过程会导致轻微的信号延迟,它是完成近实时的。在某些位点,或在某些情况下,一个高分辨率照相机可以不要求或以其它方式使用。例如,通过一个相对简单和低成本的相机所提供的分辨率可能是足够的。根据安全的特定位置被调查,并且一天中的时间的水平,分析帧之间的帧间隔的长度可以变化。例如,在高风险区域,从CCD/电视相机每帧可以连续地进行分析,以确保信息的最大量之前和犯罪的过程中记录。在低风险区域,它可能是优选的,以或许采样来自每个摄像机每隔10个帧,顺序。如果,这样的采样过程中,确定异常或可疑的事件发生,比如两个人走的很近对方,那么系统将其中系统中的可疑变为“关注和好奇的”激活警报模式动作和采样率提高到也许每5帧或什至每一帧。如更详细地描述如下,这取决于系统的采用(例如:视频只,仅音频或两者),在这样的一个警告模式的类型,整个系统可被激活,其中音频和视频系统开始进行采样的环境足够的信息来确定行动的意图。参照图2,特定的摄像机输出的若干帧被示为示出了根据本发明所执行的分割处理。系统开始在帧K到采样和确定有四个对象(先前确定的给定人,如下文所述),公元位于被治安的特定区域内。由于没有什么不寻常的是从最初的分析确定后,系统不能保证一个“警戒”状态。人A,B和D是根据正常的,非犯罪意图移动,因为可以观察到。一个犯罪的可能性时表示帧k+10至K13顷由差分处理分析。如果身体部位的运动表示速度,加速度和“抽筋”,与存储的数字信号描绘已知的犯罪人身攻击的动作比较积极的,它很可能是一个犯罪过程中在这里。此外,如果一个高速起飞时表示某丙远离某乙,如帧表示K15至K+17,信心较大的水平,是实现在决定一个实体的犯罪行为已经发生或即将。会产生警报的任何一个以上的条件成立的时刻。该报警条件将导致发送的警察或警卫到犯罪现场,启动高解析度CCD/电视镜头记录下犯殴打人的脸,一个响亮的扬声器被自动激活,打一个录音通知警告肇事者的他的行动严重性现在正在开展,并要求他停止了犯罪行为。天黑后一个强烈的光线会自动开启。自动响应将被致动的时刻报警条件是由处理器决定的。此外,报警信号发送到派出所,以及事件的相同的视频信号传输到由法庭委任的数据收集办公室,公设辩护人办公室以及地区检察官办公室。如上述那样,有必要比较所得的身体部位的运动涉及的物理犯罪行为签名,这是由特定的运动特性(即,速度,加速度,加速度的变化),用一组的签名文件表示身体的犯罪行为,其中身体部位的运动都参与活动。这个比较中,通常被称为模式匹配,是模式识别过程的一部分。身体的犯罪行为,其中涉及身体部位的运动,如手,臂,肘,肩,头,躯干,腿和脚文件,可以进行审查,以确定这种模式。此外,优先级可以通过实验和物理犯罪行为从模拟是由专业演员颁布的“戏剧”云集设置,从谁已经被警察抓到,以及谁已经报道的细节受害者遭遇歹徒收集的数据他们的经验将帮助演员进行准确的。视频其涉及这些模拟行为运动的可被存储在数字化的形式,并为每个所涉及的身体部位的运动签名准备文件,在物理模拟的犯罪行为。在另一个实施方案中,上述异常检测系统包括RF-ID(射频识别)标签或卡片,以协助视图的摄像机的视野内的个体的检测和跟踪。这种卡或标签可用于经授权的个人,当由射频读写器查询作出回应。从而能够有充分的视频传感器中登记的标签的传播模式的响应信号。该卡片或标签,当检测到视频,那么可以断定,友好和认可。这些信息将简化分割过程。连接到每个RF-ID卡光将被打开,当询问信号的积极响应成立。的光将出现在计算机生成的网格(在监视器的屏幕上也)与磁道明确表示的相交处,随后通过物理相互作用。但也注意到将是标记和未标记个体之间的交叉点。在所有的这些情况下,分割过程会更简单。还有的RF-ID卡和读写器的厂家很多,三个主要的是,普林斯顿,新泽西州,达拉斯的AMTECH,得克萨斯州和爱达荷州博伊西市的美光科技的大卫Samoff研究中心。本发明的应用包括银行,自动取款机,宾馆,学校,宿舍,宿舍,办公室及住宅楼宇,医院,人行道,马路旁,公园,集装箱和集装箱装卸区,航运码头,火车站,卡车装载站,机场客运及货运设施,公交车站,地铁站,剧院,音乐厅,体育场馆,图书馆,教堂,博物馆,专卖店,商场,餐厅,便利店,酒吧,咖啡厅加油站,高速公路休息站,隧道,桥梁,闸道,高速公路,收费站,仓库,油库和,工厂和装配室,执法设施,包括监狱的部分。任何地点或设施,民用或军用,要求安全性将是一个可能的应用。本发明的进一步应用在移动平台:汽车,卡车,公交车,地铁车厢,火车车厢,无论是货运和客运,船,船舶(客运和货运),油轮,服务及工程车辆,并越野,容器和其载体,以及飞机,也等效于军事和敏感的移动平台。作为一个威慑到轿厢顶一个微小的CCD/TV摄像机隐藏在天花板或汽车的后视镜,并且通过一个销孔透镜来驾驶席集中,可能被连接到视频处理器来记录的脸部驱动。相机由自动单词识别处理器,将确定的众所周知的表达式通常使用的汽车jacker触发。视频画面将在车上被记录下来,然后通过手机发送。如果没有手机,汽车jacker面对的视频短片录制将被保持,直到车被警方发现,但现在在手的证据(在汽车jacker的图片)。在目前的监控系统,保安人员驻守监视器警告只对在规定的观察区域显示可疑行为(犯罪行为)的视频图像。因此,保安人员用于访问罪的准确性,并确定适当的响应必要的行动。通过使用计算机来有效地过滤掉从观察区域的所有正常和非刑事的视频信号,更少的保安人员被要求调查和“安全”更大的总面积(包括更多数量的观察区,即,相机)。还可以设想的是,本系统可以应用于辅助盲人“看”。电池供电的便携式版本的视频系统将自动识别的视图和语音合成的领域中已知的对象会“说”的对象。例如,“椅子”,“桌子"等将显示一个椅子的存在和一个表格。取决于要进行监管的区域,优选的是至少两个,也许三个摄像机(或视频传感器)被同时用于覆盖的区域。如果一个摄像头感刑事诉讼第一级,其他两个可以被操纵,以提供行动的三维视角覆盖。在对所监管区域的物理相互作用的三维图像将允许观察更多数量的与步骤相关的详细信息:搭话,威胁,殴打,反应和后的反应。从二维图像转换过程的三维图像是通过使用已知的Radon变换的实现。在本发明中,作为人身威胁和袭击的受害者,也是独立扬声器(男,女不同年龄组)和方言独立的单词和简短的句子运动特性的物理变化的详细信息,相应的扩展操作阶段反应,将启用自动识别罪犯的攻击,没有后卫,他需要的,除非需要通过法规及其他外部要求。在本发明另一实施例中,两个视频与声频信息进行采样,并进行分析。声学信息进行采样,并进行分析以类似的方式对上述视频信息的取样和分析。音频信息进行采样和分析,在图中所示的方式。4,和基于现有技术。音频话音频带的工作,而其相关联的自动语音识别(ASR)的系统中,不仅会降低从视频分析产生的误报率,但也可以用来触发视频和其他传感器,如果声音威胁早所观察到的威胁。参照图如图4所示,传统的自动识别系统如图所示,它包括输入的麦克风系统40,分析子系统42,一个模板子系统44,模式比较器46,和一个后处理器和决策逻辑子系统48。在操作中,在激活时,声学/音频监管系统将开始采样所有附近的声信号的(或所选择的部分)。的声信号将包括语音和背景噪声。背景噪声信号通常是已知的和可预测的,并且因此可以容易地过滤掉用常规的滤波技术。其中预期噪声信号不熟悉演说,汽车相关的声音,鸣喇叭,警报器,风和/或下雨的声音。麦克风输入系统40拾取的声音信号,并立即过滤出可预测的背景噪声信号,并放大其余辨认声信号。过滤后的声信号在分析子系统42,它由数字和频谱分析技术来处理这些信号进行分析。分析子系统的输出进行比较的图案comparater子系统46与存储在存储器44中选择预定的词。后处理和决策逻辑子系统48产生一个报警信号,如下所述。这些模板44或许包括约100简短和容易识别的简洁表达,其中有些是简单的词,和常用的那些意图犯罪行为。由一个罪犯之前,一个抢劫的受害者口语常用词组的一些例子,例如,包括:“给我你的钱”,“这是一个棒了”,“给我你的钱包,你会不会受伤“。。。等。此外,在这样的抢劫常用的答复从一个典型的受害者也可以存储为模板的话,如“帮助”,以及某些声音,如尖叫,尖叫声和呻吟声,等。具体的Word模板,从中填写会员声学声音相比,一定要慎重选择,考虑到个别客户特殊的口音和口语在关注的区域语言的俚语。因此,必须使用每个单词的频谱内容的统计平均。在图中所示的单词识别系统的输出。4被用作触发信号,启动声音记录器,或在本发明其他地方使用的照相机,如下所述。在麦克风输入子系统40使用的首选麦克风是一个镜头,枪式话筒,如购自森海塞尔公司德国法兰克福。这些麦克风具有超心形的传播模式。然而,该模式的增益可能太小,对于高流量区域,因此可能需要一个以上的传声器阵列的配置中,以充分聚焦和跟踪的这些区域。麦克风系统的传播模式可以更好地专注于一个移动的声源(如,一个人走路和说话)。常规的定向麦克风也可代替一杆枪型麦克风的使用,如由索尼公司东京,日本制造。这样的定向麦克风将实现类似的增益,以散粒枪型麦克风,但是具有更小的物理结构。一个反馈环电路(未具体示出)原产于后处理子系统48将指示麦克风系统由视频摄像机所调查的区域内跟踪声音的特定动态源。由本发明的视频部分的重写信号将激活并直接向视摄像机的视场方向上的麦克风系统。换句话说,如果视频系统检测潜在的犯罪行为时,视频系统将控制对所关注场景的音频记录系统。同样地,如果音频系统检测进取性的话,如上所述,该音频系统会指示相应的视频摄像机,以在视觉上覆盖并记录声音的视在源。许多公司已经开发出相当准确快捷的,基于隐马尔可夫模型(HMM)与人工神经网络(ANN)相结合独立扬声器字识别系统。这些公司包括纽约Armonk,AT&T贝尔实验室,剑桥,马萨诸塞州和Lernout比利时和Hauspie的Kurtzwell的IBM公司。简单地说,HMM模型应用于文字识别概率统计方法。在培养步骤中,估计是由每个字的概率模型,例如,那些被认为有可能在一个相互作用被说出的字的装置和协方差。其中任一给定单词的发音的各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论