智能信息感知技术 课件 第7、8章 智能语音传感技术、智能医学传感技术_第1页
智能信息感知技术 课件 第7、8章 智能语音传感技术、智能医学传感技术_第2页
智能信息感知技术 课件 第7、8章 智能语音传感技术、智能医学传感技术_第3页
智能信息感知技术 课件 第7、8章 智能语音传感技术、智能医学传感技术_第4页
智能信息感知技术 课件 第7、8章 智能语音传感技术、智能医学传感技术_第5页
已阅读5页,还剩175页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能传感技术——第七章

智能语音传感技术目 录27.1

智能语音传感技术基础常见的智能语音传感技术智能语音数据处理技术智能语音传感技术典型应用7.1

智能语音传感技术基础7.1.1

传统语音传感器技术声音是空气或其他介质的波动,是物体的撞击、摩擦、运动产生的振动以波的形式向外传播的。根据物体振动所产生波的频率高低,分为声波和超声波。超声波20k

Hz声波3声音传感器是一种可以检测、测量并显示声音波形的传感器。7.1

智能语音传感技术基础7.1.1

传统语音传感器技术声音传感器(话筒、麦克风),根据声波引起的物体振动(比如振动膜)将其转化为电信号,从而实现声波的检测。纯压力式话筒速率式话简混合式话筒全方向性(振动膜两侧开放)一定方向性(振动膜单侧开放)结构分类47.1

智能语音传感技术基础7.1.1

传统语音传感器技术常用声音传感器原理介绍变磁阻式话筒5声波使振动膜发生振动,导致衔铁在两磁极之间运动,衔铁的运动将改变回路中的磁通,从而使磁铁上缠绕的线圈产生感应电压。如果气隙和衔铁的形状设计合理,则输出感应电压具有很好的线性特性。7.1

智能语音传感技术基础7.1.1

传统语音传感器技术动圈式话筒动圈式话筒是一种更加专业的话筒,它将振动膜和线圈整合在一条窄金属条中,并放置在卡形磁铁的两个磁极之间。其输出电压和阻抗都很低,一般这种话筒都内建变压器或前置放大器。动圈式话简具有很好的方向性,广泛应用于嘈杂场合的广播系统中67.1

智能语音传感技术基础7.1.1

传统语音传感器技术驻极体话筒驻极体话筒是一种电容式声音传感器。驻极体相当于永磁体,其中存在永久的静电荷。话筒主要由一块驻极体材料(一侧镀金属膜用于连接引线)和单独的振动膜构成。驻极体话筒具有体积小、结构简单、电声性能好、价格低的特点,广泛用于盒式录音机、无线话筒及声控等电路中。77.1

智能语音传感技术基础87.1.1

传统语音传感器技术压电陶瓷片话筒压电陶瓷片话筒是利用压电陶瓷作为压力敏感元件,进行压电转换,实现对声波振动的感知。压电陶瓷是一种人工合成材料,收到外界压力时可以在两面产生电荷,电荷量与压力成正比。压电陶瓷片的压电效应是可逆流的,在压电陶瓷片上多加一个交变的电场,陶瓷片就会时而变薄时而加厚,还会产生振动以及发射声波(压电陶瓷蜂鸣器)。7.1

智能语音传感技术基础7.1.1

传统语音传感器技术硅微传声器(MEMS)微机电系统(MEMS,

Micro-Electro-Mechanical

System)MEMS麦克风是利用硅薄膜来检测声压的,MEMS麦克风能够在芯片上集成一个模数转换器,形成具有数字输出的麦克风。MEMS麦克风具有半导体产品的种种优点,最为重要的一个特性是,MEMS麦克风容易实现数字化,从而削除了传输噪音。目前主要应用在手机中,

数码相机、MP3播放器和PDA、耳机和助听器等领域也正在从驻极体式麦克风向MEMS过渡。97.1

智能语音传感技术基础7.1.1

传统语音传感器技术主要技术指标声音传感器的技术指标主要包括:灵敏度、频率响应、动态范围、指向性、重复性和何尺寸等。驻极体声音传感器的灵敏度有自由场灵敏度、声压灵敏度和扩散场灵敏度之分。(1)自由场灵敏度是声音传感器输出端的开路电压和置人前所在处的自由声场声压之比。(2)声压灵敏度采用的是作用在声音传感器膜片上的实际电压,同一个声音传感器,声压灵敏度小于自由场灵敏度,且在高频时下降明显。(3)扩散场灵敏度则是指声音传感器受到来自各不同方向,无规则场声压的均匀激励,其输出与声音传感器所处的方位无关。107.1

智能语音传感技术基础7.1.2

智能语音传感技术智能语音传感技术系统在传统的声音传感器的基础上加入智能语音处理的相关技术,实现的功能不仅仅是将语音捕捉下来,而是感知到语音中包含的有用信息并将其应用于实际问题。117.1

智能语音传感技术基础7.1.2

智能语音传感技术127.1

智能语音传感技术基础137.1.2

智能语音传感技术(1)语音信号采集:通过声音传感器捕获语音信号,输入后端的处理器中。此时,获得的语音信号为模拟信号,需要在下一阶段进行必要的处理,才能进行进一步的智能分析。(2)语音预处理:初步获取的语音信号是连续的时序信号,其中可能包括采集过程中引入的噪声,并且连续信号不方便我们进行后续的数字化处理过程。因此,在智能语音分析之前必须对采集的语音信号进行预处理步骤,其中主要包含:预加重处理、加窗分帧处理、端点检测等。7.1

智能语音传感技术基础7.1.2

智能语音传感技术预加重处理

:信号传输线表现出来的是低通滤波特性,传输过程中信号的高频成分衰减大,低频成分衰减少。预加重技术的思想就是在传输线的始端增强信号的高频成分,以补偿高频分量在传输过程中的过大衰减。我们知道,信号频率的高低主要是由信号电平变化的速度决定的,所以信号的高频分量主要出现在信号的上升沿和下降沿处,预加重技术就是增强信号上升沿和下降沿处的幅度。为了消除发声过程中,声带和嘴唇造成的效应,来补偿语音信号受到发音系统所压抑的高频部分,并且能凸显高频的共振峰。预加重处理一般通过加高通滤波实现。147.1

智能语音传感技术基础157.1.2

智能语音传感技术加窗分帧:傅里叶变换要求输入的信号是平稳的,语音信号在宏观上是不平稳的,在微观上是平稳的,这就可以把语音信号分为一些短段来进行处理,每一个短段称为一帧。分帧可通过可移动的有限长度窗口进行加权的方法实现。每一个短时语音帧看成平稳的随机信号,利用数字信号处理技术来提取语音特征参数。在进行处理时,按帧从数据区中取出数据,处理完成后再取下一帧,最后得到由每一帧参数组成的语音特征参数的时间序列。7.1

智能语音传感技术基础167.1.2

智能语音传感技术不同的窗函数在频域的响应的不同对导致处理信号频谱时也不近相同,常用的有矩形窗、汉明窗、汉宁窗等。窗函数的选择会对语音信号的频谱的泄露产生不同的影响,也会对后面的特征提取的参数的保真性有很大影响。选择的窗函数尽可能满足减少语音信号的频谱侧漏,而频谱的泄漏取决于窗函数频谱两侧主瓣和旁瓣。7.1

智能语音传感技术基础7.1.2

智能语音传感技术端点检测(语音活动检测)

:一段语音信号可以分为无声段(包含背景噪声)和语音段(包含清音和浊音)。端点检测的目的是检测出一段语音信号的起点和终点,去掉静音的部分,去掉噪声的部分,找到一段语音真正有效的内容。177.1

智能语音传感技术基础187.1.2

智能语音传感技术基于阈值的方法:通过提取时域(短时能量、短期过零率等)或频域(MFCC、谱熵等)特征,通过合理的设置门限,达到区分语音和非语音的目的。

端点检测,

也叫语音活动检测,

Voice

ActivityDetection,这是传统的

VAD

方法VAD,它的目的是对语音和非语音的区域进行区分。通俗来理解,端点检测就是为了从带有噪声的语音中准确的定位出语音的开始点,和结束点,去掉静音的部分,去掉噪声的部分。7.1

智能语音传感技术基础197.1.2

智能语音传感技术基于分类模型的方法:可以将语音检测视作语音/非语音的两分类问题,进而用机器学习的方法训练分类器,达到检测语音的目的。基于声学模型的方法:可以利用一个完整的声学模型(建模单元的粒度可以很粗),在解码的基础,通过全局信息,判别语音段和非语音段。7.1

智能语音传感技术基础7.1.2

智能语音传感技术语音增强:较强的噪声会严重影响语音信号的质量,对语音信号的特征提取带来较大误差,所以在预处理阶段会对语音信号进行增强。常用方法有谱减法、维纳滤波法、小波去噪法、子空间法等。207.1

智能语音传感技术基础217.1.2

智能语音传感技术语音增强:谱减法顾名思义,谱减法,就是用带噪信号的频谱减去噪声信号的频谱。谱减法基于一个简单的假设:假设语音中的噪声只有加性噪声,只要将带噪语音谱减去噪声谱,就可以得到纯净语音,这么做的前提是噪声信号是平稳的或者缓慢变化的。提出这个假设就是基于短时谱(25ms),就是频谱在短时间内是平稳不变的。维纳滤波法Wiener滤波是第二次世界大战中,为了解决火力控制系统精确跟踪问题,Wiener相继提出了平稳随机过程的最优线性滤波理论,首次将数理统计知识和线性系统理论联系起来,形成了对随机信号作平滑,滤波和预测的最新估计理论。在此后的发展中,Wiener滤波被应用于更多的领域,并沿用至今。7.1

智能语音传感技术基础7.1.2

智能语音传感技术语音增强:小波去噪法在数学上,小波去噪问题的本质是一个函数逼近问题,即如何在由小波母函数伸缩和平移版本所展成的函数空间中,根据提出的衡量准则,寻找对原信号的最佳逼近,以完成原信号和噪声信号的区分。

也就是寻找从实际信号空间到小波函数空间的最佳映射,以便得到原信号的最佳恢复。从信号学的角度看,小波去噪是一个信号滤波的问题,而且尽管在很大程度上小波去噪可以看成是低通滤波,但是由于在去噪后还能成功地保留信号特征,所以在这一点上又优于传统的低通滤波器。由此可见,小波去噪实际上是特征提取和低通滤波功能的综合,其流程框图如图所示。227.1

智能语音传感技术基础237.1.2

智能语音传感技术语音增强:子空间法子空间法是先对每个麦克风阵元的信号使用单通道子空间或利用输入信号的相关矩阵子空间构建信号子空间,然后采用固定波束形成或自适应波束形成实现语音增强。这种算法分别由Hansen和Asano于1997年提出,并在之后的几年里被其他学者不断完善,比如Doclo等提出的基于广义奇异值分解的波束形成法。 子空间法最大的缺点是计算复杂度太大,难于实时应用于数字信号处理。7.1

智能语音传感技术基础247.1.2

智能语音传感技术(3)智能语音分析:广义上来讲智能语音技术有各种各样的定义,一般来说有语音识别、声纹识别、语音合成和智能翻译等。语音识别:通过特征提取得到的声学模型,在搜索空间中与词典或语言模型进行匹配。声纹识别:通过声音来做对人的识别和认证,应用于需要人的发声媒介来控制命令的场景。语音合成:把文字转化成拟人化的声音,完成人机语音交互的闭环,满足多种场景对不同声音的需求。智能翻译:通过分析句子语法和结构,以及单词和词组进行翻译工作。7.1

智能语音传感技术基础7.1.2

智能语音传感技术(4)系统输出: 将结果输出到各个应用终端,来实现诸多功能。257.2

常见的智能语音传感技术267.2.1

智能语音问答系统智能语音问答系统综合运用了知识表示、信息检索、自然语言处理等技术。智能语音问答系统能够使用户以自然语言提问的形式而不是关键词的组合,提出信息查询需求,系统依据对问题进行分析,从各种数据资源中自动找出准确的答案

这里加入概述性的描述性文字(总述功能及应用)从系统功能上讲,智能语音问答系统分为开放域自动问答和限定域自动问答。7.2

常见的智能语音传感技术7.2.1

智能语音问答系统智能语音问答系统总体架构277.2

常见的智能语音传感技术7.2.1

智能语音问答系统语音识别功能模块构建流程287.2

常见的智能语音传感技术系统终端7.2.1

智能语音问答系统语义理解功能模块构建方法语义理解主要提供一种问答句式解析功能,能够将语音识别模块生成的文本信息与语义模板进行匹配,得到使用者关心的重要信息。语义模型语义标注+语义预测系统终端语义PK语义信息关键词及类型297.2

常见的智能语音传感技术关键词信息关键词类型数据库界面展示实体关键词实体关键词7.2.1

智能语音问答系统关键词检索功能模块构建方法关键词检索功能主要是将从语义理解模块获得的关键词信息及其类型对应到具体的实体及其关系的名称,并与对应的实体模型相匹配,最后到数据库中查询并展示相应的信息。307.2

常见的智能语音传感技术7.2.2

智能语音情感分析系统智能语音情感分析是人机交互中的重要研究领域,能使机器理解人类的情感状态,增强人机交互过程中的准确性及舒适性。如何理解语音中的情感因素?如何通过语音表达不同情感?317.2

常见的智能语音传感技术327.2.2

智能语音情感分析系统智能语音情感分析方法类别直接利用语音特征进行情感分析常用语音特征包括能量、音高、过零率、共振峰、语谱图、梅尔倒谱系数等。将语音转换为文本进行情感分析语音+文本进行情感分析7.2

常见的智能语音传感技术7.2.2

智能语音情感分析系统(1)建立情感分析语料库(问题导向)(2)基于情感分析语料库训练模型(svm、神经网络、统计模型、决策树等)(3)

利用模型对语音数据进行情感分析语音资料数据清洗语音情感特征提取文本情感特征提取语音文本转换情感分类模型情感分析结果337.2

常见的智能语音传感技术347.2.2

智能语音情感分析系统智能语音情感分析系统“青鸾”——中国移动“青鸾”系统基于海量热线语音数据进行智能情感分析,输出关键标签和结构化情感分类,生成个性化语音理解分析报告,提供语音结构化检索、情感语义理解、认知方案生成、业务运营决策辅助等能力,面向分析、推荐、维系、预测四大类场景进行应用,并通过数据可视化运营分析界面方式进行展示。精益运营潜在客户挖掘、推荐解释感知监控面向无线和家宽场景,实现智能评测预警和效果跟踪主要实现功能满意度提升从资费、无线、宽带各方面来进行满意度精确调查用户体验分析综合语音分析、文本分析、准确获得用户体验信息7.2

常见的智能语音传感技术7.2.3

智能语音控制系统智能语音控制系统在目前很多场景中被应用,例如智能驾驶、智能家居、智能机器人控制等。执语 指 指 行音

相输 抽 匹 应入 取 配 操作357.2

常见的智能语音传感技术7.2.3

智能语音控制系统福特领界语音控制功能实测小度音箱+智能家居367.3

智能语音数据处理技术377.3.1

语音特征提取语音特征提取的目的是提取语音信号中能代表语音特征的信息,减少语音识别时所要处理的数据量。特征提取是语音信号处理的前提和基础,只有分析出可以代表语音信号本质特征的参数,才能对这些参数进行高效的语音通信、语音合成和语音识别等处理,并且语音合成的好坏语音识别率的高低,也都取决于语音特征提取的准确性和鲁棒性。7.3

智能语音数据处理技术387.3.1

语音特征提取目前流行的语音学特征提取方法主要有两类:1)采用传统特征,从原始音频文件中提取信号特征,捕获最原始的不同类型的声学特征,从而判定该特征所属的语音学任务类型;2)将传统特征与深度学习模型相融合, 在交叉领域中突出特征的重点,由于不同任务的侧重点不同,融合的方式体现出了多样化、个性化的特点。7.3

智能语音数据处理技术7.3.1

语音特征提取常见声学特征39频谱类特征MFCC(一阶差分和二阶差分的MFCC参数组)MFCC:

/xmdxcsj/article/details/51228791线性预测倒谱系数(LPCC)梅尔刻度滤波器组过滤(logMel)……7.3

智能语音数据处理技术7.3.1

语音特征提取基于深度学习的语音特征提取深度学习方法可以从不同层次的输入中学习有效的语音信号的非线性表现形式,目前已经被广泛应用于声纹识别、语音识别和情感识别。407.3

智能语音数据处理技术417.3.2

语音增强语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。语音增强涉及的应用领域十分广泛,包括语音通话、电话会议、场景录音、军事窃听、助听器设备和语音识别设备等语音增强方法的分类按照其运用方法的不同可以分成两大类:数字信号处理的语音增强方法和基于机器学习的语音增强方法按照其通道数目的不同可以划分为:单通道语音增强方法和麦克风阵列的语音增强方法7.3

智能语音数据处理技术7.3.2

语音增强427.3

智能语音数据处理技术7.3.2

语音增强麦克风阵列的语音增强由于利用了更多的麦克风,考虑了信号的空间信息,因此在抑制特定方向的干扰、进行语音分离等方面,比单通道的语音增强更有优势。主流的麦克风阵列方法有:固定波束形成的方法和自适应波束形成的方法。437.3

智能语音数据处理技术7.3.2

语音增强基于掩码的深度学习法447.3

智能语音数据处理技术7.3.3

语音识别语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的一种技术。457.3

智能语音数据处理技术467.3.3

语音识别20世纪50年代,AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。60年代末70年代初,语音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术的提出,解决了语音信号的特征提取和不等长匹配问题。(主要模板匹配法)20世纪80年代末,突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中,比较典型的是卡耐基梅隆大学(CarnegieMellonUniversity)的Sphinx系统,它是第一个高性能的非特定人、大词汇量连续语音识别系统。(统计模型及神经网络模型被应用于语音识别)7.3

智能语音数据处理技术477.3.3

语音识别20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。IBM公司推出的ViaVoiceDragonSystem公司的NaturallySpeakingNuance公司的NuanceVoicePlatform语音平台Microsoft的Whisper,Sun的VoiceTone等语音识别技术前世今生7.3

智能语音数据处理技术487.3.3

语音识别我国语音识别研究工作起步于五十年代,但近年来发展很快。目前,我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。2002年,“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品被外国公司垄断的历史。7.3

智能语音数据处理技术497.3.3

语音识别语音识别技术分类按词汇量大小,可以分为小词表、中词表和大词表以及无限词汇量语音识别;按发音方式,有孤立词、连接词和连续语音的语音识别;按说话人适应范围,有特定说话人、限定人和非特定说话人的语音识别;按照任务的不同:说话人识别、关键词检出、语音辨识,和连续语音识别。7.3

智能语音数据处理技术507.3.3

语音识别常用语音识别的方法有三种:基于语音学和声学的方法、模板匹配的方法以及利用人工神经网络的方法。(1)基于语音学和声学的方法在语音识别技术提出开始就有了这方面的研究,但由于其模型及语音知识过于复杂,现阶段没有达到实用的阶段。① 分段和标号,把语音信号按时间分成离散的段,每段对应一个或几个语音基元的声学特性。然后根据相应声学特性对每个分段给出相近的语音标号。② 得到词序列,根据第一步所得语音标号序列得到一个语音基元网格,从词典得到有效的词序列,也可结合句子的文法和语义同时进行。7.3

智能语音数据处理技术517.3.3

语音识别(2)模板匹配的方法模板匹配的方法发展比较成熟,目前已达到了实用阶段。在模板匹配方法中,要经过四个步骤:特征提取、模板训练、模板分类、判决。常用的技术有三种:动态时间规整(DTW)、隐马尔可夫(HMM)理论、矢量量化(VQ)技术。动态时间规整(DTW)把未知量均匀的升长或缩短,直到与参考模式的长度一致。在这一过程中,未知单词的时间轴要不均匀地扭曲或弯折,以使其特征与模型特征对正。7.3

智能语音数据处理技术527.3.3

语音识别隐马尔可夫法(HMM)HMM方法现已成为语音识别的主流技术,目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程:一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数是不可测的。7.3

智能语音数据处理技术537.3.3

语音识别矢量量化(VQ)与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。将语音信号波形的k个样点的每一帧,或有k个参数的每一参数帧,构成k维空间中的一个矢量,然后对矢量进行量化。量化时,将k维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。其中最关键的就是设计矢量量化器。矢量量化器的设计就是从大量信号样本中训练出好的码书。7.3

智能语音数据处理技术547.3.3

语音识别(3)神经网络的方法利用人工神经网络的方法是80年代末期提出的一种新的语音识别方法。深度学习最早应用于语音识别问题时的作用是替代GMM-HMM框架中的高斯混合模型,负责声学模型的建模,即DNN-HMM结构。在这种结构里,深层神经网络负责计算音频帧属于某一声学状态的概率或者是提取出声音的特征,其余的部分和GMM-HMM结构相同。目前,常用于语音识别的深度学习模型有自动编码器(

Auto-encoder,AE)

、深度神经网络(

Deep

Neural

Network,DNN)

、卷积神经网络(

Convolutional

Neural

Network,CNN)

和递归神经网络(

Recurrent

Neural

Network,RNN)

等。7.3

智能语音数据处理技术7.3.3

语音识别CTC(Connectionisttemporal

classification)CTC模型常与深度学习结合进行端到端的语音识别。传统的语音识别的声学模型训练,对于每一帧的数据,需要知道对应的label才能进行有效的训练,在训练数据之前需要做语音对齐的预处理。采用CTC作为损失函数的声学模型训练,是一种完全端到端的声学模型训练,不需要预先对数据做对齐,只需要一个输入序列和一个输出序列即可以训练,并直接输出序列预测的概率,不需要外部的后处理。557.3

智能语音数据处理技术7.3.4

声纹识别56每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。声纹识别的优点:易采集非接触式声纹辨认和确认的算法复杂度低准确度高。声纹识别(VoiceprintRecognition,

VPR),也称为说话人识别(Speaker

Recognition)。包括说话人辨认(Speaker

Identification)

和说话人确认(Speaker

Verification)。声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱,是由波长、频率以及强度等百余种特征维度组成的生物特征,具有稳定性、可测量性、唯一性等特点。7.3

智能语音数据处理技术577.3.4

声纹识别两个人的声纹图谱的差异性主要体现在如下方面:共鸣方式特征:咽腔共鸣、鼻腔共鸣和口腔共鸣嗓音纯度特征:不同人的嗓音,纯度一般是不一样的,粗略地可分为高纯度(明亮)、低纯度(沙哑)和中等纯度三个等级平均音高特征:平均音高的高低就是一般所说的嗓音是高亢还是低沉音域特征:音域的高低就是通常所说的声音饱满还是干瘪不同人的声音在语谱图中共振峰的分布情况不同,声纹识别正是通过比对两段语音的说话人在相同音素上的发声来判断是否为同一个人,从而实现“闻声识人”的功能。7.3

智能语音数据处理技术7.3.4

声纹识别587.3

智能语音数据处理技术597.3.4

声纹识别声纹识别系统根据是否规定输入语音文本可以分为:文本相关的(Text-Dependent)和文本无关的(Text-Independent)两种。文本相关声纹识别系统:要求用户按照规定的内容发音,每个人的声纹模型逐个被精确地建立,而识别时也必须按规定的内容发音,因此可以达到较好的识别效果,但系统需要用户配合,如果用户的发音与规定的内容不符合,则无法正确识别该用户。文本无关的声纹识别系统:不规定说话人的发音内容,模型建立相对困难,但用户使用方便,可应用范围较宽。7.3

智能语音数据处理技术607.3.4

声纹识别典

template model

和stochastic

model,即模板模型和随机模型(非参数模型和参数模型)。模板模型(非参数模型)将训练特征参数和测试的特征参数进行比较,两者之间的失真(

distortion

作为相似度。

例如VQ

Vectorquantization矢量量化)模型和动态时间规整法DTW(dynamic

timewarping)模型。随机模型(参数模型)用一个概率密度函数来模拟说话人,训练过程用于预测概率密度函数的参数,匹配过程通过计算相应模型的测试语句的相似度来完成。例如(GMM和HMM)高斯混合模型和隐马尔科夫模型。7.3

智能语音数据处理技术617.3.5

语音情感识别自动语音情感识别则是计算机对人类上述情感感知和理解过程的模拟,它的任务就是从采集到的语音信号中提取表达情感的声学特征,并找出这些声学特征与人类情感的映射关系。语音情感识别相关研究出现在20世纪80年代中期,它们开创了使用声学统计特征进行情感分类的先河。1985年Minsky教授提出“让计算机具有情感能力”观点。在20世纪80年代末至90年代初期,麻省理工学院多媒体实验室构造了一个“情感编辑器”。1999年,Moriyama提出语音和情感之间的线性关联模型。进入21世纪以来,语音情感识别研究被赋予了更多的迫切要求,发展步伐逐步加快,国际期刊、会议及相关赛事也不断增加。7.3

智能语音数据处理技术627.3.5

语音情感识别国际著名的研究组织:贝尔法斯特女王大学Cowie和Douglas-Cowie领导的情感语音小组;麻省理工大学Picard领导的媒体研究实验室;慕尼黑工业大学Schuller负责的人机语音交互小组;南加州大学Narayanan负责的语音情感组;日内瓦大学Soberer领导的情绪研究实验室;布鲁塞尔自由大学Canamero领导的情绪机器人研究小组……国内对语音情感识别研究的关注起始于21世纪初,

著名的有东南大学无线电工程系、清华大学人机交互与媒体集成研究所、模式识别国家重点实验室、浙江大学人工智能研究所和中国科学院语言研究所等.7.3

智能语音数据处理技术7.3.5

语音情感识别情感描述模型大致可分为离散和维度两类模型。(1)离散模型:将情感描述为离散的、形容词标签的形式,如高兴、愤怒等,在人们的日常交流过程中被广泛使用,同时还被普遍运用于早期的情感相关研究中。637.3

智能语音数据处理技术647.3.5

语音情感识别(2)连续模型:将情感状态描述为多维情感空间中的点。这里的情感空间实际上是一个笛卡尔空间,空间的每一维对应着情感的一个心理学属性。理论上,任意的、现实中存在的情感状态都可以在情感空间中找到相应的映该空间的情感描述能力能够涵盖所有的情感状态。二维的激活度-效价空间理论(arousal-valence

space)三维的激励-评估-控制空间理论(valence-activation-dominancespace)情感轮理论(emotion

wheel)…….7.3

智能语音数据处理技术7.3.6

语音合成技术在语音合成技术(TTS,Text

To

Speech)是指将任意文字信息快速转换成清晰自然、富有表现力的音频,相当于给机器装上了“嘴巴”,让机器人“像人一样开口说话”。657.3

智能语音数据处理技术7.3.6

语音合成技术667.3

智能语音数据处理技术7.3.6

语音合成技术677.4

智能语音传感技术典型应用7.4.1

智能家居在智能家居中,语音传感技术普遍被应用于人与智能设备间的交互。687.4

智能语音传感技术典型应用7.4.1

智能家居在智能家居中,语音传感技术普遍被应用于人与智能设备间的交互。语音识别697.4

智能语音传感技术典型应用7.4.2

机器人语音交互系统图灵实验707.4

智能语音传感技术典型应用7.4.2

机器人语音交互系统图灵实验器人交互系统硬件结构717.4

智能语音传感技术典型应用7.4.3

同声传译和口译技术《日本经济新闻》于2021年2月发表题为《AI同声传译将达专家级水平》的报道称,日本研发人员正在研究如何让AI对发言者的讲话“随听随翻”。科学家希望2025年能够利用人工智能实现实时同声传译。“信、达、雅”72技术难点:语音识别语义解析7.4

智能语音传感技术典型应用7.4.4

汽车智能语音交互目前大部分汽车都已经加入了智能语音交互功能,可以通过语音实现对车内一些设备的控制功能,例如:开关车窗、播放音乐、控制导航等。汽车智能语音控制73车载微信谢

谢!智能传感技术——第八章

智能医学传感技术目 录768.1

智能医学传感技术基础典型智能医学传感器智能医学数据处理技术智能医学传感技术典型应用8.1

智能医学传感技术基础8.1.1

医学传感器医用传感器,顾名思义,它是应用于生物医学领域的那一部分传感器,它所拾取的信息是人体的生理信息,而它的输出常以电信号来表现,因此,医用传感器可以定义为:把人体的生理信息转换成为与之有确定函数关系的电信息的变换装置。778.1

智能医学传感技术基础788.1.1

医学传感器人体生理信息有

电信息(心电、细胞膜电位)非电信息(血压、温度)从分布来说有

体内的(如血压等各类压力)体表的(如心电等各类生物电)体外的(如红外、生物磁等)8.1

智能医学传感技术基础8.1.1

医学传感器5生物传感器生理参数利用生物活性物质选择性识别来测定生化物质利用材料的物理变化物理传感器非电学量参数机体的各种生物电(心电、脑电、肌电、神经元放电等)生物电电极电学量参数利用化学反应原理,把化学成分、浓度转换成电信号化学传感器8.1

智能医学传感技术基础8.1.1

医学传感器常见的医学传感器?808.1

智能医学传感技术基础818.1.1

医学传感器医用传感器用于人体生理信息检测时,具有以下主要特点:被测量生理参数均为低频或超低频信息,频率分布范围在直流~300Hz。生理参数的信号微弱,测量范围分布在uV~mV数量级。被测量的信噪比低,且噪声来源可能是多方面的。由于人体是一导电体,体外的电场、磁场感应都会在人体内形成测量噪声,干扰生理信息的检测。人体是一有机整体,各器官功能密切相关,传感器所拾取信息往往是由多种参数综合而形成的。8.1

智能医学传感技术基础828.1.1

生物医学传感器生物医学传感器定义为“

使用固定化的生物分子 (immobilizedbiomolecules)

结合换能器,

用来侦测生体内或生体外的环境化学物质或与之起特异性交互作用后产生响应的一种装置”。生物传感器由两个主要关键部分所构成,一为来自于生物体分子、组织部分或个体细胞的分子辨认组件,此一组为生物传感器信号接收或产生部分,另一为属于硬件仪器组建部分,主要为物理信号转换组件,主要是由电化学或光学检测元件(如电流、电位测量电极,离子敏场效应晶体管,压电晶体等)。8.1

智能医学传感技术基础8.1.1

生物医学传感器电极热→电光→电压→电FET阀值电位被测物质酶微生物细胞或组织抗原或抗体测量或控制装置识别部件83转换部件生物传感器生物传感器结构框图8.1

智能医学传感技术基础8.1.2

新型医学传感器新型传感技术,比如微机电系统(MEMS)、生物化学传感器、免疫传感器等的陆续出现,加速了医疗保健的发展。传感技术使得健康状态定期或连续监控成为可能,这反过来使得新型积极护理模式的实现成为可能。因为干预治疗更为有效并且成本更为低廉,病症会更早地得到诊断,所以从长远来看,病人的未来会得到改善。848.1

智能医学传感技术基础8.1.2

新型医学传感器在疾病监测中的应用在监测慢性疾病的远程医疗领域中,已经找到了用于持续监测的解决方案,比如慢性阻塞性肺病(COPD)、充血性心力衰竭(CHF)和糖尿病。这种监测方式为疾病状态提供持续的观测,通过预测和防止疾病的急性发作,从而降低身体和经济上的成本。在急性发作后治疗病人,目前常采用应急护理模式,这种模式可能导致患者的健康和幸福毁灭性和不可逆转的改变,并且加速病人的身体衰弱。858.1

智能医学传感技术基础128.1.2

新型医学传感器在疾病监测中的应用传感技术会逐渐应用于普通人口筛查,成为国家卫生保健计划的一部分,以提高公共卫生水平。个体,尤其是那些没病找病的“疑病症”个体(那些身体健康,但是担心生病,并且通过拜访他们的医生、检测自身或者没有医学根据而服用药物以寻求安慰的个体),也很有可能会使用传感技术来积极地监测和维持他们自身的健康。随着流行的传感技术成为医疗规范,它们会显著地增加我们在疾病风险和干预治疗有效性方面的知识。现有的技术方案能帮助我们更好地理解衰老的过程,包括识别认知能力下降、衰弱的早期迹象,以及运动和神经系统的问题。传感器技术通过建立对人体健康状态变化的详尽的认知使得在个体水平上了解人体的健康状况成为可能。这些数据能提供对人体健康影响最大的病症的早期预警信号。8.1

智能医学传感技术基础138.1.3

智能医学传感技术的作用(1)改变我们医疗工作的方式随着非处方诊断性测试、直接面向消费者的基因检测试剂盒、生理监测传感器以及生育能力监控的普及,正在朝着“量化自我”和“生命记录”的网上在线方式发展。寻求治疗方法或者尝试一个已知疾病风险的预防性措施。一滴血验病”的检测芯片8.1

智能医学传感技术基础418.1.3

智能医学传感技术的作用(1)改变我们医疗工作的方式医疗是我们理解和治疗个人疾病方式改变的关键。我们开始远离基于经验和人群的医学,而接受精确的个性化医学。由于“OMIC"

技术(即基因组学、转录组学、蛋白质组学和代谢组学)的进步,病理学研究已经开始在分子水平上进行。这种分子水平上的分类意味着我们可以根据疾病的分子水平行为和个体的DNA来选择最佳的治疗方法。传感技术在个性化医疗中起着关键的作用。基于传感器的配套试验决定一个病人能否从基因靶向药物治疗中获益,并且传感器会在治疗的过程中监控病人(比如,监控与药物的靶向代谢途径相关联的生化副产物)。在接下来的数十年里很有可能从根本上改变我们的疾病诊断、预后和治疗干预的方法。8.1

智能医学传感技术基础8.1.3

智能医学传感技术的作用(2)传感器检测的背景信息在医疗中的应用背景信息在决定传感器数据的价值中起到很重要的作用。比如,一些在孤立环境中获取到的传感器读数可能会有局限。这些局限至少可以通过采集检测相关背景信息得到部分解决。当测量数据采集的时候,这个人正在干什么?他处于什么环境中?所处位置的什么环境条件会影响测量结果呢?在获取生理测量数据的时候,检测相关背景信息特别重要,比如心率测量前的活动量。检测相关背景信息一般可以通过使用其他的传感器、加速度计获得,比如,确定-个人在生理测量进行时是否移动。定性的方法,比如每周的健康调查问卷。这些方法通常在慢性病管理体系中使用。但是,自我汇报的信息的质量是取决于病人反馈信息的准确性的,这一般是很难做出判定的。在采集检测背景信息来进行临床传感器读数或者观察的时候,保证任何数据都有适当的时间分辨率和空间特征也是十分重要的。如果没有准确地匹配的话,额外的信息会使得获得的数据变得模棱两可。 158.1

智能医学传感技术基础8.1.3

智能医学传感技术的作用(2)传感器检测的背景信息在医疗中的应用传感检测背景信息一般可以通过以下三种方式使用:常见的方法是临床医生在一个特定的基础上人工地检查背景传感器信息来进行解析过程。另外,背景信息也可以用测量传感器得到的相同或相关的图形或表格重叠的部分表示,这种图形重叠可视化对于理解分析过程非常有帮助。最后,最复杂的步骤就是测量背景数据和感兴趣的数据源的智能化和自动化的融合过程。在减少数据维度和推断更高级别的信息中,数据融合算法是非常实用的,数据融合算法对于判定背景信息测量是否有效是很有帮助的。检测背景信息在确定传感器网络的安全性、隐私、性能和访问需求等16方面起到很重要的作用。8.1

智能医学传感技术基础8.1.3

智能医学传感技术的作用(3)基于医院和社区的传感技术用于评估和诊断传感技术渗透在医院护理的各个方面,从最简单地数字式温度计到复杂的激光制导的外科手术工具。成像传感器,比如X光、磁共振成像(

MRI)、计算机断层扫描(CT)、正电子放射断层造影术(PET)

以及超声成像,在非侵入的条件下使医生能够了解人体以及它是如何运转的。这些传感器从根本上改变了诊断医学。在内科,这些图片使医生能够精确定位受伤或是异常区域、做微创手术,以及评估医疗过程的成功或失败。在产科护理,超声成像使得医生可以监测胎儿发育并且鉴别可能影响母亲或胎儿健康的任何胎儿的或其他的异常情况。918.1

智能医学传感技术基础928.1.3

智能医学传感技术的作用(3)基于医院和社区的传感技术用于评估和诊断临床病理学家每天在医院实验室使用复杂的传感设备来执行血液学、生物化学、免疫学、病理学、微生物学的研究功能。这些大型的非离散的传感器需要经过训练的专业人员进行细致的样品制备才能保证准确的结果。传感器在治疗技术中也起到关键的作用。它们可以记录到一些特殊情况,比如一些异常的心跳信号,可以由医生或者传感器来判别。它们可以通过鉴别最佳服用药物时间来优化给药设备,并且它们可以持续追踪病人生命体征以保证治疗过程安全地进行,比如透析。成像、侵入式设备以及给药设备都广泛地使用传感器。8.1

智能医学传感技术基础938.1.3

智能医学传感技术的作用(4)社区应用的传感技术人口模式转变正在使目前的护理反应模型变得不可维持,并且迫使医疗实现的方式发生一些巨大的变化。第一,医疗必须变得具有前瞻性和预测性以避免高代价的急性健康事件。第二,医疗必须个性化,而不是以人群为基础的,以确保最佳的治疗得以实现。第三,提供的服务必须是去中心化的,从医院转移到社区和家庭。8.1

智能医学传感技术基础208.1.3

智能医学传感技术的作用(5)基于家庭的临床应用面向临床护理的技术可以分为两类:病人监测传感器和病人运动传感器,病人监测传感器测量一个人的生理和生物特性,并且存储或对数据做出反应,从而体现支持应用程序的功能。这种形式的传感需要直接与人体接触,或者通过采集样品,如血液,从而用于测试。病人运动传感器,如被动红外(PIR)

运动传感器(可以检测一个人进入或离开一个房间)和计步器(计算步数)观察动作。行为模式可以从这些数据做出推断,异常的模式则会触发警报。运动数据可以通过与人体直接接触检测到,例如计步器,或是通过使用环境传感器,如被动红外运动传感器,将其连接到目标所在的环境。可穿戴式运动传感器是与人直接接触的,因此可以准确地测量人的运动,不用考虑位置或他人的存在。在人们忘记连接传感器或是连接不正确的情况下,环境解决方案是比较理想的。但是,环境传感器安装在固定位置,如果一个人在另外的位置,它就不能传感到这个人的情况。8.1

智能医学传感技术基础1病人的监测测量的对象病人的监测检测的对象红外测温仪体温喷雾器/药物输送喷雾器吸入模式用过可控的喷雾器输送药物肺功能-肺活量计-峰流速仪FVC(用力肺活量),FEV(用力呼气量),PEF(呼气流量峰值)无线电频率识别(RFID)对象的交互——日常生活活动脉搏血氧仪血液氧合压力传感器床位使用血压计收缩压/舒张压加速计加速度——跌倒监测四肢运动——康复

计步——计步器脂肪测量器体脂百分比体重秤体重陀螺仪角速度——跌倒监测四肢运动——康复血红蛋白光度计血红蛋白浓度——测量贫血磁力仪体位——跌倒监测PT/INR仪表前凝血酶时间(PT)以及其衍生的凝血酶原比率(PR)测量和国际标准化比值(INR);长期被华法林(warfarin)使用者使用PIR房间占用情况28.1

智能医学传感技术基础8.1.3

智能医学传感技术的作用家用慢性疾病管理系统的体系结构968.2典型智能医学传感器978.2.1

智能医学传感技术的作用8.2.1超声医学超声成像是指以超声波为声源,以声波的传播特性为物理基础,对人体内部组织器官进行成像。与其他成像技术(如

CT、MRI、PET

SPECT)相比,超声成像具有无辐射、成像快速、检查费用低等优点;同时超声成像设备可以做到非常轻巧便携,所以以超声成像为基础的临床检查手段越来越受到医生的青睐,在临床中得到广泛使用。本章首先介绍超声成像的物理基础,随后分别介绍超声成像系统及成像模式。8.2典型智能医学传感器但是对骨的穿透性较差。988.2.1

智能医学传感技术的作用8.2.1超声1.超声波的物理特性超声波是指物体在介质中进行机械振动,产生频率高于

20kHz

的一种声波。在临床应用中,超声波的频率一般为

1~20MHz。

同其他频率的声波一样,超声波可以在固体、气体和液体中传播;同时又由于超

声波固有的高频特性,使它不同于低频声波,具有以下特点。(1)能量高:声波的能量正比于频率的平方;此外,功率正比于能量。因此,超声波具有较高的能量和功率。(2)方向性强:超声波在介质中沿直线传播。(3)穿透能力:声波在介质中传播时,依据传播方向的不同可分为横波和纵波。超声波是一种纵波,且穿透力很强,能够穿透较厚的生物组织,8.2典型智能医学传感器式中,

为质点密度;

为质点振动速度;

为声速。998.2.1

智能医学传感技术的作用一、超声超声成像中的重要参数(1)声速声速是指声波在介质中单位时间内传播的距离,常用

表示。可认为声波在各软组织中的传播速度近似相等,一般取 =1540m/s

。(2)声压和声强度声波在介质中传播时,介质中不同区域会受到不同的压力。将单位面积上介质受

到的压力称为声压(P),可用式(8-1)表示。P

vc8.2典型智能医学传感器268.2.1

智能医学传感技术的作用声强度(

I

)是指在单位时间内垂直于单位面积的超声能量,它是超声诊断学中的一个重要参数,如式(8-2)所示。2P2I

c式中,P

为声压;

为质点密度;

为质点振动速度;c

为声速。(3)声阻抗声阻抗(Z

)是指超声声场中某一位置上的声压(P

)与该处质点振动速度(

)的比值,如式(8-3)所示。Z

P将式(8-1)代入式(8-3)可以得到:

Z

c从式(8-4)可以看出,声阻抗等于质点密度与声速的乘积。8.2典型智能医学传感器278.2.1

智能医学传感技术的作用根据阻抗和声速的关系,通常可以把人体组织分为三类:气体组织——肺;液体组织——软组织和血液;固体组织——骨骼和矿物化后的组织。由于声波在液体组织中传播时声速和声阻抗变化不大,从而能够保证声波传播的方向性,进而能够使回波的接收时延与探测深度近似成正比关系,基于此能够获取高质量的超声图像。因而,在临床应用中,超声通常应用于液体组织成像。8.2典型智能医学传感器二、超声成像系统具体而言,超声成像设备主要由超声换能器和基础电路两部分构成超声成像系统的基本结构示意图超声换能器——超声换能器又称为超声探头,它主要用于超声波的发射和接收。探头的核心部件

是压电晶片,在晶片的前端使用由硅橡胶(或环氧树脂)制成的薄膜进行防护,同时,使用有机玻璃(或硬塑料)制作的外壳进行保护。基础电路——基础电路是超声成像系统的核心部分,主要由主控电路、扫描发生器、信号处理电路及电源构成。其中,主控电路用于控制电脉冲产生的时间,并对扫描发生器进行

初始化;扫描发生器主要对获取的信号进行坐标转换;信号处理电路主要对28信号进行稳定和平滑;电源为整个系统提供能量。8.2典型智能医学传感器29三、B型超声成像原理目前医用超声成像设备可分为

A

型、B

型、C型、D

型和

M

5

种类型。B型(Brightness

Mode)超声为灰度调制型超声,简称

B

超,因其可通过点、线扫描出人体组织(器官)的解剖切面,故又称为二维超声。在超声成像系统中,传感器系统其实就是一个阵列装置,它可以对信号进行发射和接收。一个传感器也可以成为阵元,而多个阵元能组成一个阵列。空间中每一个点的场强会受到各阵元辐射场的影响,所以为了形成不同的辐射场,会对各个阵元进行加权处理,从而使各个阵元发射的信号大小和时间不同。在成像过程中,之所以在一个阵列中采用多个阵元,就是为了尽可能地合成所需要的辐射场,从而达到提高成像分辨的目的。

当一个阵列产生在一定区域内发射信号,产生一个辐射场,那么在辐射场的物理对象通过与发射信号的相互作用而产生了反射信号。因为反射信号包含了物理对象的相关信息,为了得到它,就需要对反射信号进行逆求解。所以,成像的关键就在于产生所需要的辐射模式。辐射模式又可以称之为波束形成8.2典型智能医学传感器三、B型超声成像原理1.波束形成延迟叠加波束形成,是目前超声成像在实际应用中最广泛的成像方式。超声传感器阵列对发射信号进行适当的延迟,使每个阵元发射的超声信号到达场中某点的时间正好一致,从而形成聚焦点。由于人体内部媒介的非均匀性而产生的反射回波,超声传感器阵列对接收信号进行适当的延迟,最后生成图像。1048.2典型智能医学传感器105三、B型超声成像原理2.波束控制方法(1)动态聚焦不同于定点聚焦,当深度r变化时,动态聚焦的聚焦延时会随深度变化。在进行超声成像时,理论上所有的点都作为聚焦点,并且在发射和接收阶段都使用动态聚焦,会使得成像的质量大大提高。但是考虑到声束的传播在传统的延时叠加波束形成中的影响,如果对所有的点都进行聚焦,那么需要大量的数据采集时间来实现发射时的动态聚焦,所以在实际应用中只有通过接收时的动态聚焦来实现,但是因为在发射阶段无法实现动态聚焦,使得成像结果会出现一点偏差。当使用合成孔径成像技术时,因为它是对没有进行过聚焦处理的数据进行后处理,所以能够同时且简单地实现发射和接收时的动态聚焦,使得图像的质量有所提高。8.2典型智能医学传感器32三、B型超声成像原理2.波束控制方法(2)动态孔径当有效孔径越大,即阵元数越多时,生成波束的旁瓣越小,主瓣越宽,所以不同阵元数目会使得生成的波束有所差异。

所谓动态孔径,就是在波束形成阶段,只有位于接收子阵中

心的少数通道在接收开始时是激活的状态,而其余都处于关闭状态。随着接收深度的增加,越来越多的接收通道被打开,接收孔径逐渐增大。(3)幅度变迹超声传感器发射的声束是具有方向性的,它向组织内辐射的能量根据方向的不同而不同。超声阵列产生的波束是由不同阵元产生的不同声场相干叠加而产生的,当每个阵元的激励信号的幅度相同时,那么阵元产生的声场之间会等幅相干叠加,其中旁瓣幅度比较大,严重影响了成像的质量。通过对发射和接收通道的幅度加权,使得每个阵元发射和接收信号的幅度改变,从而对旁瓣的幅度进行控制,这种方法被称为幅度变迹。目前应用得比较多的幅度变迹函数有Hamming

函数、Hanning

函数和Blackman

函数。8.2典型智能医学传感器三、B型超声成像原理3.回波信号处理(1)模数转换在超声探头接收信号后,该信号为模拟信号,因为不便于分析,所以通过模数转换把该信号转化为数字信号。数字信号可以看作是很多不同频率的简谐波的叠加,在这些简谐波中的最高频率即为信号的最高频率。由

Nyquist定理可知,

采样频率必须大于最高频率的两倍,才能得到信号完整的信息。(2)增益补偿在超声成像过程中,增益补偿是一个重要的组成部分。增益补偿又称为

TGC,是一种根据组织的衰减特性,对接收到的超声信号进行增强处理,从而使获得的超声图像变得均匀的方法。在发射一个超声信号时,它具有一定的能量,由于人体组织的衰减特性,使得信号的能量随着探测深度的增减而减弱,从而导致在深度大的地方,超声的图像会比较暗,而深度浅的地方超声的图像会比较亮。如果不进行任何处理,那么所形成的图像上面的位置和下面位置的反差会比较强。338.2典型智能医学传感器34三、B型超声成像原理3.回波信号处理(3)Log压缩在超声成像系统中,它所能显示的灰度级为8(256的灰度级别)。然而当像素点的值在16以下时,并不能被显示出来,从而导致只能显示23dB的动态范围。在超声系统中获取的

B

模式数据是15位的,这远远超出了系统所能显示的级别,所以我们要经过Log压缩来使该数据限制在这个范围内。由于经过

Log

压缩后,大幅度压缩了图像的动态范围,从而使得本来的弱信号得以显示出来。(4)扫描转换当获得经过处理后的回波数据后,那就需要把回波数据中点和它的物理空间信息一一对应起来,称之为扫描转换(Digital

Scan

Converter,DSC)。扫描转换分为两种方式:扇形扫描和线阵扫描。扇形扫描的

DSC

算法,因为采样点是通过极坐标的方式显示的,所以需要把极坐标转换成直角坐标,再进行插补运算输出为在屏幕上显示的信号。而线阵扫描方式则相对简单,因为它的采样点本身就是以直角坐标系为参照,信号上各个采样点可以根据简单的速度和时间的计算,就能得出正确的物理位置信息,再经过插补运算后就可以在屏幕上显示扫描信息。8.2典型智能医学传感器1098.2.1

智能医学传感技术的作用8.2.2

MRIMRI

检查技术是在物理学领域发现磁共振现象的基础上,于

20

世纪70

年代继

CT

之后,借助电子计算机技术和图像重建数学的进展与成果而发展起来的一种新型医学影像检查技术。

通过对静磁场中的人体施加某种特定频率的视频脉冲,使人体组织中的氢质子受到激励而发生磁共振现象,当终止射频脉冲后,质子在弛豫过程中感应出

MR

信号;经过对

MR

信号的接收、空间编码和图像重建等处理过程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论