信息科学与电子工程专业英语翻译_第1页
信息科学与电子工程专业英语翻译_第2页
信息科学与电子工程专业英语翻译_第3页
信息科学与电子工程专业英语翻译_第4页
信息科学与电子工程专业英语翻译_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Unit 9 数字信号和信号处理Unit 9-1第一部分:数字信号处理数字信号处理(DSP)是研究数字表示的信号以及这些信号的处理方法。数字信号处理和模拟信号处理是信号处理的子领域。数字信号处理包括音频及语音信号处理、声纳和雷达信号处理、传感器阵列处理、谱估计、统计信号处理、图像处理、通信信号处理、生物医学信号处理等子领域。数字信号处理的目标通常是测量连续的真实世界的模拟信号或对其滤波,因此,第一步常常是使用模数转换器将信号从模拟形式转换成数字形式。通常,要求的输出信号为另一个模拟输出信号,这就需要数模转换器。数字信号处理的算法有时通过使用专用计算机来实现,它们(专用计算机)利用被称为数字信号

2、处理器的专用微处理器(简称DSP)。这些数字信号处理器实时处理信号,通常是针对具体目的而设计的专用集成电路(ASIC)。当灵活性和快速开发比大批量生产的成本更重要时,DSP算法也可以用现场可编程门阵列来实现。数字信号处理域在数字信号处理中,工程师通常在下面几个域的一个域中来研究数字信号:时域(一维信号),空域(多维信号),频域,自相关域以及小波域。他们按照某些依据来猜测(或试验不同的可能性)那一个域能够最好地表示信号的本质特性来选择在其中进行信号处理的域。从测量设备得到的样本序列产生(信号的)时域或空域表示,而离散Fourier变换则产生频域表示即频谱。自相关定义为信号与其自身经过时间或空间间

3、隔变化后的互相关。信号采样随着计算机应用的增长,数字信号处理的使用和需求日益增多。为了能够在计算机上使用模拟信号,必须使用模数转换器(ADC)对其进行数字化。采样通常分两步实现:离散化和量化。在离散化阶段,信号空间被分割为相等的区间,用相应区间的代表性信号值代替信号本身。在量化阶段,用有限集中的值来近似代表性的信号值。为了能够正确地重建被采样的模拟信号,必须满足奈奎斯特-香农采样定理。定理规定:采样频率必须大于两倍的信号带宽。实际应用中,采样频率通常远大于信号带宽的两倍。最常用的带宽是:DCBW(基带);以及fc±BW,即以载波频率为中心的频带(直接调制)。数模转换器(DAC)用来将

4、数字信号转换回模拟信号。数字计算机的使用是数字控制系统的关键因素。时域和空域时域和空域中最普通的处理方法是用一种叫做滤波的方法增强输入信号。滤波通常由在输入或输出信号当前样本周围的许多样本的某种变换组成。有很多表示滤波器特性的方法,例如:l “线性”滤波器是对输入样本的线性变换;其他的滤波器为非线性的。线性滤波器满足叠加条件,就是说,如果输入是不同信号的加权线性组合,输出就是(各信号)相应输出的同样加权线性组合。l “因果”滤波器仅使用以前的输入或输出样本,而“非因果”滤波使用将来的输入样本。通常“非因果”滤波器可以加延迟使其成为“因果”滤波器。l “时不变”滤波器对时间具有不变的性质,诸如自

5、适应滤波器等其它滤波器随时间而改变。l 有些滤波器是“稳定的”,其它的是“不稳定的”。稳定的滤波器产生的输出信号随时间收敛于一个不变的值,或在有限的时间间隔内保持有界。不稳定滤波器的输出是发散的。l “有限脉冲响应”(FIR)滤波器仅使用输入信号,而“无限脉冲响应”(IIR)滤波器同时使用输入信号和以前的输出信号样本。FIR滤波器总是稳定的,而IIR滤波器可能是不稳定的。l 多数的滤波器可以通过传输函数在Z域(频域的扩展集)中描述。滤波器也可以用差分方程或一组零极点表示,对于FIR滤波器还可以用冲击响应或阶跃响应表示。对于任何给定输入,FIR滤波器的输出可以通过输入信号和冲击响应的卷积来计算。

6、滤波器还可以用结构图来表示,它能用来推导样本处理算法,以便使用硬件指令实现滤波器。频域信号常常通过Fourier变换从时域或空域变换到频域。Fourier变换将信号信息变换成每个频率的幅度和相位成分。Fourier变换常常被变换成功率谱,它是每个频率分量平方的幅度。用频域对信号进行分析的最一般的目的是分析信号的特性。工程师可以研究频谱来得到输入信号中有哪些频率信息,而哪些频率是没有的。有一些常用的频域变换。例如倒谱用Fourier变换将信号转换到频域,取对数,然后再作第二次Fourier变换。这就强调了幅度较小的频率成分同时保持了频率分量的数量级。应用数字信号处理的主要应用是音频信号处理,音频

7、压缩,数字图像处理,视频压缩,语音处理,语音识别,数字通信,雷达,声纳,地震学和生物医学。具体的例子有数字移动电话的语音压缩和传输,高保真音乐的空间匹配均衡和语音加强应用,天气预报,经济测报,地震数据处理,工业过程的分析控制,电影中的计算机动画制作,医学成像如计算机断层扫描和磁共振成像,图像处理,高保真扬声器分频和均衡,以及电吉他扩音器所使用的音效。实现数字信号处理通常使用专用的微处理器来实现,如MC56000和TMS320。它们通常使用定点算法处理数据,尽管也有一些使用浮点算法,运算能力更强大。比较高速的应用可选用FPGA来实现。从2007年开始,已经开始出现DSP的多核实现。对于使用量大的

8、高速应用,可以专门设计ASIC。对于低速应用,速度较慢的传统处理器如微控制器就能处理。Unit 9-2第二部分:数字信号处理的基本概念数字计算机和用来实现各种信号处理功能的专用数字电路的应用需求非常大,这些功能过去都是使用模拟设备来实现。便宜的集成电路的不断发展产生了许多微计算机和小型计算机来实现各种信号处理功能。现在有可能在比以往全模拟系统小得多,而且成本也低得多的限制下构成专用数字处理器。我们将讨论数字信号处理的基本概念,为此,适当地讨论一些常用术语和假设。可能之处,定义和术语将依照IEEE音频和电声小组的推荐。模拟信号是定义在连续时间上的函数,其幅度取值是连续的。一些通常的例子有正弦函数

9、,阶跃函数,麦克风输出信号等等。“模拟”这一术语显然是来自于模拟计算领域,其中电压和电流用来作为物理变量,但它的用处已经扩展了。连续时间信号是定义在连续时间上的函数,但是它的幅度可能是连续值也可以是有限的可能值。本文中,我们将模拟信号看成是连续时间信号的一个特例。然而实际应用中,“模拟”和“连续时间”这两个术语可以随意互换使用,通常表示同一个意思。由于“模拟”一词与物理类比的关联,已经确立了优先使用“连续时间”这一术语。不过有时为了清楚起见也用“模拟”一词,特别是与“数字”相联系时。术语“量化”描述了用一组离散值来表示变量的过程。经量化的变量只能取离散值。离散时间信号是定义在某些特定时间值上的

10、函数。这意味着独立变量时间被量化了。如果离散时间信号的幅度可以取连续值,那么函数称作采样数据信号。采样数据信号可以在离散时间值上对模拟信号采样得到。数字信号是时间和幅度都被量化的函数。数字信号总是使用一系列数来表示,其中每个数用有限个数字表示。“离散时间”和“数字”这两个术语在实际中经常互换,表示同一个意思。许多基于离散时间信号的定理适用于纯数字信号,因此没有必要总是对两者作严格的区分。理论发明更多地用到“离散时间”这一术语。而“数字”这一术语则更多地用来描述软硬件的实现。根据使用的硬件或软件的类型和当前信号的类型,一个系统可以用任意的前述术语来描述。可参考模拟系统,连续时间系统,离散系统,数

11、字系统等。线性系统可使用叠加原理。线性系统可以用线性的微分或差分方程来描述。线性时不变系统就是参数是不变的,不会随时间变化而变化的系统。集总系统是由有限非零元素构成,满足常微分(或差分)方程的系统,与满足偏微分方程的分布式系统相对应。数字信号的数字处理的标准形式是二进制数字系统。二进制数字系统仅使用0和1来表示所有的可能值。m值可用n位二进制数字来表示,m= 2n。反过来,如果m是要求的等级数,所需的比特数是大于等于log2 m的最小整数。实现数字处理的过程将用一个简化系统来说明,假定信号在0V到7V之间变化,以1V为增量,用8种可能的值表示成二进制数。图9-1显示了方框图,图9-2画出了我们

12、所感兴趣的一些波形。首先,信号通过连续时间的预采样滤波器,稍后我们将讨论它的函数。然后信号以T秒为间隔由采样器读入。接着这些样本必须量化为一种标准电平。尽管量化过程有不同的策略,我们在这里所用的是一种常用的方法,采样值取最接近的电平。于是,采样值为4.2v被量化成4v,而采样值为4.6v则被量化成5v。图9.2说明了对于给定信号的处理过程。令表示信号的脉冲变得很窄来说明在空的间隔可以插入或复合其它信号。这些脉冲被表示成二进制数字。为了使这些数字可以从图中看到,将每组都显示在给定间隔的空档处。实际应用中,如果要插入其它信号,用来表示二进制数的比特数的脉冲可以很短。一个给定的二进制数就可以在采样周

13、期开始的很短间隔内读到,这样就给其它信号留出了大部分的可用时间。模拟样本被量化并转换成二进制数的这一过程称作模数转换。通常,信号的动态范围要和所用的A/D转换器相一致,为了达到所要求的精确度,要使用足够的比特数。现在信号可以根据适合所要应用的单元类型来处理。这个单元可以是通用计算机或小型计算机,也可以是为专门用途而设计的专用单元。无论如何,它们都是由可以完成加减乘等各种算术函数的标准数字电路组成的。此外,还有逻辑和存储能力。在处理器的输出端,数字信号可以再转换回模拟形式。这通过数模转换过程来实现。在这个步骤中,首先要将二进制数字接连地转换回连续时间脉冲。脉冲间的空隙由重建滤波器填充。此滤波器由

14、保持电路组成,它是专门设计用来保持连续采样值之间的脉冲值的电路。在某些情况下,可设计保持电路,将输出信号在连续样点之间按照设定的曲线拟合方法进行内插。除了保持电路,使用基本的连续时间滤波器在采样点之间进行额外的平滑处理。一个可能出现的基本问题是,在这个过程中会不会造成一些信息的丢失。毕竟,信号仅仅在离散的时间间隔处被采样。在介于时间间隔内是否有一些信息丢失了呢?而且,在量化的过程中,真实的幅度值被最接近的标准电平所代替,这就意味着幅度中可能存在着误差。关于采样的问题,我们将表明,如果信号带宽有限,并且采样率大于等于最高频率的两倍,理论上信号就能从离散的样本恢复。这相当于在最高频率上,每周期有两

15、个样本的最少值。实际应用中,为了能够保证可实现性,采样率往往选择比最低频率更高一点(比如说,三倍或四倍的最高频率)。例如,模拟信号的最高频率是5kHz,理论上最小采样率为每秒10000个采样值,而实际系统中会采用更高一些的频率。常将输入的连续时间信号通过一个低通模拟预采样滤波器,以确保最高频率落在信号能够完全恢复的界限之内。如果信号没有以足够快的速率采样,就会产生混叠现象。混叠会导致在恢复时一个频率被误作为完全不同的频率。例如,假设频率为直流到5kHz的信号,以6kHz进行采样,显然这太低了不能确保信号的恢复。如果进行恢复,原始信号中5kHz的分量将出现在1kHz,产生错误的信号。一个普通例子

16、就是我们称之为“车轮效应”的现象,就是读者在西部电影中也许注意到的车轮看起来向后转动的情况。因为影片的每一帧相当于一次离散的采样,如果相对于电影帧频而言轮辐越过的给定角度过大,轮子看起来就会向后转动或以很慢的速度转动。采样前预滤波消除了这种对系统而言频率过高的伪信号被错误地当作适当频率范围内的另一信号的可能性。关于量化误差,可以看到如果使用任意多的比特数,可使误差任意小。当然,由于实际的最大限制,有必要允许这一现象所产生的某些误差。即使是连续时间系统,也可能会有噪声出现,在实际幅度值上引入不确定。实际上,数字采样过程中产生的不确定称为量化噪声。令Emax 和 Emin,分别表示信号的最大和最小

17、值,q表示连续量化电平的垂直距离。n,m如上文中定义,于是得到:(9-2)假设两个连续量化电平之间的样本赋以最近的量化电平。峰值量化噪声以及峰值百分比量化噪声的值为:(9-3)(9-4)在许多情况下,量化噪声的方差比最大值更为重要。方差和与噪声有关的平均功率成正比。如果信号假定为在量化电平间均匀分布,统计分析显示噪声方差s2为(9-5)噪声分量的均方根(或标准偏差)为:(9-6)比较式(9-6)和 (9-3),可以看到RMS噪声分量是峰值噪声分量的。鉴于前面的讨论,如果采样速率足够高的话,采样操作就不会造成信息丢失,并且通过选择足够的比特数来表示每个二进制数可以将量化误差降低到小到可以忽略不计

18、的程度。这些概念让我们可以用一系列的离散二进制数来表示连续时间信号,可以直接用数字电路来处理。包括A/D转换,处理和最后的D/A转换在内的这些过程,看似花了很多努力为了处理一个信道。确实,在许多情况下,如此复杂的过程对单一信道从经济角度来说是不可行的。数字概念的一个很大优势就是可以用同一个算术单元处理许多信道。这可以通过一种被称为时分复用(TDM)的过程来实现。在图9.2中显示的采样信号中可以看到,在信号连续的样本之间有一段比较长的周期。在这段周期内,另外信号的样本被送入处理器。图9.3解释了这个概念。以一种连续的顺序读每个信道,相应的值以同样的顺序被转换成二进制数。这些数输入处理单元,经过适

19、当的处理之后以适当的顺序在输出端输出。这种复合的数字信号必须先用与输入采样信号同步的多路信号分离器将其分离成原始的不同信道。为了输出要求,信道随后进行D/A变换。在前面的讨论中,我们假定系统的起始和结束信号都是连续时间形式的。实际上,在许多系统中,其中之一或两者都已经是数字形式的了。在这些情况下,可以不用到A/D转换器和/或D/A转换器,这样就简化了系统。例如,假设许多连续时间遥测信号需要由数字单元处理,但是输出数据需要以数字形式保存,用以进行科学数据压缩和计算。在这种情况下,输入端需要A/D单元,但在输出端不需要转换器。Unit 11 数字图像处理Unit 11-1第一部分:二维数字图像图像

20、是表示一些物理参数空间分布的二维信号,典型的物理参数是光强,而更普通的是能量的任一种形式。例如,运动图像以及多光谱的遥感图像是三维或者是更高维的信号。现代数字技术使得处理多维信号成为可能,所使用的系统可从简单的数字电路到先进的并行计算机。这种处理的目的可以分为3类:- 图像处理:输入图像®输出图像- 图像分析:输入图像®输出测量数据- 图像理解:输入图像®输出高层次的图像描述我们将介绍的重点集中在图像处理的基本概念上。篇幅所限,我们只能对图像分析以及图像理解进行一些介绍性的说明。另外我们将限于讨论二维图像处理,尽管将要描述的大部分概念和方法很容易扩展到三维或更高的

21、维数。我们从一些基本定义开始。在“真实世界”中定义的一幅图像可以看成是两个实变量的函数,例如:以a作为在实坐标位置(x, y)处幅度(亮度)的图像a(x, y)。一幅图像可以看成是包含许多子图像,这些子图有时称之为感兴趣区域,ROI,或者仅仅是图像中的区域。这一概念表明图像通常包含许多对象,每一个对象可以是一个区域的主要部分。在一个复杂的图像处理系统中,应该能对于选择的区域进行特定的图像处理运算。于是图像的一部分可以进行抑制运动模糊的处理,而另一部分可以作改进色彩渲染的处理。一幅给定图像的幅度几乎总是要么是实数,要么是整数。后者通常是量化的结果,将一个连续的范围如0到100%转换为离散的(灰度

22、)级。然而,在某些图像形成过程中,信号可能涉及到光子计数,这意味着幅度本来是量化的。其它的图像形成过程,如磁共振成像,直接的物理测量会产生一个复数,具有实的幅度和实的相位。除非另有说明,我们认为幅度是实数或者是整数。一幅二维离散空间中的数字图像am, n是由二维连续空间中的模拟图像a(x, y)通过采样得到的。采样过程常称为数字化。对采样过程的数学表示将在稍后介绍。现在,我们来看一些和数字图像有关的基本定义。图11.1显示了数字化的效果。2维连续图像a(x, y)被划分成N行M列。一行一列的交叉点被叫做一个像素。整数坐标m, n被赋予的值是am, n,其中:m = 0, 1, 2, . , M

23、-1 ,n = 0, 1, 2, . , N-1。实际上,大多数情况下,我们认为是射到二维传感器表面的物理信号a(x, y)实际上是许多变量的函数,包括深度、颜色、时间。除非另作说明,本文我们考虑的是2维的,单色的静止的图像情况。图11.1的图像被划分成了N = 16 行以及M = 16列。赋予每个像素的值是像素的平均亮度,其四舍五入到最近的整数。将二维信号在给定坐标位置的幅度表示成具有L个不同灰度级的整数值的过程通常称为幅度量化,或简称量化。在数字图像处理中,某些工具是非常重要的。这些包括数学工具,如:卷积、傅立叶分析以及统计描述,和处理工具,如:链式码与游程码。在这里我们介绍这些工具没有任

24、何特别的动机,在后面的章节中我们会对此予以介绍。许多图像处理应用是要产生被人观察的图像,而不是比方说为了自动的工业检验。因此,了解人类视觉系统的特征和限制是很重要的,即要了解二维信号的“接收器”。一开始就认识到以下几点是很重要的:1)人的视觉系统尚未被充分了解;2)不存在与人眼评价相当的判断图像质量的客观度量;3)不存在所谓“典型”的观察者。然而,感知心理学的研究已经对视觉系统提供了一些重要的见解。Unit 11-2第二部分:数字图像定义和应用图像无处不在,这毫不足怪,因为我们人类依赖于图像,我们用眼睛的感知超过所有其它的感知刺激。我们吸收的几乎所有的信息都是图像的形式,不论是看一张照片,看电

25、视,欣赏一幅画,或是读书,这一切都利用了图像。图像对于我们是如此自然,因而总是尽力将几乎任何信息都转换为图像。例如电视天气预报用图像表示某一地区的温度分布,以不同颜色代表不同的温度,医学扫描装置可将人的新陈代谢活动显示成图像,用亮点表示强的活动性,等等。此外,我们的视觉通常是我们感官中最有效的:举例来说,考虑一个电脑键盘。每个键的功能都用了一个小图像(一个字符)表示。我们也可以通过一个特定的凹凸纹理来识别每个按键,但它的效率远不及前者。我们甚至可以尝试给每一个按键一个特定气味,但很容易想象在打字时我们的麻烦。我们也擅长于许多图像处理任务。举例来说,我们眼睛的聚焦:当我们看东西时,我们的眼睛传递

26、给大脑的第一个图像可能是未聚焦的,然后大脑试图通过调节眼睛晶状体纠正这一点,一个新的图像就会从眼睛发送到大脑,等等。这种反馈过程是如此之快,甚至我们没有意识到这一点。另一个例子是立体视觉:我们的眼睛将两幅二维图像传到大脑,而大脑能在瞬息之间将它们合成为一幅三维图像。图像处理技术将人类使用图像的自然方式和数学结合起来。这就提供了独特的混合,因为可用严格数学方法描述图像和图像处理又不失图像的直观性。图像处理可以定义为:图像中信息的处理和分析。当然这个定义是非常宽泛的,包括自然的和人为的处理,从一副眼镜的使用到哈勃望远镜传输的图像的自动分析。我们可以发现身边图像处理的简单方式,包括:- 使用眼镜或隐

27、形眼镜- 亮度,对比度等,电视或监视器的控制- 用相机拍摄和冲洗照片- 大自然的例子:水面上景色的反射,水雾中景色的失真,等等。高级图像处理的应用例子包括:- 司法科学:视频监控摄像机图像的增强,图像中的脸,指纹,DNA码等的自动识别和分类。- 工业:检验生产部件,应用于CAD /CAM。- 信息处理: 手写和印刷文本(经常被称为OCR;光学字符识别)的识别,印刷图像的扫描和分类。在医学中,使用病人的一幅或多幅医学图像,可以发现图像处理的许多应用,例如:- 可视化。 例如:在我们制作一个三维物体的三维可视化之前,我们首先需要从二维图像中提取物体的信息。- 计算机辅助诊断。 如:现在通常为超过一

28、定年龄的女性定期拍乳房X光片,以发现早期的乳房癌。实践中图像数量如此巨大,因而用自动计算机图像处理来完成部分筛选工作十分有益。- 图像分割即将图像分割为有意义的结构。例如:将脑图像分割为这些结构:脑白质、脑灰质、脑脊髓液、骨质、脂肪、皮肤等。从改善可视化到肿瘤生长的监测,在许多工作中分割是有用的。- 图像配准,即同一病人两幅或更多图像的严格对准。若要将这些图像中包含的信息结合起来形成一幅有意义的新图像,这种对准是十分必要的。 图像处理应用可以有很多目的。大多数时候,目的是在一个或几个这些类别中: - 图像增强,例如,减少噪声或图像锐化。- 模式识别,例如,图像中某种形状或纹理的自动检测。- 将

29、数据量减少为更容易处置或解释的信息,例如将图像减小为一幅较简单的图像、一组对象或特征、或者一组测量结果。- 图像合成,如由二维照片重建三维场景。- 图像拼接。当从同一个场景获取两种不同形态(类型)的图像时,将它们拼接起来涉及配准,其后是数据减少和图像合成。 - 数据压缩。为了缩小包含图像的计算机文件的大小,以及加快网络中图像传输的速度,数据压缩常常是必需的。我们关心的只是数字图像处理,而不是模拟处理,理由是,模拟处理需要专用的硬件,这使得建立一个特殊的图像处理应用成为一项艰巨的任务。此外,在许多图像处理领域中模拟硬件的使用正在迅速地成为过去,因为它常常能被更具灵活性的数字硬件(计算机)所取代。

30、 但究竟什么是数字图像呢?数字图像获取与处理的示意图如图11.2所示。顶部有某个成像设备,如摄像机,医疗扫描仪,或其它任何可将物理现实的量度转换为电信号的设备。成像设备产生一个连续的电信号。因为这种模拟信号不能直接用计算机处理,信号通过数字化仪转换为离散形式。最后产生的图像便可直接用于数字图像处理应用。数字化仪完成两个任务:采样和量化(见图11.3)。在采样过程中,图像中连续信号的值在特定位置被采样。在量化过程中,真实值被离散化为数字数值。量化后的图像我们称为数字图像。这样就回答了本节开头的问题:数字图像只不过是一个数值的矩阵。每个矩阵元素,即已量化样本,被称为图像元素或像素。对于三维图像则称

31、为体积元素或体素。 我们可以用两个坐标(x; y)表示图像中每个像素的位置。按照惯例,(0; 0)像素,即原点,是在图像的左上角,X轴是从左向右,Y轴自上而下(见图11.4 )。这可能要用一点功夫去习惯它,因为它不同于常规的二元函数的数学表示法,也不同于常规的矩阵坐标。如果一幅数字图像仅仅是一个数值矩阵,有人可能会说:数字图像处理只不过是一种对矩阵进行运算的数学算法的集合。幸运的是,现实情况远非所说的那么枯燥乏味,因为在实际中,我们很少使用图11.3所示的矩阵表示,而是对图11.3的中间图像进行处理,实际上是同一幅图像,但将光强度赋予每一个数,对人而言它通常更有意义。你会发现图像处理算法将被描

32、述为数学算子作用于像素值或像素矩阵,这些算法的运算结果也将被用图像形式显示出来。Unit 11-3第三部分:图像处理引言图像由各种物理设备产生,包括照相机和摄像机、X光设备、电子显微镜、雷达、超声设备等,并用于各种目的,包括娱乐、医疗、商务、工业、军事、民用、安全、科学。各种应用的目的都是使观察者(人或机器)提取被成像的场景中的有用信息。原始图像通常并不直接适合于这一目的,必须以某种方式进行处理。这种处理称为图像增强;而观察者从图像中提取信息的处理则称为图像分析。增强和分析根据其输出性质即输出的是图像还是关于场景的信息来区分,也根据所面临的挑战和所使用的方法来区分。图像增强通过化学、光学、电子

33、方法实现,而分析则主要由人工和电子方法实现。用于观察者的(视觉)增强方法或用于(计算机)自主分析的数字图像处理技术在成本、速度、灵活性方面具有优越性,随着个人计算机价格的急剧下降和功能的快速提升而成了实用的主要方法。挑战图像并不是被观察的物理对象性质的直接测量,而是诸多物理因素相互作用的结果:光照强度及其分布、光照与构成景物的物质之间的相互作用、反射光或透射光从三维空间到二维图像平面的投影几何关系、以及传感器的电子特性。不像某些其它工作例如编写编译程序那样有正式理论为基础的算法,可将高级计算机语言翻译成机器语言,不存在从图像中提取感兴趣的景物信息如位置或某一制成品质量的算法和可比的理论。这种困

34、难常被初学者低估,因为人的视觉系统似乎可轻而易举地从景物中提取信息。人的视觉通常比我们目前乃至可预见的未来能够设计制造的任何东西复杂得多。于是我们必须注意,不要根据人们对某一数字图像处理应用的印象来评估其难易程度。一个首要的指导原则也许是人类更擅长于判断而机器更擅长于测量。因此,比方说在传输带上确定一个汽车零件的确切位置和大小很适合于数字图像处理,而要对苹果或木材的质量定级却更具挑战性,尽管不是不可能的。按照这些原则,需进行大量计算而极少需要判断的图像增强就是很适合于数字处理的。对处理时间的严格要求常使问题变得更复杂。很少用户在意电子表格的数据刷新时间是300毫秒而不是200毫秒;但是,譬如说

35、大部分工业应用却必须在机器周期所要求的严格限制以内完成操作。还有许多应用如超声图像增强、交通监控、摄像机防抖动等要求对视频流进行实时处理。为了具体了解对处理速度的挑战,设想一下,一台标准黑白摄像机的视频流每秒有1000万个像素。在撰写本文时,一台典型台式PC也许可在处理每个像素所允许的100ns时间内执行50条机器指令,而能用区区50条指令完成的处理十分有限。此外,许多图像处理应用还受到成本的严格限制,因此我们经常面临工程师们望而生畏的三重难题:要求设计的产品同时具备性能优良、运行快捷、价格便宜的优点。图像获取所有图像处理应用始于某种形式的照射,典型的是光线但广义的是某种能量。有时必须使用环境

36、光线,但更为典型的是根据具体应用设计照明。在这些情况下事情的成败往往就在于此:任何高明的软件都无法将因为照明不良而丢失的信息恢复出来。照相机就是一个能将辐射能量分布转换为存放在RAM中的数字图像的装置。过去这一过程分成两步:将能量转换为电信号即照相机的功能;用数字化设备将信号转换成数字形式并存储。现在两者之间的界线正在变得模糊,照相机将通过USB、以太网、IEEE 1394接口直接将图像送入计算机。照相机技术以及所产生的图像特性几乎无例外地受到最大实际应用量的驱动,其中之一是消费电视。因此大多数的摄像机具有半个多世纪以前电视广播标准所制定的分辨率和速度特性。典型的可见光单色摄像机的分辨率为64

37、0´480,每秒输出30帧图像,并支持电子快门和快速复位(任意时刻回复到一帧初始状态的能力,从而可避免在开始捕获一帧新图像前的等待)。这种摄像机是基于CCD传感器技术的,能产生优良的图像,但相对于其它具有同样数量晶体管的多数芯片而言其价格很高。随着大容量个人计算机多媒体应用的激增情况首次发生了变化。首先影响到的是显示器,它已有相当一段时间给我们提供了比广播更高的速度和分辨率。人们可期待照相机/摄像机也随之跟上,包括由民用数字照相机所推动的高速度、高分辨率器件,娱乐业、互联网远程会议和用户视觉界面应用所推动的低分辨率和极低价格的设备。廉价器件可能会产生更大的影响。这些是基于新出现的CM

38、OS传感器技术的,其生产工艺与大多数计算机芯片相同,因而得益于生产批量大而价格低廉。目前它的图象质量还达不到CCD标准,但随着技术的成熟是注定会改进的。图像增强 数字图像增强算法大致分为两类:点变换(像素映射)和邻域运算。1. 点变换 点变换产生的输出图像中每个像素都是一个相应输入像素的某种函数。这一函数对于每个像素都相同,通常是由图像的全局统计特性导出的。点变换一般运行很快,但仅限于进行全局变换,例如调整整幅图像的对比度。点变换包括许多可用于分等级值像素的图像增强。这些算法常由基于查找表的单一软件程序或硬件模块实现。查找表的运行速度快,可以编程用于实现任何功能,以合理的速度提供最终的普适性。

39、而MMX以及类似的处理器则能以比查找表快得多的速度通过直接计算来执行各种功能,其代价是软件复杂性的提高。当某种功能是通过图像全局统计特性来计算时,像素映射是最为有用。例如人们可以处理一幅图像,在输入信号的均值和标准偏差,或者最小值和最大值的基础上,获得所要求的增益和补偿(偏移)。直方图指标是一种有效的像素映射点变换,对输入图像进行处理使之具有与某一参考图像同样的像素值分布。其像素映射关系很容易从输入图像和参考图像的直方图得到。直方图指标是进行图像分析前的一种有用的增强技术,这种分析的目的是对输入图像和参考图像进行某种比较。阈值分割是一种常用增强技术,其目的是将图像分割成目标和背景。计算阈值,大于(或小于)阈值的就当作对象,否则就是背景。有时用两个阈值来确定对应于目标像素的一个范围。阈值可以是固定的,但最好是根据图像的统计特性计算得到。也可以用邻域处理进行阈值分割。在所有这些情况下得到的结果都是一幅二值图像,即只有黑白两色而没有灰阶。颜色空间转换用于转换不同的颜色表示方法,例如将照相机提供的RGB空间转换成图像分析算法所要求的HIS(色调,亮度,饱和度)空间。由于精确的颜色空间转换涉及的计算量很大,在对时间有严格要求的应用中常采用粗略的近似。这些近似方法十分有效,但在选择一种算法以前应该对速度和精度间的权衡有所了解。时间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论