多媒体技术与应用_第1页
多媒体技术与应用_第2页
多媒体技术与应用_第3页
多媒体技术与应用_第4页
多媒体技术与应用_第5页
已阅读5页,还剩156页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

声音:原理、采集及处理声音简介什么是声音声音是通过一定介质(如空气、水等)传播的连续的波声音的重要性声音是携带信息的极其重要的媒体,是多媒体技术研究中的一个重要内容声音的种类繁多,如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然界的雷声、风声、雨声、闪电声等这些声音有许多共同的特性,也有它们各自的特性。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们各自的特性声音的物理和心理特征物理特性心理/生理感觉特性频率(Hz)音调,音高振幅/能量(W,mW)音量,响度波形音色频率和振幅声音信号的两个基本参数:频率和振幅信号的频率:指信号每秒钟变化的次数,用Hz表示。例如,大气压的变化周期很长,以小时或天数计算,一般人不容易感到这种气压信号的变化,更听不到这种变化。对于频率为几Hz到20Hz的空气压力信号,人们也听不到,如果它的强度足够大,也许可以感觉到。音色声音的波形绝大多数都不是简单的正弦波,而是一种复杂的波。分析表明这

种复杂的波形,可以分解为一系列的正弦波,这些正弦波中有基频f0,还有与f0成

整数倍关系的谐波:f1、f2、f3、f4,它们的振幅有特定的比例。这种比例,赋予每种乐器以特有的“色彩”—音色。如果没有谐波成分,单纯的基音正弦信号是毫无音乐感的。比如:大提琴音色、黑管音色不同声音特性连续性时间和幅度上都是连续的声波具有普通波所具有的特性反射(reflection)折射(refraction)衍射(diffraction)按照频率分类次音信号(Infrasonic):频率小于20Hz的信号可听音(Audio)信号:频率范围为20Hz~20kHz的信号超声波(Ultrasonic)信号:频率高于20kHz的信号。具有很强的方向性,形成波束。在工业上得到广泛的应用,如超声波探测仪,超声波焊接设备等音频Audio音频中 话音(speech)信号:频率范围为300~3400Hz的信号全频带声音:20-20kHzMusic/Noise在多媒体技术中,处理的信号主要是Audio信号,包括音乐、话音、风声、雨声、鸟叫声、机器声等

人的听力人耳对中频段1~3千赫的声音最为灵敏,对高、低频段的声音,特别是低频段的声音则比较迟钝利用这些特性可以在压缩音频数据时区分对待按照存储方式分类波形声音(存储的是波形)语音音乐效果声合成声音(存储的是命令)MIDI声音信号数字化从模拟过渡到数字数字信号优点精确运算容易可编程模拟信号与数字信号话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的时间上“连续”:指在一个指定的时间范围里声音信号的幅值有无穷多个幅度上“连续”:指幅度的数值有无穷多个模拟信号:在时间和幅度上都是连续的信号数字信号采样(sampling):在某些特定时刻对模拟信号进行测量。离散时间信号:由这些特定时刻采样得到的信号。

离散幅度信号:采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。【例】假设输入电压的范围是0.0V~0.7V,并假设它的取值只限定在0、0.1、0.2,…,0.7共8个值。如果采样得到的幅度值是0.123V,它的取值就应算作0.1V,如果采样得到的幅度值是0.26V,它的取值就算作0.3,这种数值就称为离散数值。数字信号:时间和幅度都用离散数字表示的信号。16声音信号数字化数字化:采样+量化,声音进入计算机的第一步处理编码:压缩量化后的数据量

模拟声音信号量化数字声音01100011001···编码采样采样采样:连续时间的离散化。若每隔相等的一小段时间采样一次,称为均匀采样(uniformsampling)采样点采样采样频率(fs):决定每秒钟需要采集多少个声音样本奈奎斯特定理:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,这叫做无损数字化(losslessdigitization)采样定律采样fs≥2f或者Ts≤T/2,其中f为被采样信号的最高频率。理解奈奎斯特理论:声音信号可以看成由许许多多正弦波组成的,一个振幅为A、频率为f的正弦波至少需要两个采样样本表示,因此,如果一个信号中的最高频率为fmax,采样频率最低要选择2fmax。例如,电话话音的信号频率约为3.4kHz,采样频率就选为8kHz。量化量化(quantization):连续幅度的离散化,就是把信号的强度划分成一小段一小段。如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。量化精度每个采样点样本大小是用每个声音样本的位数bit表示的,它反映度量声音波形幅度的精度。量化精度既决定了取样值的动态范围,也决定着所引入的噪声大小。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65536的范围里,它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。信号噪声比采样精度的另一种表示方法是信号噪声比,简称为信噪比(signal-to-noiseratio,SNR),并用下式计算:

SNR=10log[(Vsignal)2/(Vnoise)2]=20log(Vsignal/Vnoise)Vsignal表示信号电压,Vnoise表示噪声电压;SNR的单位为分贝(db)【例1】假设Vnoise=1,采样精度为1位表示Vsignal=21,它的信噪比SNR=6分贝。【例2】假设Vnoise=1,采样精度为16位表示Vsignal=216,它的信噪比SNR=96分贝。声音的质量根据声音的频带,通常把声音的质量分成5个等级,由低到高分别是:电话(telephone)调幅(amplitudemodulation,AM)广播调频(frequencymodulation,FM)广播激光唱盘(CD-Audio)数字录音带(digitalaudiotape,DAT)的声音声音质量的度量用声音信号带宽来衡量声音的质量:等级由高到低依次是DAT,CD,FM,AM和数字电话。声音客观质量度量:信噪比(signaltonoiseratio,SNR),峰值信噪比PSNR。主观度量声音质量:召集若干实验者,由他们对声音质量的好坏进行评分,求出平均值作为对声音质量的评价。这种方法称为主观平均判分法,所得的分数称为主观平均(meanopinionscore,MOS)分,比较通用的标准是5分制。(类似于评委打分)MOS表

声音质量评分标准分数质量级别失真级别5优(Excellent)无察觉4良(Good)(刚)察觉但不讨厌3中(Fair)(察觉)有点讨厌2差(Poor)讨厌但不反感1劣(Bad)极讨厌(令人反感)声音质量和数据率表

声音质量和数据率质量采样频率(kHz)样本精度(bit/s)单道声/立体声数据率(kB/s)(未压缩)频率范围电话88单道声8200~3400HzAM11.0258单道声11.020~15000HzFM22.05016立体声88.250~7000HzCD44.116立体声176.420~20000HzDAT4816立体声192.020~20000Hz声音质量和数据率数据率=取样频率*量化位数*通道数目例:电话语音=8k*8b*1=64kbps=8kB/s=28MB/h

例:CD的数据率44.1KHz,16bits,228常见的声音文件扩展名文件的扩展名说明AuSun和NeXT公司的声音文件存储格式(8位m律编码或者16位线性编码)aif(AudioInterchange)Apple计算机上的声音文件存储格式cmf(CreativeMusicFormat)声霸(SB)卡带的MIDI文件存储格式MctMIDI文件存储格式mff(MIDIFilesFormat)MIDI文件存储格式mid(MIDI)Windows的MIDI文件存储格式Mp2MPEGLayerI,IIMp3MPEGLayerIIImod(Module)MIDI文件存储格式rm(RealMedia)RealNetworks公司的流放式声音文件格式表

常见的声音文件扩展名常见的声音文件扩展名ra(RealAudio)RealNetworks公司的流放式声音文件格式RolAdlib声音卡文件存储格式snd(sound)Apple计算机上的声音文件存储格式SeqMIDI文件存储格式SngMIDI文件存储格式voc(CreativeVoice)声霸卡存储的声音文件存储格式wav(Waveform)*Windows采用的波形声音文件存储格式WrkCakewalkPro软件采用的MIDI文件存储格式*支持PCM,ADPCM,m率和A率波形声音工具声音工具(audiotools)用来录放、编辑和分析声音文件,声音工具使用相当普遍,但功能相差很大。Windows本身带的“SoundRecorder”声音工具声卡自带工具:声卡一般都附带有声音工具。例如,声霸(SoundBlaster)卡带有几种声音工具,通常要由用户自己安装。其中,功能比较强的是WaveStudio,用户界面如图所示。

声音工具网络上下载的工具:因特网上有许多站点提供试用的或者是免费的声音工具。图所示的是CoolEdit工具,它很受声音研究工作者的欢迎,还有goldwave公司的声音工具,Cakewalk,Cubase等。电子乐器数字接口(MIDI)系统MIDI简介

MIDI(MusicalInstrumentDigitalInterface)电子乐器数字接口,是在音乐合成器(musicsynthesizers)、乐器(musicalinstruments)和计算机之间交换音乐信息的一种标准协议。

MIDI是乐器和计算机使用的标准语言,是一套指令(即命令的约定),它指示乐器即MIDI设备要做什么,怎么做,如演奏音符、加大音量、生成音响效果等。MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其它装置让它产生声音或执行某个动作的指令。MIDI标准的优点生成的文件比较小,因为MIDI文件存储的是命令,而不是声音波形容易编辑,因为编辑命令比编辑声音波形要容易得多可以作背景音乐,因为MIDI音乐可以和其它的媒体,如数字电视、图形、动画、话音等一起播放,这样可以加强演示效果产生MIDI乐音的方法两种方法FM(frequencymodulation)合成法乐音样本合成法,也称为波形表(Wavetable)合成法FM合成声音早期,音乐合成器的先驱RobertMoog采用模拟电子器件生成复杂乐音。20世纪80年代初,美国斯坦福大学(StanfordUniversity)一名叫JohnChowning的研究生发明了一种产生乐音的新方法,称为数字式频率调制合成法(digitalfrequencymodulationsynthesis),简称为FM合成器。把几种乐音的波形用数字来表达,并且用数字计算机而不是用模拟电子器件把它们组合起来,通过数模转换器(digitaltoanalogconvertor,DAC)来生成乐音。工作原理通过组合各种波形参数生成乐音斯坦福大学得到了发明专利,并且把专利权授给Yamaha公司,该公司把这种技术做在集成电路芯片里,成了世界市场上的热门产品。FM合成法的发明使合成音乐工业发生了一次革命。乐音样本合成声音乐音样本的采集:音乐家在真实乐器上演奏不同的音符,选择44.1kHz的采样频率、16位的乐音样本,这相当于CD-DA的质量,把不同音符的真实声音记录下来。乐音样本通常放在ROM芯片上,ROM是超大规模集成电路(verylargescaleintegrated,VLSI)芯片。乐音样本合成器所需要的输入控制参数比较少,可控的数字音效也不多,产生的声音质量比FM合成方法产生的声音质量要高。MIDI系统PC机使用内置的MIDI接口卡,用来把MIDI数据发送到外部的多音色MIDI合成器模块。语音合成(Speechsynthesis)语音合成:利用适当的方法和手段,从文本、概念或意向通过合成产生语音的过程。语音合成的3个层次:从文本到语音的合成(Text-to-Speech,简称TTS)从概念到语音的合成(Concept-to-Speech)从意向到语音的合成(Intention-to-Speech)这三个层次反映了人类大脑中形成说话内容的不同过程,涉及人类大脑的高级神经活动文语转换的要求对合成语音的要求:可理解自然低延迟语速可变声音可变语言可变应用:声讯服务,自动应答,有声电子邮件,残疾人服务,自动配音等.42文本分析与理解文本韵律控制语音生成合成语音一串语音基元语音基元库文本到发音的转换发音标注发音规则库韵律分析韵律控制参数韵律规则库查找拼写错误,对不规范或无法发音的字符进行过滤。分析文本中词或短语的边界,分析文本中的数字、姓氏、特殊字符、专有词语等有关词语读音的性质。根据文本的结构、组成和标点符号,确定发音时语气的变换以及不同音的轻重方式。分析并决定各个音节的声调、语气和停顿方式,发音的轻重、长短等文语转换过程几个TTS系统中国科大讯飞TTS系统

/微软亚洲研究院的木兰系统

/speech/tts/TTS.asp贝尔实验室

/project/tts/mandarin.htmlIBM的ViaVoice数字图像简介图象数据的获取

图象分为静止的图象(通常称图象)和活动的视频静止图象通常是以位映射方法来表示每一点的数据矩阵,许多位图均为24位,它可表达上百万种颜色(224)静止图象的编辑软件常见有Photoshop、ColorIt、Photostyler、PicturePublisher等工具软件绘图软件有许多地方类似,但在画质上较为讲究,功能也较多些增加的功能包括颜色的选择,如15位或24位颜色深度,并增加了光源、调色等功能

图象数据视频是由光线照射在物体上面,反映在照相机或摄象机镜头上,这种反射的光便形成电子信号信号可分3种颜色的合成,即RGB三色图象保存在影片上或计算机的存储器上时,便是以帧来组织的,一般一秒之内可以形成24至30帧,帧越多画质与图象的转变愈平滑国际视频标准

NTSC美国研制,是目前广泛使用的电视制式以525条横扫描线来组成一个屏幕帧,每秒30帧,其图象的改变采用偶数线与奇数线相互交错更新的方式,造成视觉动态图象PAL中国、英国等国采用W.Bruch于1963年发明的,其基本原理类似于NTSC制式。它以625条扫描线,每秒25帧,也是以奇偶数扫描线交错方式造成动态图象国际视频标准SECAM

法国、俄罗斯等国采用SECAM视频同样采用625条线和25帧,但与NTSC和PAL制式相比,其基础的技术是采用频率调制,传播的方式也不同于以上两种图象处理软件Photostyler是美国U-Lead公司开发的真彩色和灰度图象编辑软件,是用户制作处理静止图象常常使用的软件特点:可完成简单的亮度和色彩校正以及复杂的图象编辑,例如图象扫描、校色、滤色、润色、混色、特殊效果及颜色分离支持大量的流行的图象文件格式,如TIFF、TGA、PCX、GIF、BMP等格式,并很容易文件格式转换支持RGB、CMYK、HLS多种彩色模式及灰度图象Photostyler的功能

(1)扫描图象(2)选择和蒙片(3)图象编辑、转换和特殊效果(4)图象合成(5)图象校正和加强(6)绘图和润色工具(7)图象处理过滤器(8)颜色分离打印数字化表示传统上用模拟方式表示声音和图象信息易出故障,常产生噪音和信号丢失,且拷贝过程中噪音和误差逐步积累模拟信号不适合数字计算机加工处理数字化处理:巨大的数据量采样采样定理:仅当采样频率≥2倍的原始信号频率时,才能保证采样后信号可被保真地恢复为原始信号采用8bit数字化,从而1秒钟电视信号的数据量约为99.2Mbits,即约为100Mbps650MB的CD-ROM仅能存约1分钟的原始电视数据。若HDTV(1.2Gbps),一张CD-ROM还存不下6秒钟的HDTV图象采样人说话的音频一般在20Hz到4KHz,即人类语音的带宽为4KHz依据采样定理,设数字化精度为8b,则1秒钟信号量为64Kbits,人讲1分钟话的数据量为480KB数字化处理的关键问题-数据压缩压缩的基础-数据冗余

空间冗余

时间冗余

信息熵冗余结构冗余

知识冗余

视觉冗余

其它冗余

这是静态图像中存在的最主要的一种数据冗余在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性即对同一景物表面上采样点的颜色之间存在着空间连贯性例如:图像中一片连续的区域,其像素为相同的颜色,空间冗余产生空间冗余序列图像(电视图像、动画)和语音数据中所经常包含的冗余一组连续的画面之间往往存在着时间和空间的相关性例如:唱歌的歌手时间冗余信息熵冗余信息熵是指一组数据所携带的信息量,它定义为:H=-∑i=0N-1Pilog2PiN为数据类数或码元个数,Pi为码元yi发生的概率.为使信息编码单位数据量d接近于或等于H,应设:d=∑i=0N-1Pib(yi)b(yi)是分配给码元yi的比特数,理论上应取b(yi)=-log2Pi.实际一般取b(y0)=b(y1)=…=b(yK-1)例如,英文字母编码码元长为7bit,即b(y0)=b(y1)=…=b(yK-1)=7,这样d必然大于H,由此带来的冗余称为信息熵冗余或编码冗余

在某些场景中,存在着明显的分布模式——结构结构可以通过特定的过程来生成例如:方格状的地板,蜂窝,砖墙等结构冗余有许多图像的理解与某些基础知识有相当大的相关性这类规律性的结构可以由先验知识和背景知识得到例如:人脸的图像知识冗余可以根据这些视觉特性来对图象信息进行取舍人类的视觉系统对图像场的敏感性:非均匀和非线性的对亮度变化敏感,而对色度的变化相对不敏感在高亮度区,人眼对亮度变化敏感度下降对物体边缘敏感,内部区域相对不敏感对整体结构敏感,而对内部细节相对不敏感视觉冗余彩色空间常见模型:

RGB彩色空间

HSI彩色空间

YUV彩色空间

YIQ彩色空间RGB彩色空间R,G,B分别代表红(red)、绿(green)、蓝(blue)三色。这是彩色最基本的表示模型通过对R、G、B三个颜色通道的变化以及它们相互之间的叠加可得到各式各样的颜色RGB彩色空间

RGB是计算机系统使用的彩色模型显示器可显示256*256*256=16,777,216种颜色,即24位真彩(TrueColor)

常用的有RGB5:5:5方式和RGB8:8:8方式

RGB5:5:5方式中,用两个字节表示一个像素RGB8:8:8方式中,R、G、B三个分量各占一个字节(8位)HSI彩色空间这种模型中,用H(Hue,色调)、S(Saturation,饱和度)、I(Intensity,光强度)3个分量来表示一种颜色,这种表示更适合人的视觉特性。颜色编辑器方形区域为色度图,可对色度进行调节(包括色调和饱和度)色调值0~2392400亮度0~240饱和度从到条形区域为亮度图,可调节亮度颜色编辑器YUV彩色空间Y为亮度信号,U、V是色差信号(B-Y,R-Y)

PAL制式彩色空间即为YUV。优点是亮度和色差信号分离,容易使彩色电视系统与黑白电视信号兼容国际无线电咨询委员会根据实验认为采用双倍度采样4:2:2方案效果较好,提出CCIR601标准变换公式(YUV<--->RGB)Y=0.299*R+0.587*G+0.114*BU=-0.169*R-0.332*G+0.500*BV=0.500*R+0.419*G-0.081*BYIQ彩色空间广播电视系统另一种常用的亮度与色差分离的模型NTSC制式彩色空间即为YIQY是亮度,I和Q共同描述图象的色调和饱和度。变换公式(YIQ<--->RGB)Y=0.299*R+0.587*G+0.114*BI=0.211*R-0.523*G+0.312*BQ=0.596*R-0.275*G-0.322*B数字图象文件格式

TIFPCXGIF、TGA、BMP、DVI、JPEG等

TIF文件格式由美国AldusDeveloper’sDesk和Microsoft制定结构文件头(8B)参数指针表

参数数据表

图象数据

文件头含字节顺序(2B,表示存贮格式:II-Intel格式;MM—Motorola格式)标记号(2B,版本信息)指向第一个参数指针表的编码(4B)参数指针表由每个长为12B参数块构成,描述压缩种类、长宽、彩色数、扫描密度等参数较长参数(如调色板)只给出指针,参数放在参数数据表中。其结构定义如下TIF文件格式

typedefstruct{inttag-type;intnumber-size;longlength;longoffset;}TIF-FIELD;TIF文件格式PCX文件格式由ZSoft公司最初制定结构文件头(128字节)数据部分(采用行程长度编码)

文件头结构定义

typedefstruct{charmanufacture;/*always0xa0*/charversion;charencoding;/*always1*/charbits-per-pixel;/*colorbits*/intXmin,Ymin;/*imageorigin*/intXmax,Ymax;/*imagedimension*/inthres;/*resolutionvalues*/intvres;charpalette[48];/*colorpalette*/charreserved;charcolor-planes;/*colorplanes*/intbytes-per-line;/*linebuffersize*/intpalette-type;/*greyorcolorpalette*/charfiller[58];}PCXHEAD;PCX文件格式其中Version若为5,文件内有个256色调色板,数据768字节,在文件最后

文件体对像素数据采用行程长度编码,由包含Keybyte和Databyte的包组成分2种情况:若Keybyte最高位为11,则低6位为重复次数(Index),即后一个字节重复使用Index次。但最多重复63次,若再长重建一个包若Keybyte最高位不是11,那么该Databyte按原样写入图象文件。对一个字符的表示用长度为1的包11IndexDatabytePCX文件格式111Databyte常用的数据压缩技术

根据解码后数据与原始数据是否完全一致,数据压缩方法划分为两类:可逆编码(无失真编码)解码图象与原始图象严格相同,压缩大约在2:1到5:1之间。如Huffman编码、算术编码、行程长度编码等。不可逆编码(有失真编码)还原图象与原始图象存在一定的误差,但视觉效果一般可以接受,压缩比可以从几倍到上百倍来调节。常用的有变换编码和预测编码

根据压缩的原理可以有以下分类:预测编码利用空间中相邻数据的相关性来预测未来点的数据。差分脉冲编码调制(DPCM)和自适应差分脉冲编码调制(ADPCM)。变换编码将图象时域信号变换到频域空间上处理。时域空间有强相关的信号,反映在频域上是某些特定的区域内能量常被集中在一起,从而实现压缩.正交变换如离散余弦变换,离散付立叶变换和Walsh-Hadamard变换.量化与向量量化编码为了使整体量化失真最小,就必须依照统计的概率分布设计最优的量化器。已知最优量化器是Max量化器。对象元点进行量化时,也可以考虑一次量化多个点的向量量化。

常用的数据压缩技术

信息熵编码根据信息熵原理,让出现概率大的用短的码字表达,反之用长的码字表示。最常见的方法如Huffman编码、Shannon编码以及算术编码子带编码将图象数据变换到频域后,按频域分带,然后用不同的量化器进行量化,从而达到最优的组合。或者分步渐近编码,随着解码数据的增加,图象逐渐清晰模型编码编码时首先将图象中边界、轮廓、纹理等结构特征找出来,保存这些参数信息。解码时根据结构和参数信息进行合成,恢复出原图象。具体方法有轮廓编码、域分割编码、分析合成编码、识别合成编码、基于知识的编码、分形编码等常用的数据压缩技术

PhotoshopPhotoshop工具箱中存放着各种编辑工具,使用方便控制面板的主要作用是辅助工具栏,更改工具的设置,一些对图层、通道、历史纪录的操作也要在此完成在菜单栏里的窗口选项中可以设置此栏中各项的显示与否,也可用鼠标拖动控制面板中的选项,按自己的习惯组合控制面板状态栏则是用来显示当前图像的有关状态及一些简要说明和提示工具箱的使用

【选框】工具单击【选框】工具不放,会弹出如图所示的隐藏工具面板【选框】工具用于在被编辑图像中选取一个工作区域【SingleRowMarqueeTool(M)】(单行选框)工具是用于选取图像中任一横行象素【SingleColumnMarqueeTool(M)】(单列选框)工具用于选取图像中任一竖行象素工具箱的使用【套索】工具【套索】工具也是重要的选图工具,主要是用于选取不规则区域。【LassoTool(L)】(套索)工具用于手动选择一些极不规则的区域【PolygonalLassoTool(L)】(多边形套索)工具用于选择不规则多边形【MagneticLassoTool(L)】(磁性套索)工具可选择圆滑曲线Photoshop【MagicWandTool(W)】(魔术棒)工具用于选取图像中颜色近似的一个封闭区域双击工具箱中的图标,可以打开相应工具的控制面板,在控制面板里可以修改颜色的容差以决定选取色域的大小【TypeTool(T)】(文本)工具【TypeTool(T)】(文本)工具用于在图像中添加文字,实心的代表生成文字时会生成文字图层空心的代表生成文字时只在本层生成文字选区有“↓”标记的表示竖直排版无“↓”标记的表示横向排版常用的着色工具:【AirbrushTool(J)】(喷枪)【PaintbrushTool(B)】(画笔)滤镜(Filter)

滤镜是一些专门设计用于生成图像特殊效果的工具使用滤镜工具时所受的限制:在位图、索引图、48位RGB图、16位灰度图等色彩模式下,不允许使用滤镜工具;在CMYK、Lab等模式下,不允许使用画笔描边、素描、视频、纹理、艺术效果等五种滤镜工具一般情况下,我们提倡用RGB模式编辑图像,这样就可不受阻碍的使用滤镜工具了。滤镜(Filter)滤镜工具的使用方法:用选择工具选择欲应用滤镜的图像区域(不选择时,滤镜默认对本层全图进行操作)。单击菜单栏里的【Filter】菜单,选择滤镜组的名称,打开子菜单项。单击子菜单项中带有省略号“…”的选项,将会打开滤镜对话框;若单击没有省略号“…”的选项便会直接进行滤镜变化而不出现任何提示。若打开对话框,可在对话框中设置各项参数及选项,如果选择对话框中的“预览”复选框,还可以进行预览。决定好效果后便可点“OK”按钮,将滤镜应用到图像中。图层(Layer)

图层就好像把很多层画叠加在一起,编辑修改都可分别进行一个图像文件最多可设置100个图层蒙版通道

蒙版与选择区域相似,不同的是当图像加上了蒙版后,蒙版蒙住的图像区域将受到保护,所做的各种操作只影响没被蒙上的区域蒙版由一个灰度图来表示,黑色表示图像中没被选择的部分,白色表示被选择了的部分,而不同层次的灰度表示蒙住的程度(即羽化效果),我们可以在灰度图里使用各种工具为图像制出选区蒙版通道图像文件的格式转换

PSD格式:它是Photoshop软件的缺省文件格式。它支持所有文件类型,能保存没有合并的图层和通道,蒙版等信息。但缺点是很少有其它的图像软件能读取这种格式,且存盘容量极大JPEG:它是一种有损压缩,是较有效常用的一种压缩格式,Photoshop5.5支持11级压缩程度:0是图像文件最小,图像质量最低;12是质量最高,但文件最大。一般我们会选择5级以上来保证图像质量TIFF格式:用于应用软件交换的文件格式,它是一种无损压缩方式BMP格式:它是Windows下使用的标准图像文件格式。存盘时,可以选择是“Windows”格式还是“OS/2”格式,选择1、4、8、24位四种形式,选择4位、8位的话,还可以设置RLE方式进行压缩,这种压缩方式对图像毫无损伤图像文件的格式转换图形和动画图形数据

计算机图形学是研究怎样用计算机生成、处理和显示图形的一门学科。它着重讨论怎样将数据和几何模型变成可视的图象;或对自然界已存在对象通过获取相关数据建立几何模型生成的图象,以便于分析处理。图形的显示形式也称为图象,但和一般意义的图象处理技术不同,后者侧重于将客观世界中原来存在的物体映象处理成新的数字化图象,关心问题是如何滤掉噪声、压缩数据、提取特征、三维重建等内容。在多媒体数据中,无法从客观世界直接摄取的可视信息,就可用图形技术来制作,这些数据主要包括文字、图形、动画。

图形包括二维空间及三维空间图形,其中二维图形仅能表现图形中各部分简单的位置关系三维图形经真实感处理,将使图形能表达出空间、位置、材质、明暗等接近自然的真实感效果。动画是图形对象赋予运动属性后制作的连续画面效果,需要专门的软件工具制作。图形数据

图形数据图形文件的格式通过图形原语和它们的属性来描述。图形本身决定了哪些原语被支持,诸如线型、线宽、颜色之类的属性影响着图形画面的输出。这种表示需要在图形显示时被转换成低级图象的点阵。高级原语的优点是减少了存储每幅图象需要的数据,容易操纵图形图象,缺点是需要更多的步骤来将图形原语及其属性转换成它的图象象素。

对图形软件开发产生广泛影响的标准有PHIGS,GKS和OPENGL等。计算机动画计算机动画(ComputerAnimation)是用计算机生成一系列可供实时演播的连续画面的技术,它可把人们的视觉引向一些客观不存在或做不到东西,并从中得到享受。计算机动画是使用计算机作为工具来产生动画的技术,计算机在动画制作过程中起着大量的不同的作用,表现在画面创建、着色、录制、特技剪辑、后期制作等各个环节。

基本概念在过去几十年里,计算机动画一直是人们研究的热点在全球的图形学盛会Siggraph上,几乎每年都有计算机动画的论文和专题随着计算机图形学和硬件技术的高速发展,可以用计算机生成高质量的图像,促使计算机动画技术飞速地发展起来应用领域计算机动画的应用领域十分广泛影视作品制作科学研究视觉模拟电子游戏工业设计教学训练军事仿真过程控制平面绘画建筑设计...动画发展的历史

1831年,法国人JosephAntoinePlateau把画好的图片按照顺序放在一部机器的圆盘上,圆盘可以在机器的带动下转动。这部机器还有一个观察窗,用来观看活动图片效果。在机器的带动下,圆盘低速旋转。圆盘上的图片也随着圆盘旋转。从观察窗看过去,图片似乎动了起来,形成动的画面,这就是原始动画的雏形。1906年,美国人JSteward制作出一部接近现代动画概念的影片,片名叫“滑稽面孔的幽默形象”(HumorousPhaseofaFunnyFace)。1908年法国人EmileCohl首创用负片制作动画影片。所谓负片,是影象与实际色彩恰好相反的胶片,如同今天的普通胶卷底片。采用负片制作动画,从概念上解决了影片载体的问题,为今后动画片的发展奠定了基础。我国民间的走马灯和皮影戏,可以说是动画的一种古老形式。

动画发展的历史

1909年,美国人WinsorMccay用一万张图片表现一段动画故事,这是迄今为止世界上公认的第一部象样的动画短片。从此以后,动画片的创作和制作水平日趋成熟,人们已经开始有意识的制作表现各种内容的动画片1915年,美国人EerlHurd创造了新的动画制作工艺,他先在塑料胶片上画动画片,然后再把画在塑料胶片上的一幅幅图片拍摄成动画电影。多少年来,这种动画制作工艺一直被沿用着。动画发展的历史

从1928年开始,世人皆知的WaltDisney逐渐把动画影片推向了颠峰。他在完善动画体系和制作工艺的同时,把动画片的制作与商业价值联系了起来,被人们誉为商业动画之父。直到如今,他创办的迪斯尼公司还在为全世界的人们创造出丰富多彩的动画片。“迪斯尼”----20世纪最伟大的动画公司。

动画发展的历史

什么是动画

动画是通过连续播放一系列画面,给视觉造成连续变化的图画。基本原理与电影、电视一样,都是视觉原理。医学已证明,人类具有“视觉暂留”的特性,就是说人的眼睛看到一幅画或一个物体后,在1/24秒内不会消失。利用这一原理,在一幅画还没有消失前播放出下一幅画,就会给人造成一种流畅的视觉变化效果。●早期的动画动画原理观看动画的机器-1906●

视觉效果教学进程动画的特点动画是指把一些原本没有生命(不活动)的东西,经过制作成影片(或电视)并放映后,成为有生命的东西。因此.广义的动画包含了“剪纸片”木偶片”等艺术形式。在中国它们也被称为“美术片”或“卡通片”。它们有两个最重要的特征:它们的影像是用电影胶片或录影带以逐格记录的方式制作出来的。这些影像的“动作”是利用设计者的想像和虚幻创造出来的,而不是原本就存在再被摄影机记录下来的景物。在动画片的制作中,研究物体怎样运动(包括他们运动的轨迹、方向,以及所需的时间)的意义,远大于对单张画面安排的考虑。所以相对每一格画面来说,我们应该更关心“每一格画面与下一格画面之间所产生的效果”。动画大师诺曼.麦克拉伦(NormanMclaren)说:动画不是“会动的画”的艺术,而是“画出来的运动”的艺术。

动画的特点动画的本质动作的变化是动画的本质

——英国动画大师JohnHalas●传统动画分类(1)全动画——为追求画面完美和动作流畅,按照24帧/s制作动画(2)半动画——又名“有限动画”。为追求经济效益,6帧/s的动画●传统动画的性质——由多幅画面构成,称为“帧动画”Frame1Frame2Frame3Frame4Frame5Frame6Frame7动画的分类从制作技术和手段看,动画可分为以手工绘制为主的传统动画和以计算机为主的电脑动画。按动作的的表现形式来区分,动画大致分为接近自然动作的“完善动画”(动画电视)和采用简化、夸张的“局限动画”(幻灯片动画)。从空间的视觉效果上,可分为平面动画(《小虎还乡》)和三维动画(《最终幻想》)。从播放效果上,可以分为顺序动画(连续动作)和交互式动画(反复动作)。从每秒放的幅数来讲,有全动画(每秒24幅)(迪斯尼动画)和半动画(少于24幅)(三流动画)之分,中国的动画公司为了节省资金往往用半动画做电视片。动画的分类动画的变化动作的变化物体位置的变化物体形态的变化颜色的变化材料质地的变化光线强弱的变化动画的制作过程(1)制作声音对白和背景音乐(2)制作关键画面(3)绘制动画画面(4)复制到胶片上(5)上色(6)核实检查动画画稿(7)拍摄电影胶片(8)后期制作传统动画的制作过程

总体设计阶段

1)剧本。任何影片生产的第一步都是创作剧本,但动画片的剧本与真人表演的故事片剧本有很大不同。一般影片中的对话,对演员的表演是很重要的,而在动画影片中则应尽可能避免复杂的对话。在这里最重的是用画面表现视觉动作,最好的动画是通过滑稽的动作取得的,其中没有对话,而是由视觉创作激发人们的想象。

2)故事板。根据剧本,导演要绘制出类似连环画的故事草图(分镜头绘图剧本),将剧本描述的动作表现出来。故事板有若干片段组成,每一片段由系列场景组成,一个场景一般被限定在某一地点和一组人物内,而场景又可以分为一系列被视为图片单位的镜头,由此构造出一部动画片的整体结构。故事板在绘制各个分镜头的同时,作为其内容的动作、道白的时间、摄影指示、画面连接等都要有相应的说明。一般30分钟的动画剧本,若设置400个左右的分镜头,将要绘制约800幅图画剧本--故事板。3)摄制表。摄制表是导演编制的整个影片制作的进度规划表,以指导动画创作集体各方人员统一协调地工作。

传统动画的制作过程

设计制作阶段

1)设计。设计工作是在故事板的基础上,确定背景、前景及道具的形式和形状,完成场景环境和背景图的设计、制作。对人物或其他角色进行造型设计,并绘制出每个造型的几个不同角度的标准页,以供其他动画人员参考。

2)音响。在动画制作时,因为动作必须与音乐匹配,所以音响录音不得不在动画制作之前进行。录音完成后,编辑人员还要把记录的声音精确地分解到每一幅画面位置上,即第几秒(或第几幅画面)开始说话,说话持续多久等。最后要把全部音响历程(或称音轨)分解到每一幅画面位置与声音对应的条表,供动画人员参考。

传统动画的制作过程

具体创作阶段

1)原画创作。原画创作是由动画设计师绘制出动画的一些关键画面。通常是一个设计师只负责一个固定的人物或其他角色。

2)中间插画制作。中间插画是指两个重要位置或框架图之见的图画,一般就是两张原画之间的一幅画。助理动画师制作一幅中间画,其余美术人员再内插绘制角色动作的连接画。在各原画之间追加的内插的连续动作的画,要符合指定的动作时间,使之能表现得接近自然动作。

传统动画的制作过程

3)誉清和描线。前几个阶段所完成的动画设计均是铅笔绘制的草图。草图完成后,使用特制的静电复印机将草图誉印到醋酸胶片上。再用手工给誉印在胶片上的画面的线条进行描墨。

4)着色。由于动画片通常都是彩色的。这一步是对描线后的胶片进行着色(或称上色)。传统动画的制作过程

拍摄制作阶段1)检查。检查是拍摄阶段的第一步。在每一个镜头的每一幅画面全部着色完成之后,拍摄之前,动画设计师需要对每一场景中的各个动作进行详细的检查。

2)拍摄。动画片的拍摄,使用中间有几层玻璃层、顶部有一部摄象机的专用摄制台。拍摄时将背景放在最下一层,中间各层放置不同的角色或前景等。拍摄中可以移动各层产生动画效果,还可以利用摄象机的移动、变焦、旋转等变化和淡入等特技上的功能,生成多种动画特技效果。

传统动画的制作过程

3)编辑。编辑是后期制作的一部分。编辑过程主要完成动画各片段的连接、排序、剪辑等。

4)录音。编辑完成之后,编辑人员和导演开始选择音响效果配合动画的动作。在所有音响效果选定并能很好地与动作同步之后,编辑和导演一起对音乐进行复制。再把声音、对话、音乐、音响都混合到一个声道上,最后记录在胶片或录象带上。传统动画的制作过程

集体项目一部长篇动画片的生产需要许多人员,有导演、制片、动画设计人员和动画辅助制作人员。动画辅助制作人员是专门进行中间画面添加工作的,即动画设计人员画出一个动作的两个极端画面。动画辅助人员则画出它们中间的画面。画面整理人员把画出的草图进行整理。描线人员负责对整理后画面上的人物进行描线着色人员把描线后的图着色。由于长篇动画制作周期较长,还需专职调色人员调色,以保证动画片中某一角色所着色前后一致。此外还特技人员、编辑人员、摄影人员及生产人员和行政人员。计算机动画(电脑动画)计算机动画的发展计算机动画是指用计算机技术辅助制作影视动画片它的发展过程大体上可分为三个阶段60年代美国的Bell实验室和一些研究机构就开始研究用计算机实现动画片中间画面的制作和自动上色。这些早期的计算机动画系统基本上是二维辅助动画系统(ComputerAssistedAnimation),也称为二维动画。1963年美国贝尔实验室语言编写了一个称为BEFLIX的二维动画制作系统,这个软件系统在计算机辅助制作动画的发展历程上具有里程碑的意义。第二个阶段是从20世纪70-80年代中期,计算机图形、图像技术的软、硬件都取得了显著的发展,使计算机动画技术日趋成熟,三维辅助动画系统也开始研制并投入使用。三维动画也称为计算机生成动画(ComputerGeneratedAnimation),其动画的对象不是简单地由外部输入,而是根据三维数据在计算机内部生成的。1982年迪士尼(Disney)推出第一部电脑动画的电影,就是Tron(中文片译“电脑争霸”),使计算机动画成为计算应用的新领域。1982至1983年间,麻省理工学院(MIT)及纽约技术学院同时利用光学追踪(OpticalTracking)技术记录人体动作;演员穿戴发光物体于身体各部份,在指定之拍摄范围内移动,同时有数部摄影机拍摄其动作,然后经电脑系统分析光点的运动再产生立体活动影像。计算机动画的发展第三个阶段是从1985年到目前为止的飞速发展时期,是计算机辅助制作三维动画的实用化和向更高层次发展的阶段。在这个阶段中,首先是由美国的犹他大学开发出世界上第一个完整的且具有实用意义的三维动画片。在随后的十年内,计算机辅助三维动画的制作技术有了质的变化,已经综合集成了现代数学、控制论、图形图像学、人工智能、计算机软件和艺术的最新成果。以致于有人说:“如果想了解信息技术的发展成就,就请看计算机三维动画制作的最新作品吧!”计算机动画的发展计算机动画目前计算机动画已经发展成一个多种学科和技术的综合领域,以计算机图形学,特别是实体造型和真实感显示技术(消隐、光照模型、表面质感等)为基础,涉及到图像处理技术、运动控制原理、视频技术、艺术甚至于视觉心理学、生物学、机器人学、人工智能等领域,它以其自身的特点而逐渐成为一门独立的学科。计算机动画关键技术计算机动画的关键技术体现在计算机动画制作软件及硬件上。动画制作软件是由计算机专业人员开发的制作动画的工具,使用这一工具不需要用户编程,通过简单的交互式操作就能实现计算机的各种动画功能。不同的动画效果,取决于不同的计算机动画软、硬件的功能。从另一方面看,动画的创作本身是一种艺术实践,动画的编剧、角色造型、构图、色彩等的设计需要高素质的美术专业人员才能较好地完成。总之,计算机动画制作是一种高技术、高智力和高艺术的创造性工作。

视频与动画的区别动画(Animation)和视频(Video)都是由一系列的静止画面按照一定的顺序排列而成的,这些静止画面称为帧(frame),每一帧与相邻帧略有不同。当帧画面以一定的速度连续播放时,由于是视觉暂留现象造成了连续的动态效果。计算机动画和视频的主要差别类似图形与图像的区别,即帧图像画面的产生方式有所不同。计算机动画是用计算机产生表现真实对象和模拟对象随时间变化的行为和动作,是利用计算机图形技术绘制出的连续画面,是计算机图形学的一个重要的分支;数字视频主要指经过模拟信号源经过数字化后的图像和同步声音的混合体。目前,在多媒体应用中有将计算机动画和数字视频混同的趋势。视频与动画的区别帧动画——模拟以帧为基本单位的传统动画,占动画产品的98%平面动画——以传统平面绘画为基础的动画颜色动画——形成颜色流动效果的动画变形动画——主体变形效果的动画矢量动画——经过电脑运算而确定的运行轨迹和形状的动画空间动画——形成三维造型并进行空间运动的动画电脑动画的种类计算机动画的原理与传统动画基本相同,只是在传统动画的基础上把计算机技术用于动画的处理和应用。计算机动画是指采用图形与图像的数字处理技术,借助于编程或动画制作软件生成一系列的景物画面,其中当前帧画面是对前一帧的部分修改。运动是动画的要素,计算机动画是采用连续播放静止图像的方法产生景物运动的效果。运动不仅指景物的运动,还包括虚拟摄像机的运动、纹理、色彩的变化等,输出方式也多种多样。计算机动画所生成的是一个虚拟的世界,画面中的物体并不需真正去建造,物体、虚拟摄像机的运动也不会受到什么限制,动画师几乎可以随心所欲地编织他的虚幻世界。计算机动画的特点由多帧连续图像组成的动画效果

关键帧(原画)的产生

关键帧以及背景画面,可以用摄象机、扫描仪、数字化仪实现数字化输入,用扫描仪输入铅笔原画,再用电脑生产流水线后期制作,也可以用相应软件直接绘制。动画软件都会提供各种工具、方便绘图。这大大改进了传统动画画面的制作过程,可以随时存储、检索、修改和删除任意画面。传统动画制作中的角色设计及原画创作等几个步骤,一步就完成了。中间画面的生成

利用电脑对两幅关键帧进行插值计算,自动生成中间画面,这是电脑辅助动画的主要优点之一。这不仅精

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论