版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE27-《多媒体技术》考试备考必背知识点汇总第一章多媒体技术引论媒体:存储信息的实体;传递信息的载体媒体分类:感觉媒体,表示媒体,显示媒体,传输媒体,存储媒体感觉媒体:能直接作用于人们感觉器官,从而能使人产生直接感觉的媒体,自然界的各种声音、图像、动画、文本表示媒体:为了传输感觉媒体而人为研究出来的媒体。各种编码显示媒体:用于通信中使电信号和感觉媒体之间产生转换用的媒体。输入输出设备存储媒体:用于存放某种媒体的媒体。纸张,光盘,磁盘,磁带传输媒体:用于存放某些媒体的媒体。电话线、光纤、电缆多媒体计算机技术:计算机综合处理多种媒体信息,文本、图形、图形、音频和视频,使多种信息建立逻辑连接,集成为一个系统并具有交互性多媒体计算机特征:多维化、集成性、交互性、数字化、实时性多媒体信息系统:指利用计算机技术和数字通信网技术来处理和控制多媒体信息的系统多媒体计算机的相关技术:数据压缩与编码技术;多媒体专用芯片技术;多媒体数据存储技术;多媒体输入输出技术;多媒体系统软件技术;超文本和web技术;多媒体应用开发和编著技术;多媒体通讯技术;虚拟现实技术(沉浸、交互、构想)超文本最基本的:结点、链、网络多媒体技术的应用领域:教育与培训;网络及通信;电子出版物;商业;家庭多媒体多媒体技术是将(计算机技术、视听技术、通信技术)融合在一起的新技术多媒体技术交互式应用的高级阶段是(虚拟现实技术)第二章多媒体计算机系统组成结构多媒体计算机系统层次结构:硬件系统,软件系统,接口层,著作工具,应用系统多媒体个人计算机标准:MPC1,MPC2,MPC3CD-ROM单倍速150KB/S;DVD单倍速整个硬件的发展过程:先有板级产品,第二步是设计专用芯片,第三步是将CPU芯片外的功能集成到CPU芯片内CPU内部总线:地址总线、指令总线、数据总线、控制总线我们通常所说的内存实际上是指(RAM的容量)磁存储的工作原理?完成磁存储的关键部件是磁头。磁头的基本结构是在一个环形导磁体上绕上线圈,导磁体面向磁盘方向开一个漏磁缝隙,当磁头线圈中通以交变信号电流时,导磁体内的磁通亮也随着变化,这个交变的磁场从磁头缝隙中泄漏出去,使做匀速运动的磁盘表面上的磁介质感应磁化。磁化后在磁盘上的“磁化点”就代表了所要记录的数据。软盘:3.5英寸,容量为1.44MB,有80个磁道,最内圈为0磁道,18个扇区显示卡即显示适配器,按照图形显示模式分为:VL模式、PCI模式、AGP模式显示卡种类:一般显示卡、图形加速卡、3D图形卡、显示/TV集成卡、显示/视频输出集成卡显示器:传统的CRT(阴极射线管)显示器,LCD(液晶)显示器,KDP(等离子)显示器显示器屏幕尺寸:显像管尺寸(显像管正面对角线的长度)、可视尺寸(显示器可显示区域对角线的长度)、光栅尺寸(显像管最大扫描区域的尺寸,即分辨率)点距:显示器上最小发光单位是像素点,像素点是电子束穿过荧光屏内侧钢板上的荫罩孔激发荧光物质而形成的,同像点之间的距离为点距,单位为毫米扫描频率:显示器的显示器件是显像管,显像管在工作时,电子束顺序高速扫描整个屏幕,使人们看到近似连续的显示信息。扫描频率越高,显示质量越好,图像越稳定显示分辨率:显示器的显示分辨率是一组标称值,以像素点为基本单位颜色数量:指显示器同屏显示的颜色数量,它主要由显示适配器决定音频卡又叫声卡,声音适配器音频卡的关键技术:数字音频、音乐合成、MIDI音频卡的功能:数字音频的播放;录制生成WAVE文件;MIDI和音乐合成;多路音源的混合和处理声卡芯片的技术分类(选/填):8位单声道、8位立体声、通常的16位立体声、多通道16为立体声、24位立体声音效芯片的技术指标(选):声道数、采用的总线形式、MIDI合成方式、立体声音效为什么能用几个扬声器回放出接近于真实世界的各种声音和音乐效果?简单的说人耳类似于两个拾音器,单个拾音器无法分辨声音的方向和距离,只能判断声音在各种频率下的大小和声音在各个频率下的时间先后。在有两个拾音器的简化模型中,人只能通过两耳听到的声音的大小差异和时间差异来分辨出声源的远近和方位,而且仅仅是从左到右的180。内的方位,所以单凭这个模型理论尚无法分辨前后方向的差异计算机是如何使我们分辨出前后上下的声音呢?是头部相关传递函数算法,该算法模拟了耳朵对从空间各个方向传来的声音的不同感受。耳廓的奇异形状加上外中内耳通道的结构和周围头部组织的各种异形结构对不同方向的声音有着不同的机械滤波作用,外来声音的幅频和相频特性的频谱结构在不同的方向上各不同7.1声道音箱的摆放及包含的东西?前左、前右、后左、后右、左环绕、右环绕、重低音摄像头具有(视频捕获)功能摄像头的性能指标:镜头(核心)、像素、接口、视频捕获能力、调焦能力镜头的感光元器件:电荷耦合器件CCD、CMOS数码相机的工作原理?(1)当按下快门时,镜头将光线汇聚到感光器件CCD上。CCD是半导体器件,代替了普通相机中胶卷的位置,它的功能是把光信号转变为电信号。于是得到对应于拍摄景物的模拟信号的电子图像(2)由A/D(模数转换器)器件将得到的模拟信号的电子图像转换成数字信号(3)MPU(微处理器)对数字信号进行压缩并转化为特定的图像格式,例如JPEG格式(4)最后,图像文件被存储在内置存储器中。至此,数码相机的主要工作已经完成,剩下要做的是通过LCD查看拍摄到的照片。有些数码相机为扩大存储容量而使用可移动存储器,如PC卡或者SD卡。此外,还提供了连接到计算机和电视机的接口扫描仪是一种(图形输入设备)。由光源、光学镜头、光敏元件、机械移动部件和电子逻辑部件组成。主要用于输入黑白或彩色图片资料、图形方式的文字资料等平面素材。扫描仪接口形式:EPP形式、SCSI形式、USB形式扫描仪分类:手动式、平面式、滚筒式、胶片扫描分辨率的单位是dpi,每英寸能分辨的像素点。分辨率越大,扫描的清晰度越高扫描分辨率分为:物理分辨率和光学分辨率打印机:针式打印机、喷墨打印机、激光打印机、热升华打印机、热蜡打印机激光打印机基本工作原理:是由计算机传来的二进制数据信息,通过视频控制器转换成视频信号,再由视频接口/控制系统把视频信号转换为激光驱动信号,然后由激光扫描系统产生载有字符信息的激光束,最后由电子照相系统使激光束成像并转印到纸上。激光打印机内部有一个叫光敏旋转的硒鼓的关键部件,当激光照到光敏旋转硒鼓上时,被照到的感光区域可产生静电,能吸起碳粉等细小的物质。激光打印机的工作步骤如下:(1)打印机以一定的方式,驱动激光扫射光敏旋转硒鼓,硒鼓旋转一周,对应打印机打印一行(2)硒鼓通过碳粉,将碳粉吸附到感区域上(3)硒鼓转到与打印纸接触,将碳粉附在纸上(4)利用加热部件使碳粉熔固在打印纸上面光盘存储的主要特点:记录密度高;存储容量大;采用非接触方式读/写信息;信息保存时间长;不同平台可以互换;多种媒体融合;价格低廉光盘存储容量<以磁介质为存储的硬盘容量光盘的读写能力分类:只读光盘、一次性写入光盘、可重复擦写光盘光学存储的原理?是当光束照射在存储单元上时,其反射率随着所存储数据(“0”或“1”)的不同而变化。最常用的方法是使反射光的极化方向随着数据的不同而改变,然后再通过光学的方法,使得照射在光电检测器上的光强度也发生相应的变化,光电检测器能够区分出照射在其中的光强变化,故能读出存储单元究竟存储了什么数据,并以电信号形式表示出来CD盘片结构盘面三分区:导入区、导出区、声音数据记录区红皮书——激光唱盘标准;黄皮书——CD-ROM标准;黄皮书的扩充——CD-ROM/XA标准;橙皮书——可录CD盘标准;白皮书——VCD标准;DVD标准蓝光光碟的命名是由于其采用波长405纳米(nm)的蓝色激光光束来进行读写操作D5单面单层——4.7GB;D9:单面双层——8.5GB;D10双面单层——9.4GB;D14双面多层——13GB;D18双面双层——17GB;光学读出头是光驱的心脏,也是最精密的部分,它主要负责数据的读取工作。它由光电检测器、透镜、激光束分离器、激光器等元件组成。激光器发出的激光经过几个透镜聚焦后到达光盘,从光盘上反射回来的激光束沿原来的光路返回,到达激光束分离器后反射到光电检测器,由光电检测器把光信号变成电信号,再经过电子线路处理后还原成原来的二进制数据只读光盘如何记录“0”和“1”?(工作原理)光盘上压制了许多凹坑,激光束在凹坑部分反射的光的强度,要比从非凹坑部分反射的光的强度来得弱,光盘就是利用这个极其简单的原理来区分“1”和“0”的。凹坑的边缘代表“1”,凹坑和非凹坑的平坦部分代表“0”,凹坑的长度和非凹坑的长度代表有多少个“0”。注意:凹坑和非凹坑本身不代表“1”和“0”,而是凹坑端部的前沿和后沿代表“1”,凹坑和非凹坑的长度代表“0”的个数,利用这种方法比直接用凹坑和非凹坑代表原始二进制数据的“0”和“1”更有效,可以更充分地利用光盘表面积,使得存储容量大大提高。此外,采用这种技术也很容易从读出信号中提取有用的同步脉冲信号。DVD光盘的规格主要分为下列几类:DVD-ROM:只读型数字多功能光盘;DVD-Video:数字影音光盘;DVD-Audio:数字音响光盘;DVD-R:可读写数字多功能光盘;DVD-RAM:可重复读写数字多功能光盘康宝COMBO光存储技术第一代:CD刻录机与DVD光驱合为一体第二代(现在):DVD刻录机与蓝光光驱合为一体CD-ROM单倍速150KB/S;DVD-ROM单倍速1385KB/S多媒体软件:驱动程序、支持多媒体的操作系统或操作环境、多媒体数据编辑创作软件和多媒体系统开发工具软件驱动程序的安装方法:(1)可执行驱动程序安装法(2)手动安装驱动法(3)其他设备驱动安装方式第三章数字音频信息处理音频信号:语音信号和非语音信号音频主要分为:波形文件,语音,音乐 模拟音频信号重要参数:频率和幅度频率(单位是Hz/KHz)体现音调的高低;声波的幅度(dB分贝)大小体现声音的强弱亚音——频率小于20Hz的信号;超音频——高于20KHz的信号;音频(人耳听到的声音)——20Hz到20KHz;人的语音信号频率——33Hz到3000Hz音高:是人对声波频率的主观属性,它首先与声波的频率有关。声波的频率越高,人耳听到的声音就越高,反之亦然,它们之间并非线性关系音色:是声波波形的主观属性。不同的发声体所发出的音波都有自己的特异性。声波的类型是多种多样的,一般可分为纯音和复合音语音:是特殊的复合音,由原音和辅音组成响度:是声波振幅的主观属性,它是由声波的振幅引起的。振幅越大,响度越大,它们之间并非线性关系声音质量的评价:主观(人耳)和客观(利用仪器)信噪比SNR:是有用信号与噪声之比的简称,单位是分贝(dB)。信噪比越高表示音频质量越好。声音质量等级:数字激光唱片质量(CD-DA质量);调频无线电广播(FM质量);调幅无线电广播(AM质量);电话质量香农采样定理:在一定条件下,用离散的序列可以完全代表一个连续函数采样:为实现A/D转换,需要把模拟音频信号波进行分割,以转换成数字信号,这种方法称为采样采样过程:是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。奈奎斯特理论:只有采样频率高于声音最高频率的两倍时,才能把数字信号表示的声音还原为原来的声音f采>=2f原(实质)为什么CD音频的最低采样频率是44100次/s?因为人耳能听见的最高声音频率为20KHz,为了避免高于20KHz的高频信号干扰采样,在进行采样之前,需要对输入的声音信号进行滤波。考虑到滤波器在20KHz处大约有10%的衰减,因此再将其提高10%成为22KHz。这个值再乘以2就得到44KHz的采样频率。但是。为了能与电视信号同步,PAL电视的场扫描为50Hz,NTSC电视的场扫描为60Hz,所以取50和60的整倍数,选用了44100Hz作为激光唱盘声音的采样标准量化:通常把对声波波形幅度的数字化称为量化量化以8bit或16bit方式划分纵轴。28=256,216=65536编码:就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有效的数据中加入一些用于纠错、同步和控制的数据声音信号能进行压缩编码的基本依据?(1)声音信号中存在着很大的冗余度,通过识别和去除这些冗余度,便能达到压缩的目的(2)音频信息的最终接受者是人,人耳听觉中有一个重要特点,即听觉的“屏蔽”。它是指一个强音能抑制一个同时存在的弱音的听觉现象。利用该特性,可以抑制与信号同时存在的量化噪音(3)对声音波形采样后,相邻样值之间村子着很强的相关性PCM编码:是对连续语音信号进行空间采样、幅度量化及用适当码字将其编码总称PCM编码分类:均匀量化PCM、非均匀量化PCM、自适应量化PCM均匀量化:采用相等的量化间隔对采样得到的信号做量化非均匀量化:让量化级高度随信号幅度而变化MP3是MPEG的算法第三层,它的音频压缩技术的传输率为每声道32kb/s-448kb/s数字音频的文件格式:RealAudio文件-.RA/.RM/.RAM,AIFF文件-.AIF/.AIFFWAV,VOC,MP3,MIDI:是数字音乐接口的缩写。是用来连接电子乐器,或将MIDI设备与电脑连接成系统的一种通信协议。MIDI数据不是数字音频波形,而是音乐代码或电子乐谱MIDI的组成:多媒体计算机,合成器,音序器,音源,MIDI键盘,录音设备,监听设备利用合成器产生MIDI乐音的主要方式:FM合成法,波表合成法波表合成法:就是把真实乐器发出的声音以数字的形式记录下来,播放时根据命令生成各种音阶的音符,产生的声音质量比FM合成方法产生的声音质量高很多VCD存储文件*.DAT;DVD存储文件*.VOB第四章静态图像信息处理色彩三要素:色调,亮度,饱和度色调:是当人眼看到的一种或多种波长的光时所产生的彩色感觉,它反映了颜色的种类,简单说色调就是颜色,如红色、蓝色。亮度:是色彩的明暗程度,它和色彩吸收光线的程度有关。饱和度:也称为纯度或对比度,用来表示色彩浓或淡的程度,即颜色掺入白色光的程度。饱和度越大,颜色越鲜艳。计算机显示时采用RGB模型;彩色电视信号传输时采用YUV模式;打印输出彩色图像时采用CMYK模式。RGB模式是最基本的颜色模式,最终输出一定要转换成RGB彩色空间。是相加模型。HIS模式中H——色调,I——光的亮度或强度,S——饱和度。CMY模式由C青,M品红,Y黄,是颜色相减模式。CMYK,K——黑色。应用于彩色打印、复印。YUV模式和YCrCb模式应用于数字电视系统。数字图像种类:矢量图,点阵图(位图)。矢量图:是以一组指令的形式存在。这些指令描述了一幅图中所包含的直线、曲线、圆、矩形、圆弧等的位置坐标、大小和形状等参数,也可以用更加复杂的形式表示图像中的曲面、光照、材质等效果点阵图:又叫位图,它是把一幅图划分为M行*N列,行与列的交点处为一个像素,把一幅彩色图分为M*N个像素点,每个像素点用若干个二进制位来表示该像素的颜色、亮度和属性。图像分辨率:是数字化图像的大小,以水平和垂直的像素点表示。是组成一幅图像的像素数目。单位是dpi。扫描分辨率:是每英寸扫描得到的点,单位是dpi。打印分辨率:表示一台打印机输出图像的技术指标,由打印头每英寸输出的点数决定,单位是dpi。颜色深度:即像素的所有分量的二进制位数之和,它决定了不同颜色的最大数目,或者确定灰色图像的每个像素的灰度级别。图像文件的体积计算;s=(h*w*c)/8体积=(行像素数*列像素数*颜色深度)/8真彩色:指在组成一幅彩色图像的每个像素值中,有R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。伪彩色:每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表的表项入口地址,去查找一个显示图像时使用的R、G、B值,用查找出的R、G、B值产生的彩色称为伪彩色。直接色:每个像素值分成R、G、B分量,每个分量作为单独的索引值对它做变换,也就是通过相应的彩色变换表找出基色强度,用变换后得到的R、G、B强度值产生的彩色称为直接色。图形的特点:eq\o\ac(○,1)计算机对矢量图的表达实质上用数学方法描述一幅图,记录的是许多数学表达式和指令eq\o\ac(○,2)矢量图文件的大小主要取决于图的复杂度eq\o\ac(○,3)计算机可以对图元进行任意的变换:放大、缩小、旋转、变形、扭曲、属性的改变,将仍保持图形的特性,而不会破坏图形的画面eq\o\ac(○,4)矢量图中的局部图元可以很容易的被抽取重新定以后放入分类的图库,为以后的复用带来方便eq\o\ac(○,5)矢量图形主要用于线性图画和工程制图以及美术字等eq\o\ac(○,6)矢量图处理起来比较复杂,处理速度与数据存储结构密切相关图形与图像的关系:eq\o\ac(○,1)图形是矢量的概念,基本元素是图元,也就是图形指令;图像时位图的概念,基本元素是像素eq\o\ac(○,2)图像的数据量相对较大,图形的数据量相对较小eq\o\ac(○,3)图像的像点之间没有内在的联系,在放大与缩小时,部分像点被丢失或重复添加时会导致清晰度受影响;图形受运算关系支配,放大或缩小不会影响图形的特征eq\o\ac(○,4)适用范围不同eq\o\ac(○,5)图形和图像之间是可以相互转化的。图形转化成图像采用栅格化技术,图像转换成图形用跟踪技术图像数字化过程:采样、量化、编码数据压缩的可能性:空间冗余,时间冗余,视觉冗余,知识冗余空间冗余:在任何一幅图像中,均有一些区域是由许多灰度或颜色都相同的邻近像素组成,它们形成了一个性质相同的集合块,即它们之间具有空间上的相关性,这些相关性的光成像结果在数字化图像中就空间冗余。时间冗余:图形序列中两幅邻近的图像有较大的相关性,这反映为时间冗余。衡量数据压缩技术好坏的指标:压缩比、算法的复杂性和运算速度、失真度无损压缩:也称冗余度压缩,信息保持编码或熵编码。利用数据的统计冗余进行压缩,可完全恢复原始数据而不引起任何失真,但压缩率不高。压缩比不高2:1到5:1,没有失真,是可逆运算有损压缩:也称为信息量压缩,失真度编码或熵压缩编码,利用人类对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息。不能完全恢复原始数据,但仍可满足有效的数据,图像质量仍能保持较高水平,不易察觉。图像文件格式和标准:BMP——位图——.bmp;TIFF(扫描仪格式)——位图映射图像文件格式——.tif;TGA——.tga;GIF(多用于网络环境,文件较小)——.gif;PCX——.pcx;JPEG(数码相机拍摄保存格式)——.jpg或.jpegPHOTOSHOP界面:标题栏、菜单栏、工具选项栏、工具栏、浮动面板、编辑窗口、状态栏PHOTOSHOP独有的文件格式:.psd图层:是一组可以用于绘制图像和存放图像的透明层,可以将图层想象为一组透明胶片,在每一层上都可以绘图,它们叠加到一起后,从上往下看,看到的就是合成的图像效果。套索工具:可以选择不规则的图形滤镜:是一组完成特定效果的程序,一个滤镜对应一种效果。滤镜的效果强度和特性可以调整,以产生不同的效果。第五章数字视频处理动态图像:视频、动画视频:图像为实时获取的自然景物动画:由人工或计算机产生的图形,以图像的形式表现出来。视频的特点:内容随时间变化而变化;伴随有与画面同步的声音视频的文件格式:AVI/ASF/WMA/MPEG/RM/RMVB/MOV/DIVXMPEG——1是VCD采用的标准;MPEG——2是DVD采用的标准视频信号:模拟视频信号、数字视频信号模拟信号:指幅度的取值是连续的数字信号:指幅度的取值是离散的,幅值表示被限制在有限个数值之内。彩色电视信号的制式:PLA/NTSC/SECAM全电视信号传输三种信号:图像信号,行、场消隐信号,复合同步信号得到数字视频图像的途径:eq\o\ac(○,1)将模拟信号通过模/数(A/D)转换后输入到计算机中eq\o\ac(○,2)使用数字化视频捕捉设备存储方式:刻盘/硬盘/闪存(类似于U盘)视频的数字化过程:eq\o\ac(○,1)采样:通过周期性的以某一规定间隔截取模拟信号,从而将模拟信号变换为数字信号的过程。eq\o\ac(○,2)量化:就是把经过抽样得到的瞬时值将其幅度离散,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示。eq\o\ac(○,3)经采样和量化后得到的数字视频的数据量非常大,所以要进行压缩编码。eq\o\ac(○,4)存储。eq\o\ac(○,5)D/A转换。流媒体:所谓流媒体是用流式传输的方式Internet/Intranet播放的媒体格式,如音频、视频或多媒体文件,流媒体在播放前并不下载整个文件,只将开始部分内容存入内存,在计算机中对数据包进行缓存并使用媒体数据正确输出。流媒体的数据流随时传送随时播放,用户不必等到整个文件全部下载完毕,而只需经过几秒或几十秒的启动延时即可进行观看。流媒体优点:eq\o\ac(○,1)启动延时大幅度地缩短eq\o\ac(○,2)对系统缓存容量的需求大大降低eq\o\ac(○,3)流式传输的实现有特定的实时传输协议实现流式传输的方法:实时流式传输、顺序流式传输流媒体传输和控制协议:实时传输协议RTP/实时传输控制协议RCP,实时流协议RTSP,资源预定协议RSVP协议Apple公司的quickTime与QuickTimePlayer;微软公司的WindowsMedia与MediaPlayer;RealNetworks公司的RealMedia与RealPlayerFlash的格式.swf视频信息的捕获:从数码相机捕获视频;从摄像头获取视频;从VCD获取视频;从DVD获取视频;通过屏幕录制软件获取视频;从网络获取视频如何利用Nero刻录软件将数据刻录到光盘上?(1)将空白光盘放入刻录机,启动Nero刻录软件(2)鼠标移至“数据”图标上,选择刻录数据光盘,弹出“光盘内容”窗口(3)在“光盘内容”窗口中单击“添加”按钮,弹出“添加文件和文件夹”窗口(4)在“添加文件和文件夹”窗口中选择要刻录到光盘上的文件和文件夹,单击“添加”按钮,同时单击“关闭”按钮,关闭次窗口。刚刚选中的文件和文件夹出现在“光盘内容”窗口中(5)单击“下一步”按钮,弹出“最终刻录设置”窗口(6)在“当前刻录机”下拉列表框中选择要使用的刻录机;在“光盘名称”文件框里输入光盘名称,选择写入速度(7)单击窗口中部左侧的按钮,展开窗口的折叠部分。在窗口展开的部分里,进行“刻录设置”(8)选择“刻录份数”同时可选择复选框,一般默认为“允许以后添加文件”单击“刻录”按钮开始刻录(9)刻录成功后会有提醒,单击“确定”,完成刻录PremierePro是Adobe公司推出的非常优秀的(非线性编辑)软件非线性编辑:是相对传统上的以时间顺序进行线性编辑而言。非线性是指用硬盘、光盘等存储数字化视、音频信息的方式,非线性表现出数字化信息存储的特点:信息存储的位置是并列平行的,与接受信息的先后顺序无关。线性编辑:线性是指连续存储视、音频信号的方式,即信息存储的物理位置与接受信息的顺序是完全一致的。线性编辑一般是指多台录放机之间拷贝视频的过程。MPEG-7名字叫做“多媒体内容描述接口”,制定这个标准主要目的是为了解决多媒体内容的(检索问题)MPEG-21的正是名称是“多媒体框架”或“数字视听框架”IEEE1394接口也叫“fireline”,俗称“火线”视频就其本质而言其内容是随(时间)变化的一组动态图像,所以又叫运动图像或活动图像视频的主要特征包括:(分辨率)、(亮度)、色差编码,视频的刷新频率第六章多媒体数据压缩技术数据冗余:空间冗余,时间冗余,结构冗余,视觉冗余,知识冗余,听觉冗余空间冗余:图像数据中经常存在的一种冗余,在一幅图像中记录的可见景物的颜色,一般都有连续的有规则物体和规则背景的颜色分布,使图像数据在空间上表现出相关性时间冗余:时间冗余是指在图像序列中,相邻帧图像之间有较大的相关性结构冗余:有些图像从大体上看存在非常强的纹理结构,这些纹理具有较强的相似性,称为结构冗余知识冗余:有很多图像的理解与某些基础知识有很大的相关性,这类规律性的结构可由先验知识和背景知识得到,这类冗余称为知识冗余视觉冗余:人的视觉系统有一定的限度,人类视觉系统对图像场的敏感性是非均匀和非线性的,人眼并不能觉察图像场的所有变化,我们将这种冗余称为视觉冗余听觉冗余:人耳对不同频率的声音的敏感性是不同的,并不能觉察所有频率的变化,对某些频率不需要关注,因而存在听觉冗余信息熵编码:哈夫曼编码、行程长度编码、算术编码、游程编码无失真压缩:也称为无损压缩、可逆压缩,它不会产生失真,压缩前和解压缩后的数据是完全一致有失真压缩:也称为有损压缩、不可逆压缩,允许一定程度的失真,在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,并且丢失的信息不能再恢复信息量:指从N个相等的可能事件中选出一个事件所需要的信息度量或含量,也就是从N个事件中辨识出某一个特定事件过程中所需提问“是或否”的最少次数信息熵:若将信源所有可能事件的信息量进行平均,即得到信息的“熵”,即信息熵设原图像的平均码长为L,熵为H(X),压缩后图像的平均码长为Lc,则定义冗余度编码效率压缩比哈夫曼编码基本原理:依据信源字符出现的概率大小来构造代码,对出现概率较大的信源字符,给予较短码长,而对于出现概率较小的信源字符,给予较长码长,最后使得编码的平均码字最短编码步骤:eq\o\ac(○,1)将信源符号出现的概率按由大到小的顺序排序eq\o\ac(○,2)将两处最小的概率进行组合相加,形成一个新的概率eq\o\ac(○,3)将新出现的概率与未编码的字符一起重新排序eq\o\ac(○,4)重复步骤eq\o\ac(○,2)eq\o\ac(○,3),直到出现的概率和为1eq\o\ac(○,5)分配代码。代码分配从最后一步开始反向进行,对最后两个概率一个赋予0代码,一个赋予1代码。如此反向进行到开始的概率排列Eg:设输入图像的灰度级{a1,a2,a3,a4,a5,a6}出现的概率分别是0.4、0.2、0.12、0.15、0.1、0.03。试进行哈夫曼编码,并计算编码效率、压缩比、冗余度注意!1位二进制数有2注意!1位二进制数有2种状态21=2;2位二进制数有4种状态22=4;3位二进制数有8种状态23=8……此处有6个灰度级,需要6种状态,所以要有23=8,3个比特量化注意:编码时要从后向前编码!上枝标“1”,下枝标“0”上枝为较小的数,下枝为较大的数求信源的信息熵:
=-(0.4×log20.4+0.2×log20.2+0.12×log20.12+0.15×log20.15+0.1×log20.1+0.03×log20.03)
=2.25bit求编码效率:Lc=0.4×1+0.2×3+0.15×3+0.12×3+0.1×4+0.03×4=2.33(概率*枝数)求压缩比:因为压缩前8个符号需要3个比特量化,故6个符号也需要3个比特量化。
又因经过压缩之后的平均码字长度为2.33,由公式(4-10)得其压缩比为求冗余度:r=1-η=3.4%哈夫曼编码缺点:eq\o\ac(○,1)它必须精确的统计出原始文件中每个值出现的频率,否则压缩的效果就会很差,甚至根本达不到压缩的目的。因此通常要经过两遍操作,第一遍统计,第二遍产生编码,所以编码的过程比较慢,解压缩的过程也比较慢。eq\o\ac(○,2)它对于位的增删比较敏感,这是由于哈夫曼编码的所有位都是合在一起而不考虑字节分位的,因此增加或减少一位都会使译码结果面目全非行程编码:把一系列的重复值(如图像象素的灰度值)用一个单独的值再加上一个计数值来取代11110000表示为(4,1)(4,0)视频图像的压缩方法:有损压缩和无损压缩MPEG-1即是俗称的VCD
MPEG-2则为DVD所采用。主要用于标准清晰度、高清晰度视频节目的存储及传输,是数字电视机顶盒和DVD等产品的基础。
MPEG-4是为交互式多媒体通讯制定的压缩标准,用于视频电话、视频电子邮件和电子新闻MPEG-7是为互联网视频检索制定的压缩标准,名字叫做“多媒体内容描述接口”,制定这个标准的主要目的是为了解决多媒体内容的(检索)问题
MPEG-21被称作多“媒体框架”或“数字视听框架”H.261是ITU-T制订的国际上第一个视频压缩标准,主要用于(会议电视)H.263标准可用于(可视电话)中极低比特率的编解码器上H.264标准相对于以往的标准,在相同的码率下用H.264标准编码能够(获得更高的图像质量)在JPEG中使用哈夫曼编码对DPCM编码后的直流DC系数和RLE编码后的交流AC系数进行压缩时,总共需要(4)张编码表哈夫曼编码是一种(可变长)编码(行程编码)适用于计算机生成的图形图像和黑白二值图像哈夫曼编码过程实际上是构造一棵二叉树过程,码字都是从树根出发排列的√哈夫曼编码的码字是唯一可译码的一种√LZW编码算法中的串表初始时为空√预测编码是无损压缩×适用于数字电视的是(MPEG-2)预测编码中DPCM是对(量化后的预测误差)进行编码增量调制是一种(预测编码技术)在LZW算法过程中,前缀码存放(上一次处理的代码),当前串存放(前缀码所代表的字符串加上读进来的字符串所组成的字符串)JPEG2000与JPEG最大的不同在于它放弃了JPEG所采用的以离散余弦转换为主的区块编码方式,而采用(以小波转换)为主的多解析编码方式声音的数字化包括两个步骤(采样)和(量化)PCM是直接对(采样信号)进行量化编码,DPCM是对(实际信号值与预测值之差)进行量化编码JPEG2000的特点:(1)压缩效率高,图像还原质量好(2)无损和有损压缩(3)渐进传输(4)感兴趣区域压缩(5)基于内容的描述第七章动画原理与制作技术动画与运动分不开,运动时动画的本质,动画是运动的艺术动画按照运动的控制方式:实时动画和逐帧动画动画按照制作方法和空间的视觉效果:二维动画和三维动画时间轴的主要组件是:层、帧、播放头使用层设定动画在(排列)上的先后顺序,使用帧设定动画在(时间)上出现的先后顺序舞台是进行创作的区域帧:是指动画中的每一幅静态的图像帧速:是指单位时间内播放的帧的多少,帧速决定动画播放的流畅性Flash动画默认的帧速为12帧/秒关键帧:定义了一个过程的起始和结束,每当帧内容发生变化应当插入关键帧空白关键帧(F7):在一个关键帧里如果什么对象也没有,这种关键帧就是***Flash的元件:又叫符号,有三类(电影剪辑)(按钮)(图形)库是存放和管理元件的地方,分为共享库和公共库Flash提供了四种声音播放方式,其中(事件)的播放不受时间轴限制,即使影片播放完毕,声音仍继续播放,直至自身文件播放完毕3DSMAX的视图:顶视图、前视图、左视图、透视图3DSMAX的灯光一共有8种:目标聚光灯、自由聚光灯、目标平行光、散光灯、天光、mr区域泛光灯、mr区域聚光灯3DSMAX中摄像机分为Target(目标)和Free(自由)3DSMAX的保存文件名为*.max(重置)命令可以还原启动默认设置,但不退出3DSMAX在制作动画时,一般帧速选择(30帧/秒)(变形)是指将一幅图像逐步变化到另一幅完全不同图像的处理方法动画的基本原理与电影、电视一样,都是人眼的(视觉暂留)现象变形动画的制作软件MagicMorph二维动画软件:AnimatorStudio;Flash;Retas;Pegs;Usanimation三维动画软件:MAYA;3DSMAX;Renderman;SoftImage;Lightwave3D;POSER增加内容全景制作工具:Cool360.gif既可以为动态图像也可为静态图像PHOTOSHOP
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《拜耳系列产品讲座》课件
- 液晶显示器组装机市场洞察报告
- 安全监控机器人市场发展现状调查及供需格局分析预测报告
- 画笔产业规划专项研究报告
- 汽车用离合装置市场需求与消费特点分析
- 医用钾盐市场洞察报告
- 浴室柜家具产业规划专项研究报告
- 人造乳房市场发展现状调查及供需格局分析预测报告
- 学生版教学课件教学课件教学
- 美甲烤灯市场洞察报告
- 2024年广西普法云平台考试答案
- 2023-2024学年广东省深圳市福田区八年级(上)期末英语试卷
- 2024年动迁房购买合同范本
- 2024年军事理论知识全册复习题库及答案
- 铁路设备售后服务方案
- 江苏省南京市玄武区2024-2025学年七年级上学期期中考试英语试卷
- 公务员2022年国考申论试题(行政执法卷)及参考答案
- (培训体系)2020年普通话测试培训材料
- 2024混合动力汽车赛道专题报告-2024-10-市场解读
- DB34T 4338-2022 行政规范性文件合法性审核规范
- 英语-浙江省精诚联盟2024学年高一第一学期10月联考试题和答案
评论
0/150
提交评论