版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1-1第五章数字媒体及应用1-21.理解GB2312,GBK和GB18030三种汉字编码标准的内容、关系与应用,熟悉中文文本准备的方法,掌握常用文本编辑与处理软件的功能与应用2.懂得数字图像获取的原理与方法,熟悉图像在计算机中的表示,初步了解数字图像处理的内容与应用,大体明白计算机图形的生成过程及应用3.掌握声音获取的方法与设备,熟悉波形声音在计算机中的表示、标准与应用,初步了解语音合成和音乐合成的过程与应用4.了解数字视频的获取方法与设备,熟悉视频压缩编码的几种标准及其应用,初步懂得计算机动画的制作过程学习目标1-3补充媒体的概念媒体(medium(单)media(复)):又称媒介/媒质,承载信息的载体,是信息的各种表示形式(如数值、文字、图象、声音、视频等)数字媒体:
数值、文字、声音、图像等的二进制数字表示数字媒体是随着计算机功能的不断增强、计算机应用的不断深入而发展起来的1-4补充5种与计算机信息处理有关的媒体感觉媒体如:声音,文字,图画,气味,等;表示媒体如:声,文,图,活动图像的二进制表示存储媒体如磁盘,光盘,半导体存储器等;表现媒体如:输入设备,输出设备传输媒体如:同轴电缆,光纤,电话线1-55.1.1字符编码西文字符的编码
AmericanStandardCodeforInformationInterchange(ASCII,美国标准信息交换码)。
国际通用的信息交换标准代码(ISO646)。
ASCII码是对数字、字母、通用符号和控制符号等字符进行编码。
ASCII码:7位→128种0000000→11111115.1文本与文本处理1-6ASCII码表(7位)高三位b6b5b4低四位b3b2b1b01-7[例]将China五个字符的ASCII码查出并存放在内存中。
ASCII码的字符集:
(1)10个数字:0,1,2,3,4,5,6,7,8,9
(2)52个大、小写字母
(3)25个特殊字符比较大小:0<…<9<A<…<Z<a<…<z(4)030H,A41H,a61H1-8汉字字符的编码(1)国家标准GB/T2312-1980信息交换用汉字编码字符集--基本集一级汉字3755个(按拼音排序)
二级汉字3008个(按部首排序)
字母、数字和特殊图形记号等
图形字符(7445个)a.区位码
书图94×94例如:啊→区位码→1601国→区位码→2590
1-9
b.国标码规定:一个汉字采用两个字节来表示0XXXXXXX0XXXXXXX第一字节第二字节*国标码=区位码+3232
啊→1601+3232→4833国→2590+3232→57122→01110011111010b1-10c.机内码:刚刚我们了解了国标码,一个汉字采用两个字节来表示。汉字机内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。目前我国使用的内码是国标码高位置1。汉字机内码=汉字国标码+128128
例如:国→机内码=01110011111010b
=1011100111111010b01XXXXXXX国标码机内码01XXXXXXX1-11(2)GBK汉字内码扩展规范问题:GB2312-80只有6763个汉字,使用时功能不够。解决方法:1995年发布GBK,全称为《汉字内码扩展规范》。GBK字符集中一共有21003个汉字和883个图形符号,它与GB2312国标汉字字符集及其内码保持兼容。GBK/1:GB2312中的符号;
GBK/2:GB2312中的全部汉字;
GBK/4和GBK/3:包括繁体字在内的大量汉字;
GBK/5:符号。例如計算機係等繁体汉字和冃冄円冇等生僻的汉字。1-12字体彩蛋1-13(3)UCS/Unicode与GB18030汉字编码标准约有6800种语言和文字在使用,需要建立一个多文种(Multilingual)处理环境在ISO2022基础上,使用代码页号切换不同字符集的方法过于繁琐,且与其他系统不兼容目标与途径:实现所有字符在同一字符集中统一编码1-14
UCS:ISO/IEC10646
UniversalMultiple-OctetCodedCharacterSet,通用多8位编码字符集Unicode:统一码或联合码,微软、IBM等联合制定、与UCS完全等同的工业标准
UCS/Unicode用4个字节对全世界现代书面文字所使用的所有字符、符号进行编码
1-15
优点:编码空间极大,能容纳足够多的各种字符集(13亿字符)
缺点:4字节的字符编码使存储空间浪费严重
克服:在UCS/Unicode编码空间中,把第1和第2字节均为“0”的一个子空间(称为基本多文种平面BMP),作为UCS/Unicode的子集来使用,记作UCS-2。UCS-2是双字节编码,共有字符49194个,其中包括:欧洲及中东地区使用的拉丁字母、音节文字各种标点符号、数学符号、技术符号、几何形状箭头及其他符号中、日、韩(CJK)统一编码的汉字1-16(4)UCS/Unicode与GB18030汉字编码标准为了既能与UCS/Unicode编码标准接轨,又能向下兼容GB2312和GBK汉字编码标准,保护已有的大量信息资源,信息产业部和国家质量技术监督局在2000年联合发布了GB18030-2000汉字编码国家标准,并在2001年开始执行。在GB2312和GBK的基础上进行扩充,增加了4个字节的编码,所包含的汉字数增加到27000多个。(5)BIG5编码繁体字编码双字节编码1-17GBK-95GB2312-80GB12345-90GB18030-200000FF00FF00FF00FF00FF00FF27484汉字20902汉字6763汉字2个扩充的汉字字符集GB2312GBK-95GB18030-2000虚线外的汉字,4字节表示1-18汉字处理技术:汉字输入、汉字输出、计算机内部的编码问题。根据汉字处理过程中的不同要求,有多种编码形式。汉字输入码汉字交换码汉字机内码汉字字形码输入设备输出设备汉字库5.1.2文本处理1-19人工输入:通过键盘、手写笔或语音输入方式输入字符特点:速度慢、成本高,不适合需处理大批量文字的应用自动输入:将纸介质上的文本通过识别技术自动转换为文字的编码特点:速度快,效率高文字的自动识别分为:印刷体识别和手写体识别1-20文本信息的输入人工输入自动识别输入键盘输入联机手写输入语音输入印刷体识别手写体识别文本信息的输入方法1-21
⑴汉字输入码
作用:让用户直接使用标准键盘输入汉字。
特点:规则简单,重码率低,击键次数少。
分类:数字编码→电报码、区位码等字音编码→全拼、双拼等字形编码→五笔字型、郑码等混合编码→自然码、智能ABC等1.2计算机运算基础1-22
⑵汉字交换码
在汉字信息处理系统与通信处理系统之间进行汉字信息交换时所使用的编码。
设计汉字交换码编码体系要考虑:☆被编码的汉字个数尽量多;☆编码的长度尽可能短;☆编码具有唯一性;☆码制的转换要方便。1.2计算机运算基础按照国家标准GB/T-2312-1980编码的汉
字交换码→国标码.1-23
⑶汉字机内码汉字机内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。目前我国使用的内码是国标码高位置1。1.2计算机运算基础汉字机内码=汉字国标码+8080H
例如:啊→机内码=3021H+8080H=B0A1H1-24
又如:“中国”→汉字机内码=?汉字区位码汉字国标码汉字机内码中54488680=5650HD6D0H国259057122=397AHB9FAH
通过Debug查看汉字机内码:1.2计算机运算基础1-25文本的分类(1)简单文本(plaintext):是由一连串的字符组成的,除了用于表达正文内容的字符(包括汉字)及“回车”、“换行”、“制表”等有限的几个打印(显示)控制字符之外,几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或ASCII文本,在PC机中的文件扩展名是.txt特性:呈现为一种线性结构,以行、字为单位,顺序写作与阅读是最通用的文本文件格式,文件体积小,阅读不受限制,几乎所有的文字处理软件都能识别和处理。不能插入图片、表格等,不能建立超链接。1-26(2)丰富格式文本的格式化(排版)
设定文字的字体、字号、颜色等、确定页面大小、文本在页面上的布局等,这称为文本的格式化(排版)。排版后产生丰富格式文本。丰富格式文本(richtext,fancytext,formattedtext)包含格式控制和结构说明信息的文本。RTF格式为了便于丰富格式文本在不同的软件和系统之间互换使用而提出的公用的中间格式。多媒体文档(MultimediaDocument)
不仅插入图、表与公式,还包含声音或者视频信息的文本。1-27文本编辑的主要功能对字、词、句、段落进行添加、删除、修改等操作字(符)的处理:设置字体、字号、字的排列方向、间距、颜色、效果等段落的处理:设置行距、段间距、段缩进、对称方式等页面布局的处理:设置页边距、每页行列数、分栏、页眉、页脚等“所见即所得”(WhatYouSeeIsWhatYouGet,简称WYSIWYG):一方面所有的编辑操作效果立即可以在屏幕上看到,另一方面在屏幕上看到的效果与打印机的输出结果相同。文本的编辑与处理1-28文本处理内容:字数统计,字频统计,简/繁体相互转换,汉字/拼音相互转换词语排序,词语错误检测,文句语法检查自动分词,词频统计,词性标注,词义辨识,大陆/台湾术语转换文本压缩,文本加密,文本著作权保护关键词提取,文摘自动生成,文本分类文本检索(关键词检索、全文检索),文本过滤文语转换(语音合成),文种转换(机器翻译)篇章理解,自动问答,自动写作等1-29面向通信的文本处理软件计算机网络上最普及的应用是用电子邮件进行通信。大多数情况下电子邮件正文的内容一般都是简单文本,因此电子邮件内嵌的文本编辑器功能比较简单,操作使用方便。典型软件:微软公司的OutlookExpress,具有文字的增、删、改以及字体、字号的设置功能,也可以设定一些简单的格式和插入一些图片。当然邮件所带的附件并不受此限制。在互联网上进行聊天所使用的文本处理软件更加简单。1-30面向办公的文本处理软件功能要求:文本制作的高效率、高质量软件面向非专业用户,易学好用文本处理能力,既功能丰富,又操作简单排版功能典型软件:MS-Office
中的WordWPS2000永中Office中的文本处理软件1-31面向出版的文本处理软件排版软件的主要功能:将文字、图形和图像等合理地安排在页面内.ps文件:排版软件的输出的一种使用页面描述语言(例如PostScript)描述的文件,该文件记录了每一个页面的排版结果,它被送到装有栅格图像处理器(RIP)的激光照排机去,经过RIP的解释,产生页面的图像,然后驱动激光束对感光材料进行扫描曝光,以得到用于制版的胶片典型排版软件:方正集团公司的“飞腾”排版软件美国Adobe公司的PageMaker和PDFWriter1-32文本的展现(1)汉字的字形码字形码是一种用点阵表示汉字字形的编码,它主要用于汉字输出(打印、显示等)时产生的汉字字形。
点阵大小类型:16×16、24×24
32×32、48×48以上
汉字库:一个汉字系统所允许使用的全部汉字的汉字字形编码的集合。1-33
例如:把一个方块横向和纵向都分为16格。若用1表示黑点,用0表示白点,则16×16的点阵汉字可用256位二进制数来表示,占用32B。
汉字“宝”的16×16点阵数字化信息:02H00H01H04H7FHFEH40H04H80H08H00H00H3FHF8H01H00H01H00H1FHF0H01H00H01H40H01H20H01H20H7FHFCH00H00H1.2计算机运算基础1-34(1)汉字矢量表示
字符的点阵描述字符的轮廓描述1-355.2图像与图形(1)图像(位图图像、点阵图像)图像:从现实世界中通过数字化设备获取的图像,称为:取样图像(sampledimage)、点阵图像(dotmatriximage)、位图图像(bitmapimage)——简称图像(image)
优缺点:①色彩和色调丰富,景物逼真
②缩放处理易失真,数据量大绘画软件:PhotoshopPhotoImpact1-36(2)图形计算机合成的图像(syntheticimage)称为:矢量图形(vectorgraphics),简称图形(graphics)矢量图是用一组指令来描述的,这些指令给出构成图形的各种属性和参数。例如:
圆(圆心坐标,半径及粗细,色彩)
优缺点:①图形文件占用空间较少②图形复杂时耗时相对较长
绘图软件:CorelDRAWFreeHand1-37图形与图像的比较图形图像文件大小与图形的复杂程度有关,一般较小与图像的尺寸和颜色有关,一般较大文件内容图形指令图像点阵数据缩放、旋转处理无失真有失真处理技术绘制、创造和艺术性获取、复制和技巧性适合范围表现变化的曲线简单图案、运算结果表现自然和细节景物层次、色彩较丰富图形图像真实感图形绘制模式识别技术1-385.2.1数字图像的获取
1.图像的数字化图像的获取(capturing):从现实世界中获得数字图像的过程图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤:扫描分色取样量化1-39数字化扫描分色取样量化
连续空间位置的离散和数字化亮度值的离散和数字化空间位置采样m×n20×13256亮度量化8b24b1-40图像的数字化过程量化量化模拟图像扫描分色量化数字图像RGB
取样
取样取样1-41数字图像获取设备设备:从现实世界获得数字图像过程中所使用的设备通称为数字图像获取设备设备的功能:将现实的景物输入到计算机内并以取样图像的形式表示2D图像获取设备(如扫描仪、数码相机等)只能对图片或景物的2D投影进行数字化3D扫描仪能获取包括深度信息在内的3D景物的信息1-425.2.2图像的表示与压缩编码
一、图像的主要参数
⑴分辨率分辨率直接影响图像质量。
显示分辨率:指在显示器上能够显示的像素数目。(640*480,800*600,1024*768)
图像分辨率:指数字图像的实际像素数目,它反映图像在屏幕中显示的大小。
1-43图象文件的大小图象文件名图象大小、深度、类型1-44
⑵像素深度指记录每个像素所使用的二进制位数。
彩色图像:可使用的最多颜色数目
灰度图像:可使用的亮度级别数目位数颜色数说明4位16种Windows3.x中画笔支持16种颜色8位256种多媒体应用中的最低颜色深度16位32768种RGB5:5:5,剩余1位表示其它属性(透明度)24位16M种真彩色,超出人眼所能识别的颜色范围32位16M种RGB8:8:8,剩余8位表示其它属性(透明度)1-45
(3)彩色空间
颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等1-46Blackandwhiteimage黑白图象的表示1-47Grayscaleimage灰度图象的表示1-48彩色图像的表示155156159170150151175176150154159166156158177178147153158162156168180188168175175174177182187183225225219217216218223227225224221220214215222225240233226223219220224229233231229226220220227230178176176176176205216226179178175180177200223231174175178184181189217224208203208196193197216225212210215202192196207218211212212210198194207210224227224214197196213220228231233220202197210217180177187190190220225231182184179188192217239233182185190191194207229235219215218198198205220237211214218202192195212234217214213210194192214238222225226214197200216230228230230225200206212220红色分量绿色分量蓝色分量1-49二、图像的压缩图像文件的大小是指在磁盘上存储整幅图像所需的字节数。数据量=图像水平分辨率×图像垂直分辨率×颜色深度/8(B)[例题]一幅640×480的24位真彩色图像,未压缩的图像数据量是多少?640×480×24/8=921600B=900KB图像大小8位(256色)16位(65536色)24位(真彩色)640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1280×10241.25MB2.5MB3.75MB1-50图像数据压缩的可能性:由于数字图像中的数据相关性很强,数据的冗余度很大,因此对数字图像进行大幅度的数据压缩是完全可能的。而且,人眼的视觉有一定的局限性,即使压缩前后的图像有一定失真,只要限制在人眼允许的误差范围之内,也是允许的。1-51数据压缩类型(1)无损压缩:压缩以后的数据进行图像还原(也称为解压缩)时,重建的图像与原始图像完全相同压缩比2:1-5:1
行程长度编码(RunLengthCoding,RLC):111110005555333302222222513045431072
哈夫曼(Huffman)编码:对出现概率高(低)的编短(长)码,是变长码
预测编码、二进制算术编码等
软件:winzipwinrar(2)有损压缩:使用压缩后的数据进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响人们对图像含义的正确理解。如变换编码、矢量编码等1-52图像压缩方法很多,不同方法适用于不同的应用,在计算机中常常是多种压缩方法的综合使用。为得到较高的数据压缩比,一般都采用有损压缩。压缩编码方法优劣的评价压缩倍数的大小重建图像的质量(有损压缩时)压缩算法的复杂程度1-53图像压缩编码方法的国际标准和工业标准:ISO和IEC两个国际机构联合组成了一个专家组
(JointPhotographicExpertsGroup),制定了一个静止图像数据压缩编码的国际标准,称为JPEG标准。JPEG标准的特点:适用范围广;能处理各种连续色调的彩色或灰度图像;算法复杂度适中;既可用硬件实现,也可用软件实现;图像的压缩比可控制(压缩比越低,图像质量越好;压缩比越高,图像质量越差)JPEG2000:适用于各种不同类型(黑白、灰度、彩色等)和不同特性(自然、医学、遥感、合成)的图像,可用于不同的应用模式(实时传输、检索、存档等)。采用了小波分析等先进算法,提供了更好的图像质量,更低的码率,更适合在WWW网上传输等,它兼容JPEG1-54JPEG图像压缩比例
中等压缩后的图像高倍压缩后的图像1-555.2.3图像的文件格式
BMP:Windows标准图像文件格式
JPG:一种高效率压缩格式(1:10~20)
GIF:用于交换图片的,对灰度
图像表现佳,但不超过256色的图像。
PNG:流式网络图形格式,它使用LZ77派生的无损数据压缩算法。
PNG存储灰度图像时图像深度达16位
PNG存储彩色图像时图像深度达48位1-56名称压缩编码方法性质典型应用开发组织/公司BMPRLC无损Windows应用程序MicrosoftTIFRLC,LZW无损DesktoppublishingAldus,MicrosoftGIFLZW无损InternetCompuServeJPEGDCT,Huffman无损/有损Internet,数码相机等ISO/IECJP2小波变换,算术编码无损/有损Internet,数码相机等ISO/IEC1-571-581-591-60美国Adobe公司的PhotoShop,集图像扫描、图像编辑、绘图、图像合成及图像输出等多种功能于一体,是一个流行的图像处理工具。处理前图片上有划痕处理后划痕被清除图像的滤镜操作背景图前景图复合后的图像图层操作1-61应用:图像通信:传真,可视电话,视频会议遥感:航空遥感,卫星遥感医疗诊断:X射线,超声,CT,核磁共振工业生产中的应用:生产过程的自动控制机器人视觉:军事侦察,危险环境作业军事、公安、档案管理:指纹识别,档案修复1-625.2.4计算机图形景物的模型(model):景物在计算机内的描述景物的建模(modeling):人们进行景物描述的过程绘制(rendering):也称图像合成(imagesynthesis),根据景物的模型生成图像的过程,所产生的数字图像称为计算机合成图像计算机图形学(ComputerGraphics):研究如何使用计算机描述景物并生成其图像的原理、方法与技术1-63计算机合成图像的过程:建模/造型(Modeling)景物形状的模型(Model)绘制(Rederring)(ImageSynthesis)景物形状的视图1-64几何模型:景物建模方法与景物类型有关。普通工业产品(如电视机、电话机、汽车、飞机等),使用基本的几何元素(如点、线、面、体等)及表面材料的性质等进行描述所建立的模型几何模型分类(按照所使用的几何元素类型)线框模型曲面模型实体模型几何模型应用:工业产品的计算机辅助设计/制造过程模型/算法模型:根据景物的生成规律,并使用相应的算法来描述其规律所建立的模型1-65剪贴画剪贴画的分解剪贴画的构造与效果1-66改变几何点1-67景物形状的计算机表示使用几何模型描述的机械零件使用分形模型描述的图案形体与景物的建模方法线框模型实体模型曲面模型几何造型技术过程模型技术分形几何形状语法微粒系统基于物理的建模1-68使用计算机合成图像的主要优点:能生成实际存在的具体景物的图像,还能生成假想或抽象景物的图像能生成静止图像,还能生成各种运动、变化的动态图像计算机合成图像的应用:计算机辅助设计和辅助制造(CAD/CAM)利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等作战指挥和军事训练计算机动画和计算机艺术其他:电子出版、数据处理、工业监控、辅助教学(CAI)、软件工程等1-69矢量图形:计算机合成图像矢量绘图软件:制作矢量图形的软件 如:AutoCAD、MAPInfo、ARCInfo等2D的矢量绘图软件:Corel公司的CorelDrawAdobe公司的IllustratorMacromedia公司的FreeHand微软公司的MicrosoftVisio微软公司Office办公套件中的Word和PowerPoint矢量绘图软件1-705.3数字声音及应用声音:由振动而产生,通过空气进行传播。它由许多不同频率的谐波所组成,谐波的频率范围称为声音的带宽(bandwidth),带宽是声音的一项重要参数。多媒体技术处理的声音信号主要是人耳可听到的20~20kHz的音频信号(audio)言语(speech)/语音:人说话的声音,其频率范围约为300~3400Hz全频带声音:音乐声、风雨声、汽车声等其他声音,其带宽可达到20~20kHz1-715.3.1数字声音的获取与设备声音信号的数字化:将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程声音信号数字化的过程:取样量化编码1-72一、声音信号的类型模拟信号(自然界、物理)数字信号(计算机)二、声音的数字化采样量化编码模拟信号数字信号模拟信号数字信号A/DADCD/ADAC1-73声音数字化过程连续的模拟声音信号声音信号的采样离散的音频信号示意5.3音频信息处理1-74.波形声音的获取设备麦克风:将声波转换为电信号声卡(soundcard):控制并完成声音的输入(数字化)和输出(重建)波形声音的获取(数字化):把模拟的声音信号转换为数字形式。
(话筒或线路输入、单双声道)波形声音的重建与播放MIDI声音的输入
(MusicalInstrumentDigitalInterface)MIDI声音的合成与播放1-75
声卡的工作原理取样、量化DSPMIDI合成器重建、滤波D/A声音输入数字声音输出声音输出DMA接口PCI总线MIDI接口混音器1-76声音重建声音播放:计算机输出声音的过程声音重建步骤:声音重建(reconstruction):把声音从数字形式转换成模拟信号形式解码数模转换插值处理将模拟声音信号经过处理和放大送到扬声器发出声音1-775.3.2波形声音的表示与压缩编码波形声音的主要参数取样频率量化位数声道数目使用的压缩编码方法数码率(bitrate):指的是每秒钟的数据量,也称比特率、码率数字声音码率计算公式为:压缩编码前波形声音的码率
=
取样频率
×
量化位数
×
声道数压缩编码后波形声音的码率=压缩前的码率/压缩倍数1-78几种常见数字声音的主要参数
波形声音的主要参数声音类型带宽(Hz)取样频率(kHz)量化位数(bits)声道数未压缩时的码率压缩后的码率数字语音300~340088164kb/s2~64kb/sCD唱片20~2000044.1162176.4kB/s176.4kB/sMP3音乐20~2000044.1162176.4kB/s128~112kb/s1-791-80
声音数字化计算公式数据量=采样频率×量化位数
×声道数/8(字节/秒)采样频率(kHz)量化位数(bit)数据量(KB/s)单声道立体声11.025810.7721.531621.5343.0722.05821.5343.071643.0786.1344.1843.0786.131686.13172.275.3音频信息处理1-81声音数字化三要素采样频率量化位数声道数每秒钟抽取声波幅度样本的次数每个采样点用多少二进制位表示数据范围使用声音通道的个数采样频率越高声音质量越好数据量也越大量化位数越多音质越好数据量也越大立体声比单声道的表现力丰富,但数据量翻倍11.025kHz22.05kHz44.1kHz8位=256个值16位=65536个值单声道立体声5.3音频信息处理1-82问题:数据量很大。如CD盘片上所存储的立体声高保真的全频带数字音乐,1小时的数据量大约是635MB目的与办法:降低存储成本和提高通信效率,对数字波形声音进行数据压缩波形声音数据压缩的可能性:声音信号中包含有大量的冗余信息,再加上还可以利用人的听觉感知特性,因此,产生了许多压缩算法声音数据压缩算法的评价:压缩倍数高,声音失真小,算法简单,编码器/解码器的成本低全频带声音的压缩编码1-83第1代编码技术——PCM(脉冲编码调制)编码:依据声音波形本身的信息相关性进行数据压缩,代表性的应用是CD唱片第2代压缩编码——感知声音编码(perceptualaudiocoding)
:不但充分利用声音信息本身的相关性,而且还充分利用人耳的听觉特性,即,使用“心理声学模型”来达到大幅度压缩数据的目的全频带声音的压缩编码(2)1-84第2代全频带声音压缩编码标准名称压缩后的码率(每个声道)声道数目主要应用MPEG-1层1384kbps(压缩4倍)2数字盒式录音带MPEG-1层2256~192kbps(压缩6~8倍)2DAB、VCD、DVDMPEG-1层3128~112kbps(压缩10~12倍)2Internet、MP3音乐MPEG-2层audio与MPEG-1层1、层2、层3相同5.1,7.0同MPEG-1DolbyAC-364kbps5.1,7.1DVD、DTV、家庭影院1-85MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:层1(Layer1):编码简单,用于数字盒式录音磁带层2(Layer2):算法复杂度中等,用于数字音频广播(DAB)和VCD等层3(Layer3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声1-86杜比数字AC-3(DolbyDigitalAC-3):美国杜比公司开发的多声道全频带声音编码系统,它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。全频带声音的压缩编码(4)1-87按MPEG-1、-2、-3,取样频率应是多少?波形声音的码率=取样频率*量化位数*声道数压缩后的码率=波形声音的码率/压缩倍数
192kbps=波形声音的码率/4
波形声音的码率=192*4=取样频率*8*2所以,取样频率=48kHz>40kHz这是依据取样定理:为了不产生失真,取样频率不应低于声音信号最高频率的两倍,即,>2*20kHz,今取48kHz
语音信号的取样频率应是多少?1-88流媒体技术:允许在窄带网上让用户一边下载一边收看(听)音视频连续媒体的技术流媒体:使用流式传输技术的音/视频媒体优点:等待时间大大缩短减少了对缓冲容量的需求降低了对网络带宽的要求1-89声音流媒体产品RealNetworks公司的RA(RealAudio)数字音频微软公司的WMA(WindowsMediaAudio)数字音频苹果公司的QuickTime全频带声音的压缩编码(7)1-90.wav(waveform):用于PC.PCM:使用PCM编码的声音文件,.VOC:声霸卡使用的音频文件格式.Mp2:MPEGLayerI,II.Mp3:MPEGLayerIII,.rm,ra(RealAudio):
RealNetworks的流式声音文件.wma:微软公司的流式声音文件.aif(AudioInterchangeableFileFormat):苹果机波形声音的文件格式1-91语音:空气通过声道引起声门振动产生语音 带宽只有300~3400Hz压缩方法有线电话通信系统中(波形编码):
G.711标准
PCM(脉冲编码调制)编码
G.721标准
ADPCM(自适应差分脉冲编码调制)编码移动通信和IP电话中(混合编码)
1-92波形编码(基于感觉模型的压缩方法)特点:码率较高(64kb/s、32kb/s)、语音质量高、算法简单、易实现应用:固定电话通信系统、多媒体文档参数编码或模型编码特点:码率很低、声音质量较差应用:保密通信混合编码(合成-分析方法)特点:中度码率(4.8-16kb/s)、压缩比较高、语音质量较好应用:移动通信、IP电话1-93数字语音压缩编码方法的比较数字语音的压缩编码语音质量优良中差坏1
2
4
8
16
32
64混合编码波形编码模型编码码率(kb/s)极低低中1-945.3.3波形声音的编辑时间刻度左声道信号波形淡入淡出播放标尺右声道信号波形数字声音的参数1-951-965.3.4语音合成语音合成(Speechsynthesis):根据语言学和自然语言理解的知识,使计算机模仿人的发声,自动生成语音的过程。目前主要是按照文本(书面语言)进行语音合成,这个过程称为文语转换(Text-To-Speech,简称TTS)。文语转换过程文本分析韵律分析语音生成1-97文语转换过程文本文本分析韵律处理语音合成合成语音词典,发音规则库韵律规则库语音库1-98计算机合成语音的应用:股票交易、航班动态查询、电话报税等业务有声E-mail服务CAI课件或游戏解说词的自动配音文稿校对、语言学习、语音秘书、自动报警、残疾人服务等1-99MIDI规定:乐谱中的音符及其定时、速度、音色(乐器)等采用MIDI消息(MIDImessage)进行描述每个MIDI消息描述一个音乐事件(如开始演奏某个音符、结束演奏某个音符、选择音符的音色、改变演奏速度等)一首乐曲所对应的全部MIDI消息组成一个MIDI文件MIDI文件在计算机中的文件扩展名为
.MID,它是计算机合成音乐的交换标准,也是商业音乐作品发行的标准音乐合成1-100视频(video):指的是内容随时间变化的一个图像序列,也称为运动图像或活动图像(motionpicture)。常见的视频有电视和计算机动画。电视:当代最有影响力的信息传播工具。数字视频:数字化的电视信号称为数字视频。计算机动画:是计算机制作的图像序列,是一种计算机合成的视频。5.5数字视频1-101电视画面:一种光栅扫描图像,一般采用隔行扫描方式,即图像由奇数场和偶数场两部分组成,合起来组成一帧图像PAL制式(中国采用)(PhaseAlternatingLine)帧频25帧/s,场频50场/s,图像的垂直分辨率(一帧图像中的扫描线总数)625线,可见部分575线,不可见的回扫线50线,→电视信号行频为625×25=15.625kHz远距离传输时用亮度信号Y和两个色度信号U、V来表示,优点:能与黑白电视接收机保持兼容,Y分量由黑白电视机直接显示而无需做进一步处理可利用人眼对两个色度信号不太灵敏的视觉特性来节省电视信号的带宽和发射功率电视基本知识1-102彩色信号的YUV表示与RGB表示的转换:
亮度分量
Y=0.3×R+0.59×G+0.11×B
色度分量
U=0.493×(B
-Y)
色度分量
V=0.877×(R
-Y)电视基本知识(2)1-103数字视频与模拟视频相比的优点:复制和传输时不会造成质量下降容易进行编辑修改有利于传输(抗干扰能力强,易于加密)可节省频率资源视频信号的数字化:以一帧帧画面为单位进行由于采用YUV彩色空间,人眼对颜色信号的敏感度远不如对亮度信号灵敏,所以色度信号的取样频率可以比亮度信号的取样频率低,以减少数字视频的数据量2.视频信号的数字化1-104BT.601、CIF、QCIF和SQCIF视频图像的格式视频信号的数字化(3)BT.601CIFQCIFSQCIF行数/帧像素/行行数/帧像素/行行数/帧像素/行行数/帧像素/行亮度(Y)57672028836014418096128色度(U)57636014418072904864色度(V)57636014418072904864BT.601格式:亮度Y取样频率13.5MHz,色度信号U与V减半CIF:公用中间分辨率格式QCIF:¼公用中间分辨率格式1-105⑴视频采集卡:简称视频卡,PC机中用于视频信号数字化的插卡。功能:将输入的模拟视频信号(及伴音信号)数字化并存储在硬盘中。数字化后的视频图像,经彩色空间转换(从YUV转换为RGB),与计算机图形显示卡产生的图像叠加,显示在屏幕上。获取数字视频的同时使用数字信号处理器(DSP)进行音频和视频数据的压缩编码视频卡与视频获取设备1-106视频卡、图形卡与主机之间的关系视频卡与视频获取设备(2)模拟视频输入视频获取器视频缓冲器电视/录像机电视编码器RGB显示器叠加/彩色转换图形控制器显示缓冲器DSP系统总线主存储器CPU硬盘1-107数字摄像头:在线获取数字视频的设备。通过光学镜头采集图像,然后直接将图像转换成数字信号并输入到PC机,不需视频采集卡进行模数转换。最高分辨率:640×480,一般:352×288,速度:30帧/s以下,镜头视角:45~60度大多数数字摄像头采用CCD光传感器,部分产品采用CMOS类型的光传感器,后者分辨率不能很高,但功耗低、速度快接口:USB接口,IEEE1394(火线)接口。视频卡与视频获取设备(3)
⑵数字摄像头,数字摄像机1-108数字摄像机:一种离线的数字视频获取设备。原理:与数码相机类似,功能更多压缩编码:视频图像及伴音使用M-JPEG或MPEG-2记录介质:磁带,硬盘接口:USB,IEEE1394视频卡与视频获取设备(4)1-109数字视频的数据量:很大。1分钟BT.601数字视频的数据量约为1G字节数字视频压缩的可行性:画面内部信息相关性很强相邻画面的内容具有高度的连贯性人眼的视觉特性4.5.2数字视频的压缩编码
数字视频压缩的可行性1-110视频压缩编码的标准及其应用名称源图像格式压缩后的码率主要应用MPEG-1CIF格式大约1.2Mb/s~1.5Mb/s适用于VCD、数码相机、数字摄像机等H.261CIF格式,QCIF格式P×64Kb/s(P=1、2时,只支持QCIF格式,P≥6时,可支持CIF格式)应用于视频通信,如可视电话、会议电视等MPEG-2(MP@ML)720×5765Mb/s~15Mb/s用途最广,如DVD,150路卫星电视直播,540路CATV等MPEG-2HighProfile1440×15521920×115280Mb/s~100Mb/s目标是高清晰度电视(HDTV)领域MPEG-4(H.324)多种不同的视频格式与MPEG-1,MPEG-2相当,但最低可达到64Kb/s适合于交互式多媒体应用,包括虚拟现实、远程教学、交互式电视等1-111MPEG-1:一种运动图像及其伴音的编码标准码率:1.2Mb/s~1.5Mb/s图像质量:200多线,相当于一般家用录像机应用:数码相机和数字摄像机VCD视频压缩编码的标准及其应用(2)1-112MPEG-2:针对数字电视(DTV)的应用要求码率:1.5Mb/s~60Mb/s甚至更高特点:通用性,向下兼容MPEG-1应用:数字卫星电视高清晰度电视(HDTV)领域数字视盘DVD视频压缩编码的标准及其应用(3)1-113MPEG-4:目标:支持各种网络条件下(包括移动通信)的交互式多媒体应用,侧重于对多媒体信息内容的访问支持:自然的(取样)和计算机合成视频和音频,功能强,应用前景广H.261:数字视频编码标准,由国际电联(ITU)前身CCITT制定,适用于在ISDN网上以p×64kbps(p=l,…,30)的速率开展视频会议和可视电话业务视频压缩编码的标准及其应用(4)1-114AVI(AudioVideoInterleavedFormat):一种音频/视频文件格式应用:Windows平台,在获取、编辑以及播放音频/视频流的应用软件中被广泛使用对压缩方法没有限制,只需在文件中加以说明,增强了可扩展性 例如,可使用MicrosoftRLE、MicrosoftVideo1、IntelIndeo3.1/3.2、Cinepak,MPEG、Motion-JPEG等压缩算法缺点:不适应在网络上对视频流的实时播放视频压缩编码的标准及其应用(5)1-115ASF(AdvancedStreamFormat)文件格式针对AVI文件的网络实时播放缺陷开发采用技术:WMVideo8和WMAudio8流媒体技术应用:互联网上视频直播(WebTV)、视频点播(VOD)、视频会议等RealNetworks公司的RealMediaRMVB影片
视频压缩编码的标准及其应用(6)1-116非线性编辑系统:摆脱了磁带顺序存取束缚的计算机视频编辑系统。节目制作是在大容量随机存取的磁盘存储器上进行,效率得到了极大的提高。系统组成:计算机主机、视(音)频卡、SCSI硬盘、视频编辑软件、控制装置使用模式:把电视节目素材存入硬盘中,根据需要对不同长短、不同顺序的素材进行剪辑,同时配上字幕、特技和各种动画,再进行配音、配乐,最终制作成高质量的电视节目功能:视频处理功能和数字特技机、字幕机、编辑机、调音台等众多功能核心软件:数字视频编辑器,如AdobePremiere4.5.3数字视频的编辑
非线性编辑系统1-117虚拟演播室:利用计算机生成运动或静止的三维场景,与现场拍摄的视频图像进行实时合成。在现场直播时,综合生成的三维场景,可不断变化更换,并根据演播室摄像机运动的位置显示出正确的透视
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 自立自强-职业院校新生入学教育 课件 第七章 心理健康-阳光心理你我同行
- 短直播培训课程
- 2024版出版发行劳务分包合同2篇
- 医疗器械商务讲解
- 2024年度工程拆除环保验收合同3篇
- 常见应用文写作课件
- 建筑检测机构培训
- 2024年度销售合同分销渠道管理2篇
- 散货港口管理实务
- 二零二四年度物流服务合同标的及服务项目2篇
- 银行保洁服务投标方案
- 焦点解决短期治疗
- 《马克思主义与社会科学方法论》授课教案
- 新教材高中英语Unit1Growingup课件外研选择性必修第二册
- 道德与法治-《平安出行》观课报告
- 遵守政治品德、职业道德、社会公德和家庭美德情况五篇
- 箱式变电站吊装方案
- 四大名著《西游记》语文课件PPT
- 农村生活污水处理设施运行维护费用指导价格指南(示范文本)
- 凸透镜成像规律动画可拖动最佳版swf
- GB/T 15242.3-1994液压缸活塞和活塞杆动密封装置用同轴密封件安装沟槽尺寸系列和公差
评论
0/150
提交评论