南大专转本计算机4.2-4.4_第1页
南大专转本计算机4.2-4.4_第2页
南大专转本计算机4.2-4.4_第3页
南大专转本计算机4.2-4.4_第4页
南大专转本计算机4.2-4.4_第5页
已阅读5页,还剩116页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.2文本与文本处理文字与文本文字:一种书面语言,由一系列称为“字符〞〔character〕的书写符号构成文本〔text〕:文字信息在计算机中的表示形式是基于特定字符集的、具有上下文相关性的一个〔二进制编码〕字符流是计算机中最常用的一种数字媒体组成文本的根本元素是字符,字符在计算机中采用二进制编码表示。文本处理过程文本在计算机中的处理过程:文本的准备〔例如汉字的输入〕,文本编辑,文本处理,文本存储与传输、文本展现等,根据应用的不同,各个处理环节的内容和要求可能有很大的差异。文本存储与传输(阅读器)文本处理(文本处理软件)文本生成其他媒体电子文本文本编辑(编辑器)格式化的电子文本文本展现4.2.1字符的编码西文字符的编码字符集:常用字符的集合。西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。字符的编码:字符集中每一个字符各有一个代码,即字符的二进制表示,称为该字符的编码。字符代码表:字符集中不同字符的编码互相区别,构成该字符集的代码表。美国标准信息交换码(AmericanStandardCodeforInformationInterchange):使用7个二进位对字符进行编码〔叫做标准ASCII码〕,称为ISO-646标准。根本的ASCII字符集共有128个字符96个可打印字符〔常用字母、数字、标点符号等〕32个控制字符特殊字符的ASCII码空格〔32〕A〔65〕a〔97〕0〔48〕ASCII字符集和ASCII码0123456789ABCDEF控制字符01234567b3b2b1b0b6b5b4标准ASCII码是七位的编码,但字节是计算机中最根本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般保持为“0〞,在数据传输时可用作奇偶校验位。扩充ASCII字符集:标准ASCII字符集只有128个不同的字符,在很多应用中无法满足要求。按照ISO2022标准〔?七位字符集的代码扩充技术?〕的规定,ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为1的8位代码〔十进制数128~255〕,称为扩展ASCII码。扩充ASCII字符集〔1〕GB2312-80汉字编码?信息交换用汉字编码字符集·根本集?(GB2312-80)组成:第一局部:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个〔统称为GB2312图形符号〕第二局部:一级常用汉字,共3755个, 按汉语拼音排列第三局部:二级常用字,共3008个, 按偏旁部首排列汉字的编码〔一〕汉字6763所有字符7445〔1〕GB2312-80汉字编码区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示, 如:“大〞字的区号20,位号83,区位码是2083 用2个字节表示为:0001010001010011汉字的编码〔二〕〔1〕GB2312-80汉字编码汉字的编码〔三〕一级汉字(3755个)二级汉字(3008个)(扩充使用)位号: ………………19423字母、数字和各种符号…………区号:191655568794GB2312-80字符集〔1〕GB2312-80汉字编码机内码:问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,它与单字节的标准ASCII码就会混淆不清。解决方法:把一个汉字看作两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位(b7)都等于“1〞。这种高位为l的双字节(16位)汉字编码就称为GB2312汉字的“机内码〞,又称内码。如:“大〞字的内码是:1011010011110011〔B4F3〕汉字的编码〔四〕〔1〕GB2312-80汉字编码 GB2312汉字内 码在双字节代 码空间中,其 码位分布于右 下角的1/4象限汉字的编码〔五〕首字节尾字节00 7EA1 FE0081A1FEGB2312图形符号GB2312汉字代码空间(6763个汉字)GB2312-80汉字内码的码位分布B0F7〔2〕GBK汉字内码扩充标准问题:GB2312-80只有6763个汉字,使用时功能不够。解决方法:1995年发布GBK,全称为?汉字内码扩展标准?GBK字符集中一共有21003个汉字和883个图形符号,它与GB2312国标汉字字符集及其内码保持兼容。GBK/1:GB2312中的符号;

GBK/2:GB2312中的全部汉字;

GBK/4和GBK/3:包括繁体字在内的大量汉字;

GBK/5:符号。例如計算機係等繁体汉字和冃冄円冇鎔等生僻的汉字。汉字的编码〔六〕〔2〕GBK汉字内码扩充标准组成:21003个汉字,883个图形符号GBK字符集中的每个字符都采用双字节表示,总的编码范围为8140-FEFE,首字节在81-FE之间,尾字节在40-FE之间(剔除xx7F一条线不安排字符), 总计23940个码位, 共收入21886个汉字 和图形符号,未使 用的区域作为用户 自定义区。汉字的编码〔七〕首字节尾字节00407EA1 FE0081FEGBK/3GBK/4GBK/2GBK/5GBK/1GB2312图形符号GB2312汉字代码空间〔6763个汉字〕A0AAGBK/1B0F7GBK代码控件和码位分布繁体字符号〔2〕GBK汉字内码扩充标准应用:操作系统——Windows95以上简体中文版,采用GBK代码,并提供了多种输入法和字体应用软件——Office95以上简体中文版本提供GBK码的检索和排序互联网应用——许多网站的网页使用GBK代码,但目前还不是所有搜索引擎都支持GBK汉字文本的搜索汉字的编码〔八〕〔3〕UCS/Unicode与GB18030汉字编码标准〔a〕通用编码字符集UCS/Unicode约有6800种语言和文字在使用,需要建立一个多文种〔Multilingual〕处理环境在ISO2022根底上,使用代码页号切换不同字符集的方法过于繁琐,且与其他系统不兼容目标与途径:实现所有字符在同一字符集中统一编码汉字的编码〔九〕4.2.2文本的准备人工输入:通过键盘、手写笔或语音输入方式输入字符特点:速度慢、本钱高,不适合需处理大批量文字的应用自动输入:将纸介质上的文本通过识别技术自动转换为文字的编码特点:速度快,效率高文字的自动识别分为:印刷体识别和手写体识别文本信息的输入方法文本信息的输入人工输入自动识别输入键盘输入联机手写输入语音输入印刷体识别手写体识别由于汉字字数很多,无法使每个汉字与西文键盘上的键一一对应,因此必须使用一个或几个键来表示汉字,这就称为汉字的“键盘输入编码〞好的汉字键盘输入编码方案的特点:易学习、易记忆、效率高(平均击键次数较少)、重码少、容量大(可输入的汉字字数多)等汉字的输入编码与汉字的内码是不同范畴的概念。使用不同的输入编码方法向计算机输入的同一个汉字,它们的内码是相同的汉字键盘输入〔一〕汉字输入编码方法的分类数字编码:使用一串数字来表示汉字的编码方法,例如电报码、区位码等缺点:难以记忆,不易推广字音编码:一种基于汉语拼音的编码方法,简单易学,适合于非专业人员缺点:同音字引起的重码多,需增加选择操作字形编码:将汉字的字形分解归类而给出的编码方法,重码少、输入速度较快,如五笔字形法和表形码等缺点:编码规那么不易掌握形音编码:吸取了字音编码和字形编码的优点,使编码规那么适当简化、重码减少缺点:不易掌握汉字键盘输入〔二〕以平常书写的习惯,把要输入的汉字写在一块叫书写板的设备上,书写板将笔尖的运动〔包括抬笔、落笔、笔段轨迹以及各笔段之间的时间关系等〕按时间采样后发送到计算机中,由计算机软件自动进行识别,然后用该汉字〔或符号〕对应的代码进行保存。汉王笔正识率95℅~90℅,速度12字/秒中科院自动化所,华旗资讯科技开展〔爱国者〕联机手写汉字识别〔笔输入〕使用语音输入文本的系统也叫做“听写机〞或“语音打字机〞按照不同的应用及要求,语音识别的功能区别:孤立语音/连续语音识别小词汇量/大词汇量语音识别特定人/非特定人语音识别最高目标:非特定人大词汇量的连续语音识别技术汉语语音识别印刷体汉字识别:将传统纸介质上的文字信息自动输入计算机并转换为数字文本形式的一种技术,也叫做汉字OCR〔OpticalCharacterRecognition〕。印刷体文字识别的过程印刷体汉字识别〔汉字OCR〕扫描后的图像文本预处理版面分析文字切分特征提取字符识别后处理识别后的编码文本手写汉字识别联机与脱机(手写汉字识别)的比较脱机手写汉字识别4.2.3文本的类型文本是计算机表示文字及符号信息的最常用也是最根本的一种数字媒体。由于文字和符号采用了二进制编码表示,因而可以方便地进行编辑、排版和各种分析处理〔如统计、排序、分类、索引、检索等〕。使用计算机制作的数字文本,根据用途分为:简单文本、丰富格式文本和超文本三类。简单文本〔plaintext〕:是由一连串的字符组成的,除了用于表达正文内容的字符〔包括汉字〕及“回车〞、“换行〞、“制表〞等有限的几个打印〔显示〕控制字符之外,几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或ASCII文本,在PC机中的文件后缀名是.txt特性:呈现为一种线性结构,以行、字为单位,顺序写作与阅读是最通用的文本文件格式,文件体积小,阅读不受限制,几乎所有的文字处理软件都能识别和处理不能插入图片、表格等,不能建立超链接简单文本〔纯文本〕文本的格式化丰富格式文本〔richtext、fancytext、formattedtext〕RTF格式多媒体文档〔MultimediaDocument〕丰富格式文本线性文本超文本(hypertext)的阅读方式传统的顺序式阅读通过链接、跳转、导航、回溯等操作实现跳跃式阅读超文本的结构节点〔node〕节点包含的内容超链〔hyperlink〕链源链宿超文本超文本ABCDEFGH超文本结构超媒体〔Hypermedia〕:超文本中的节点不单是文本节点,还包含图形、图像、声音或动画节点,这种基于多媒体信息结点的超文本,有时也称为“超媒体〞超文本的应用Windows等一些软件中的“帮助〞文件使用浏览器从Web效劳器上下载的网页〔html或htm文件〕超文本4.2.4文本处理文本编辑的主要功能对字、词、句、段落进行添加、删除、修改等操作字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等段落的处理:设置行距、段间距、段缩进、对称方式等页面布局的处理:设置页边距、每页行列数、分栏、页眉、页脚等“所见即所得〞〔WhatYouSeeIsWhatYouGet,简称WYSIWYG〕:一方面所有的编辑操作效果立即可以在屏幕上看到,另一方面在屏幕上看到的效果与打印机的输出结果相同。文本编辑与文本处理〔一〕文本处理内容:字数统计,字频统计,简/繁体相互转换,汉字/拼音相互转换词语排序,词语错误检测,文句语法检查自动分词,词频统计,词性标注,词义辨识,大陆/台湾术语转换文本压缩,文本加密,文本著作权保护关键词提取,文摘自动生成,文本分类文本检索〔关键词检索、全文检索〕,文本过滤文语转换〔语音合成〕,文种转换〔机器翻译〕篇章理解,自动问答,自动写作等文本编辑与文本处理〔二〕〔1〕面向通信的文本处理软件 计算机网络上最普及的应用是用电子邮件进行通信。大多数情况下电子邮件正文的内容一般都是简单文本,因此电子邮件内嵌的文本编辑器功能比较简单,操作使用方便。典型软件:微软公司的OutlookExpress,具有文字的增、删、改以及字体、字号的设置功能,也可以设定一些简单的格式和插入一些图片。当然邮件所带的附件并不受此限制。在互联网上进行聊天所使用的文本处理软件更加简单。常用文本处理软件〔一〕〔2〕面向办公的文本处理软件功能要求:文本制作的高效率、高质量软件面向非专业用户,易学好用文本处理能力,既功能丰富,又操作简单排版功能典型软件:MS-OfficeWPS2000永中Office中的文本处理软件常用文本处理软件〔二〕〔3〕面向出版的文本处理软件排版软件的主要功能:将文字、图形和图像等合理地安排在页面内.ps文件:排版软件的输出的一种使用页面描述语言〔例如PostScript〕描述的文件,该文件记录了每一个页面的排版结果,它被送到装有栅格图像处理器〔RIP〕的激光照排机去,经过RIP的解释,产生页面的图像,然后驱动激光束对感光材料进行扫描曝光,以得到用于制版的胶片典型排版软件:方正集团公司的“飞腾〞排版软件美国Adobe公司的PageMaker和PDFWriter常用文本处理软件〔三〕〔4〕面向网络信息发布和电子出版的文本处理软件制作HTML文件的软件:微软的FrontPage,使用Word也可以产生HTML文件输出。HTML文件:一种使用HTML语言〔超文本标记语言〕进行描述的文本文件。使用形如<xxx>和</xxx>的一对“括号〞作为标记,指出文本中的标题、文本的分段及格式,描述文本中的表格类型、文本的分区、背景颜色、文字的颜色、字体和大小,设定文本页面的边距、文本中插图的位置、大小及图片名称等,最重要的是它能描述超链。超链的链宿有两种:书签,指的是文本内部标记有书签的某个地方互联网上的某个信息资源〔文件〕,它用统一资源定位器〔URL〕指定常用文本处理软件〔四〕〔4〕面向网络信息发布和电子出版的文本处理软件面向电子出版的软件PDF格式文件常用文本处理软件〔五〕文本输出:在屏幕上显示文本,用打印机打印文本等操作。文本输出过程:首先要对文本的格式描述进行解释,然后生成文字和图表的映像〔bitmap〕,最后再传送到显示器或打印机输出。文本阅读器:承担上述文本输出任务的软件,也称为浏览器。它们可以是嵌入在文本处理软件中的一个模块,如微软的Word,也可以是独立的软件,如Adobe公司的AcrobatReader,微软公司的IE等。文本的输出〔一〕文字〔汉字〕字形的生成过程:先根据字符的字体确定相应的字型库〔font〕,再按照该字符的代码从字型库中取出该字符的形状描述信息,然后按形状描述信息生成字形,并按照字号大小及有关属性〔粗体、斜体、下横线〕将字形作必要的变换,最后将变换得到的字形放置在页面的指定位置处。字型库:简称字库,同一种字体的所有字符(例如GB2312中的7000多字符)的形状描述信息的集合。不同的字体(如宋体、仿宋、楷体、黑体等)对应不同的字库。文本的输出〔二〕字符形状的描述方法:点阵描述轮廓描述文本的输出〔三〕字符的点阵描述字符的轮廓描述4.3图像与图形从现实世界中通过数字化设备获取的图像,称为:取样图像〔sampledimage〕、点阵图像〔dotmatriximage〕、位图图像〔bitmapimage〕——简称图像〔image〕计算机合成的图像(syntheticimage),称为:矢量图形〔vectorgraphics〕,简称图形〔graphics〕图像按生成方法分类4.3.1图像的获取图像的获取〔capturing〕:从现实世界中获得数字图像的过程图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤:取样分色量化图像的数字化〔一〕图像的数字化过程图像的数字化〔二〕模拟图像取样分色量化量化量化数字图像RGB设备:从现实世界获得数字图像过程中所使用的设备通称为数字图像获取设备设备的功能:将现实的景物输入到计算机内并以取样图像的形式表示2D图像获取设备〔如扫描仪、数码相机等〕只能对图片或景物的2D投影进行数字化3D扫描仪能获取包括深度信息在内的3D景物的信息数字图像获取设备4.3.2图像的表示与压缩编码从取样图像的获取过程可以知道,一幅取样图像由M〔行〕*N〔列〕个取样点组成,每个取样点是组成取样图像的根本单位,称为像素〔pictureelement,简写为pel〕。彩色图像的像素是矢量,它由多个彩色分量组成,黑白图像的像素只有1个亮度值图像的表示方法与主要参数彩色图像的表示图像的表示方法与主要参数155156159170150151175176150154159166156158177178147153158162156168180188168175175174177182187183225225219217216218223227225224221220214215222225240233226223219220224229233231229226220220227230178176176176176205216226179178175180177200223231174175178184181189217224208203208196193197216225212210215202192196207218211212212210198194207210224227224214197196213220228231233220202197210217180177187190190220225231182184179188192217239233182185190191194207229235219215218198198205220237211214218202192195212234217214213210194192214238222225226214197200216230228230230225200206212220红色分量绿色分量蓝色分量取样图像在计算机中的表示方法:单色图像用一个矩阵来表示彩色图像用一组〔一般是3个〕矩阵来表示,矩阵的行数称为图像的垂直分辨率,列数称为图像的水平分辨率,矩阵中的元素是像素颜色分量的亮度值,使用整数表示,一般是8位至12位图像的表示方法与主要参数图像的属性信息图像大小,也称图像分辨率(包括垂直分辨率和水平分辨率)位平面的数目,即矩阵的数目,也就是彩色分量的数目颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色〔亮度〕的最大数目图像的表示方法与主要参数图象文件的大小图象文件名图象大小、深度、类型白色小车点阵图示行驶中的白色小车一幅图像的数据量可按下面的公式进行计算〔以字节为单位〕:图像数据量=图像水平分辨率×图像垂直分辨率×像素深度/8几种常用图像的数据量图像的压缩编码图像大小8位(256色)16位(65536色)24位(真彩色)640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1280×10241.25MB2.5MB3.75MB图像数据压缩的可能性:由于数字图像中的数据相关性很强,数据的冗余度很大,因此对数字图像进行大幅度的数据压缩是完全可能的。而且,人眼的视觉有一定的局限性,即使压缩前后的图像有一定失真,只要限制在人眼允许的误差范围之内,也是允许的。图像的压缩编码数据压缩类型无损压缩:压缩以后的数据进行图像复原(也称为解压缩)时,重建的图像与原始图像完全相同 例如:行程长度编码〔runlengthcoding,RLC〕: 哈夫曼(Huffman)编码:对出现概率高〔低〕的编短〔长〕码,是变长码有损压缩:使用压缩后的数据进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响人们对图像含义的正确理解。如变换编码、矢量编码等图像的压缩编码图像压缩方法很多,不同方法适用于不同的应用,在计算机中常常是多种压缩方法的综合使用。为得到较高的数据压缩比,一般都采用有损压缩。压缩编码方法优劣的评价压缩倍数的大小重建图像的质量〔有损压缩时〕压缩算法的复杂程度图像的压缩编码图像压缩编码方法的国际标准和工业标准:ISO和IEC两个国际机构联合组成了一个专家组(JointPhotographicExpertsGroup,JPEG),制定了一个静止图像数据压缩编码的国际标准,称为JPEG标准JPEG标准的特点:适用范围广;能处理各种连续色调的彩色或灰度图像;算法复杂度适中;既可用硬件实现,也可用软件实现;图像的压缩比可控制〔压缩比越低,图像质量越好;压缩比越高,图像质量越差〕JPEG2000:适用于各种不同类型〔黑白、灰度、彩色等〕和不同特性〔自然、医学、遥感、合成〕的图像,可用于不同的应用模式〔实时传输、检索、存档等〕。采用了小波分析等先进算法,提供了更好的图像质量,更低的码率,更适合在WWW网上传输等,它兼容JPEG图像的压缩编码JPEG图像压缩比例

图像的压缩编码中等压缩后的图像高倍压缩后的图像常用图像文件格式名称压缩编码方法性质典型应用开发组织/公司BMPRLC无损Windows应用程序MicrosoftTIFRLC,LZW无损DesktoppublishingAldus,MicrosoftGIFLZW无损InternetCompuServeJPEGDCT,Huffman无损/有损Internet,数码相机等ISO/IECJP2小波变换,算术编码无损/有损Internet,数码相机等ISO/IECBMP(BitMaP-file)图像:微软公司在Windows操作系统下使用的一种标准图像文件格式,一个文件存放一幅图像,可以使用行程长度编码〔RLC〕进行无损压缩,也可不压缩。不压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows应用软件都能支持。TIFF(TaggedImageFileFormat)图像文件格式:用于扫描仪和桌面出版,能支持多种压缩方法和多种不同类型的图像,有许多图像图形应用软件支持这种文件格式。由文件头、文件目录、目录条目三个局部组成。常用图像文件格式GIF(GraphicsInterchangeFormat):互联网上广泛使用的一种图像文件格式,它的颜色数目较少〔不超过256色〕,文件特别小,适合网络传输。由于颜色数目有限,GIF适用于插图、剪贴画等色彩数目不多的应用场合。GIF格式能够支持透明背景,具有在屏幕上渐进显示的功能。尤为突出的是,它可以将许多张图像保存在同一个文件中,显示时按预先规定的时间间隔逐一进行显示,从而形成动画的效果,因而在网页制作中大量使用。由CompuServe公司1987年开发,基于Lempel-ZivWalch(LZW)压缩算法、使用特殊码、可变长度。常用图像文件格式4.2.3计算机图形矢量图形:计算机合成图像矢量绘图软件:制作矢量图形的软件 如:AutoCAD、MAPInfo、ARCInfo等2D的矢量绘图软件:Corel公司的CorelDrawAdobe公司的IllustratorMacromedia公司的FreeHand微软公司的MicrosoftVisio微软公司Office办公套件中的Word和PowerPoint矢量绘图软件4.4数字声音及应用4.4.1波形声音的获取与播放声音:由振动而产生,通过空气进行传播。它由许多不同频率的谐波所组成,谐波的频率范围称为声音的带宽(bandwidth),带宽是声音的一项重要参数。多媒体技术处理的声音信号主要是人耳可听到的20~20kHz的音频信号(audio)言语〔speech〕/语音:人说话的声音,其频率范围约为300~3400Hz全频带声音:音乐声、风雨声、汽车声等其他声音,其带宽可到达20~20kHz声音信号的数字化声音信号的数字化:将模拟声音信号转换成数字编码形式以便于计算机进行处理的过程声音信号数字化的过程:取样量化编码声音信号的数字化模拟声音信号取样量化编码数字声音011010011101……A/D转换〔模拟信号->数字编码〕电压值时间间隔A/D转换〔模拟信号->数字编码〕电压值时间间隔模拟声音信号取样量化编码数字声音麦克风:将声波转换为电信号声卡〔soundcard〕:进行数字化波形声音的获取:把模拟的声音信号转换为数字形式。(话筒或线路输入、单双道〕波形声音的重建与播放MIDI(MusicalInstrumentDigitalInterface)声音的输入MIDI声音的合成与播放波形声音的获取设备声卡的工作原理波形声音的获取与重建取样、量化DSPMIDI合成器重建、滤波D/A声音输入数字声音输出声音输出DMA接口PCI总线MIDI接口4.4.2波形声音的表示与压缩编码取样频率量化位数声道数目使用的压缩编码方法数码率〔bitrate〕:指的是每秒钟的数据量,也称比特率、码率数字声音未压缩前,其计算公式为:波形声音的码率=取样频率×量化位数×声道数压缩编码以后的码率=压缩前的码率/压缩倍数波形声音的主要参数几种常见数字声音的主要参数

波形声音的主要参数声音类型带宽(Hz)取样频率(kHz)量化位数(bits)声道数未压缩时的码率压缩后的码率数字语音300~340088164kb/s2~64kb/sCD唱片20~2000044.1162176.4kB/s176.4kB/sMP3音乐20~2000044.1162176.4kB/s128~112kb/s第2代全频带声音压缩编码标准全频带声音的压缩编码名称压缩后的码率(每个声道)声道数目主要应用MPEG-1层1384kbps(压缩4倍)2数字盒式录音带MPEG-1层2256~192kbps(压缩6~8倍)2DAB,VCD,DVDMPEG-1层3128~112kbps(压缩10~12倍)2Internet,MP3音乐MPEG-2层audio与MPEG-1层1,层2,层3相同5.1,7.0同MPEG-1DolbyAC-364kbps5.1,7.1DVD,DTV,家庭影院杜比数字AC-3〔DolbyDigitalAC-3〕:美国杜比公司开发的多声道全频带声音编码系统,它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和复原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。全频带声音的压缩编码声音流媒体产品RealNetworks公司的RA〔RealAudio〕数字音频微软公司的WMA〔WindowsMediaAudio〕数字音频苹果公司的QuickTime全频带声音的压缩编码4.4.3波形声音的编辑根本编辑操作声音的剪辑〔删除、移动或复制一段声音,插入空白等〕声音音量调节〔提高或降低音量,淡入、淡出处理等〕声音的反转持续时间的压缩/拉伸消除噪音声音的频谱分析声音的效果处理包括混响、回声、延迟、频率均衡、和声效果、动态效果、升降调、颤音等格式转换功能其他功能如分轨录音,配音,刻录CD唱片等声音编辑软件的功能声音编辑软件的界面时间刻度左声道信号波形淡入淡出播放标尺右声道信号波形数字声音的参数4.4.4计算机合成声音语音合成〔Speechsynthesis〕:根据语言学和自然语言理解的知识,使计算机模仿人的发声,自动生成语音的过程。目前主要是按照文本〔书面语言〕进行语音合成,这个过程称为文语转换〔Text-To-Speech,简称TTS〕。文语转换过程文本分析韵律分析语音生成语音合成文语转换过程语音合成文本文本分析韵律处理语音合成合成语音词典,发音规则韵律规则库语音库语音库:语音库中存储了大量预先录制的语音基元〔单音、词组、短语或句子〕的波形,合成时读取语音基元的波形,将这些波形进行拼接和韵律修饰,然后输出连续语音流。对计算机合成的语音希望能到达的要求:发音清晰可懂语气语调自然说话人可选择语速可变化等语音合成计算机合成语音的应用:股票交易、航班动态查询、报税等业务有声E-mail效劳CAI课件或游戏解说词的自动配音文稿校对、语言学习、语音秘书、自动报警、残疾人效劳等语音合成MIDI规定:乐谱中的音符及其定时、速度、音色〔乐器〕等采用MIDI消息〔MIDImessage〕进行描述每个MIDI消息描述一个音乐事件〔如开始演奏某个音符、结束演奏某个音符、选择音符的音色、改变演奏速度等〕一首乐曲所对应的全部MIDI消息组成一个MIDI文件MIDI文件在计算机中的文件扩展名为.MID,它是计算机合成音乐的交换标准,也是商业音乐作品发行的标准音乐合成MIDI音乐的制作与播放:音乐合成实时演奏MIDI键盘MIDI消息乐谱输入音序器软件MIDI文件媒体播放器MIDI合成器MIDI消息MIDI音乐MIDI文件在Windows系统中可以使用媒体播放器进行播放。播放MIDI音乐的过程:媒体播放器软件从磁盘上读入MID文件把其中的一个个MIDI消息发送给声卡上的音乐合成器由音乐合成器解释并执行MIDI消息所规定的操作合成出各种音色的音符,通过扬声器播放出乐曲来音乐合成由PC计算机、声卡、MIDI演奏器和音序器软件等构成的个人电脑音乐系统,彻底改变了传统的音乐制作方式和概念。原来需要由多人才能完成的工作现在只需一个人即可记录音乐的方式也由原来的乐谱变成了MIDI文件音乐作品由修改困难变为可任意编辑修改强大的电脑编辑功能不仅提高了音乐表现的精确性,同时也降低了制作者对演奏技术的依赖性,使本属于专业音乐工作者的音乐制作变成了一种群众化的、个人的音乐行为和活动音乐合成4.4.5数字视频及应用数字视频根底视频〔video〕:指的是内容随时间变化的一个图像序列,也称为活动图像(motionpicture)。常见的视频有电视和计算机动画。电视:能传输和再现真实世界的图像与声音,是当代最有影响力的信息传播工具。数字视频:数字化的电视信号称为数字视频。计算机动画:是计算机制作的图像序列,是一种计算机合成的视频。根本概念电视画面:一种光栅扫描图像,一般采用隔行扫描方式,即图像由奇数场和偶数场两局部组成,合起来组成一帧图像PAL制式〔中国采用〕帧频25帧/s,场频50场/s,图像的垂直分辨率〔一帧图像中的扫描线总数〕625线,可见局部575线,不可见的回扫线50线,→电视信号行频为625×25=15.625kHz远距离传输时用亮度信号Y和两个色度信号U、V来表示,优点:能与黑白电视接收机保持兼容,Y分量由黑白电视机直接显示而无需做进一步处理可利用人眼对两个色度信号不太灵敏的视觉特性来节省电视信号的带宽和发射功率电视根本知识彩色信号的YUV表示与RGB表示的转换:

亮度分量

Y=0.3×R+0.59×G+0.11×B

色度分量

U=0.493×(B-Y) 色度分量

V=0.877×(R-Y)电视根本知识数字视频与模拟视频相比的优点:复制和传输时不会造成质量下降容易进行编辑修改有利于传输(抗干扰能力强,易于加密)可节省频率资源视频信号的数字化:以一帧帧画面为单位进行由于采用YUV彩色空间,人眼对颜色信号的敏感度远不如对亮度信号灵敏,所以色度信号的取样频率可以比亮度信号的取样频率低,以减少数字视频的数据量视频信号的数字化常用的色度信号取样格式:4:4:4格式〔色度信号的取样与亮度信号完全一样〕4:2:2格式〔每条扫描线上色度信号的取样只是亮度信号的一半〕4:2:0格式〔在水平和垂直方向上色度信号的取样都只是亮度信号的一半〕视频信号的数字化4:4:44:2:24:2:0亮度信号色度信号CCIR601,CIF,QCIF和SQCIF视频图像的格式视频信号的数字化CCIR601CIFQCIFSQCIF行数/帧像素/行行数/帧像素/行行数/帧像素/行行数/帧像素/行亮度(Y)57672028836014418096128色度(U)57636014418072904864色度(V)57636014418072904864视频采集卡:简称视频卡,PC机中用于视频信号数字化的插卡。功能:将模拟视频信号〔及伴音信号〕数字化并存储在硬盘中。数字化后的视频图像,经彩色空间转换〔从YUV转换为RGB〕,与计算机图形显示卡产生的图像叠加,显示在屏幕上。获取数字视频的同时使用数字信号处理器〔DSP〕进行音频和视频数据的压缩编码视频卡与视频获取设备视频卡、图形卡与主机之间的关系视频卡与视频获取设备模拟视频输入视频获取器视频缓冲器电视/录像机电视编码器RGB显示器叠加/彩色转换图形控制器显示缓冲器DSPCODEC系统总线主存储器CPU硬盘数字摄像头:在线获取数字视频的设备。通过光学镜头采集图像,然后直接将图像转换成数字信号并输入到PC机,不需视频采集卡进行模数转换。最高分辨率:640×480,一般:352×288,速度:30帧/s以下,镜头视角:45~60度光传感器:大多采用CCD,局部采用CMOS,后者分辨率不能很高,但功耗低、速度快接口:USB接口,IEEE1394〔火线〕接口。视频卡与视频获取设备数字摄像机:一种离线的数字视频获取设备。原理:与数码相机类似,功能更多压缩编码:视频图像及伴音使用M-JPEG或MPEG-2记录介质:磁带,硬盘接口:USB,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论