专转本计算机全程2016最第5章_第1页
专转本计算机全程2016最第5章_第2页
专转本计算机全程2016最第5章_第3页
专转本计算机全程2016最第5章_第4页
专转本计算机全程2016最第5章_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章数字媒体及应用5.1

文本与文本处理5.2

图像与图形5.3

数字声音及应用5.4数字视频及应用5.1文本与文本处理

5.1.1字符的编码5.1.2文字符号的输入5.1.3文本的分类5.1.4文本编辑、排版与处理5.1.5文本的展现文字处理是计算机应用的基础计算机应用=使用计算机进行信息处理其中,文字处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。文字数值语言音乐图像···信息的形态有多种计算机文字处理过程文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文本由一系列“字符”(character)组成,每个字符均使用二进制编码表示文本在计算机中的处理过程是:(文本编辑器)文本编辑与排版格式化的电子文本(2)文本展现(文本阅读器)(5)文本处理

(文本处理)(3)文本准备电子文本(1)(文字与图表的输入)文本存储与传输(4)(存档/通信软件)5.1.1.

字符的编码字符、字符集及其编码表文字的基本元素是字母和符号,统称为“字符”(character),它包括:字母、数字、标点、符号等字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等字符的编码:字符集中每个字符的二进位表示,称为该字符的编码或代码(code)不同的字符其编码各不相同复习:西文字符的编码——ASCII码西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国信息交换标准码(ASCII码):ASCII字符集包含96个可打印字符和32个控制字符采用7个二进位进行编码计算机中使用1个字节存储1个ASCII字符存在问题:字符集太小(只有128个字符)不同国家和地区使用不同的字符集及其编码,互不兼容0XXXXXXX汉字如何编码?汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多个国家和地区使用(中、日、韩、新、马······)汉字的特点数量大;字形复杂,同音字多,异体字多如何编码?确定收入多少字、哪些字?在字符集中如何排列?使用多少个二进位进行编码?常用的汉字编码字符集国家标准GB2312-1980汉字扩充规范GBK(已被GB18030取代)国家标准GB18030-2005港澳台使用的汉字编码字符集CNS11643(BIG5,俗称“大五码”)UCS/Unicode多文种大字符集Unicode的UTF-8Unicode的UTF-16一级汉字(3755个)二级汉字(3008个)(扩充使用)字母、数字和各种符号 ………………19423位号…………191655568794区号(按汉语拼音排列)(按偏旁部首排列)GB2312汉字编码字符集1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980GB2312字符集由三个部分构成:拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个共6763个汉字和682个符号,每个汉字和符号都有一个确定位置GB2312汉字的编码每一个GB2312汉字使用16位(2个字节)表示为了与ASCII字符相区别,每个字节的最高位均为“1”例如:“南”字的代码是1100010011001111(用十六进制表示为C4CF)

11第1字节第2字节XXXXXXXXXXXXXXGBK汉字内码扩充规范GB2312的不足:汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容GBK汉字内码扩充规范(1995):在GB2312基础上,增加了1万多汉字(包括繁体字)和符号共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”:1

X第1字节第2字节XXXXXXXXXXXXXXUCS/Unicode多文种大字符集背景:为了实现全球数以千计的不同语言文字的统一编码方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前共收集了17x216=1,114,112个),称为UCS/UnicodeUCS/Unicode的编码方案:先实现部分字符的编码(近11万个字符)尽量与已有编码标准兼容包含有中、日、韩、越统一整理出来的约7万汉字(称CJKV汉字)允许有若干不同的编码方案,常用的两种是:单字节:ASCII字符双字节:拉丁、希腊、阿拉伯,···三字节:CJKV汉字四字节:其他Unicode:UTF-8单字节可变长编码应用:Linux,Web网页,电子邮件双字节:ASCII字符、拉丁、希腊、阿拉伯,常用CJKV汉字,···四字节:非常用CJKV汉字Unicode:UTF-16双字节可变长编码应用:Windows,Mac,Java,···GB18030汉字编码标准背景:无论是Unicode的UTF-8还是UTF-16,其CJK汉字字符集虽然覆盖了我国已使用多年的GB2312和GBK标准中的汉字,但它们的编码并不相同为了既能与UCS/Unicode编码标准接轨,又能保护我国已有的大量汉字信息资源,我国在2000年和2005年两次发布GB18030汉字编码国家标准。GB18030实质上是UCS/Unicode字符集的另一种编码方案:单字节编码(128个)表示ASCII字符双字节编码(23940个)表示汉字,与GBK(以及GB2312)保持向下兼容,GBK不再使用四字节编码(约158万个)用于表示UCS/Unicode中的其他字符GB18030目前已在我国信息处理产品中强制贯彻执行。标准名称GB2312GBKGB18030UCS-2(Unicode)字符集6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)近3万汉字(包括GBK汉字和CJKV及其扩充中的汉字)包含近11万字符,其中的汉字与GB18030相同编码方法双字节存储和表示,每个字节的最高位均为“1”双字节存储和表示,第1个字节的最高位必为“1”部分双字节、部分4字节表示,双字节表示方案与GBK相同UTF-8采用单字节可变长编码

UTF-16采用双字节可变长编码兼容性编码不兼容!小结:几种汉字编码的对比编码保持向下兼容小结:不同编码标准,不同的表示!与字符的编码一样,图像、声音、视频等也分别有许多编码标准,如:国际标准(ISO)、国家标准(GB)、工业标准、企业标准等,这也是信息处理复杂性的原因之一。由于采用不同的编码标准,相同文字在计算机中可以有不同的二进制代码表示。例如:“南京大学1234ABCD”的3种表示:C4CFBEA9B4F3D1A73132333441424344E58D97E4BAACE5A4A7E5ADA631323334414243445753AC4E2759665B31003200330034004100420043004400GBUTF-8UTF-16LE5.1.2.文字符号的输入

——文稿如何输入计算机

文字符号输入计算机的方法键盘输入自动识别输入字符信息的输入人工输入(1)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等(3)字形编码,如五笔字形和表形码等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法文字符号输入计算机的方法键盘输入联机手写输入自动识别输入字符信息的输入人工输入优点:自然,流畅小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低文字符号输入计算机的方法键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入优点:自然,方便,适合移动计算不足:对说话人、说话方式、说话内容的适应能力要大大增强识别速度和正确性还需大大提高文字符号输入计算机的方法光学字符识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入扫描仪OCR数字文本纸介质文本文本的映象(image)识别率已达到98%功能:简、繁体字混合识别中文、西文混合识别文字、表格混合识别智能校对功能文字符号输入计算机的方法光学字符识别条形码、磁卡、IC卡、RFID识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入

预先进行标识扫描识别输入汉字的键盘输入

汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码”好的汉字键盘输入编码应具有的特点:易学习、易记忆效率高(平均击键次数较少)重码少容量大(可输入的汉字字数多)

条形码定位标志数据区

一维条形码将宽度不等的黑条和白条按一定的编码规则排列成平行线图案,用以对物品进行标识只在一个方向表达信息,信息量有限(几十个字符),只能包含字母、数字和一些特殊符号

二维条形码在平面(二维方向)上以黑白相间的图形记录文字和符号信息,信息容量大QR条码可容纳7089个数字,或者4296个字母,或者1800个汉字,也可以表示签字、指纹等信息检错和纠错功能较强,能360度全方位识读,可靠性高可引入加密技术,保密性、防伪性较好(QR条码)(商品条码)二维码读出的二维码内容(未解密):260023681484413027974380791246646215467164436949994772279810109943200000000000000000000053897628805389762880538976288053897628805389762881428000

常用自动识别输入技术的比较一维条形码二维条形码磁卡接触式IC卡非接触式IC卡/RFID信息量小较小较小大大读/写只读只读可读/可写可读/可写可读/可写标识成本很低低较低中等较低识读成本低低较低中等中等优点成本低,抗磁力抗静电成本低,抗磁力抗静电成本较低,可读写成本适中,可读写,安全信息量大,可读写,安全方便缺点信息量小信息量较小安全性一般需接触式识读成本较高5.1.4文本的编辑与排版使用Word的操作流程创建新文档或打开老文档文稿输入编辑排版文档存盘、打印或发送输入中西文字、符号和图、表进行增、删、改操作,保证文本的正确性满足清晰、美观、便于使用等要求目的:确保文本内容正确无误操作:对字、词、句和段落进行添加、删除、修改等操作MSWord的功能:在文本的任何位置都可以插入新的文字从文本的任何位置都可以删除不需要的文字将一段文字从一处移动到另一处将一段文字从一处复制到另一处在文本中自动查找指定的词语用一个词语自动替换文本中指定的词语文本编辑(textediting)目的:使文本清晰、美观、便于阅读操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成3个层次:对字符格式进行设置对段落格式进行设置对文档页面进行格式设置文本排版(Typesetting)设置字符的格式字号(八号→初号,

5磅→72磅以上)1磅相当于1/72英寸

字体(宋体、楷体、黑体、仿宋、隶书···)字符的修饰字符的形状(字形):正常、加粗、倾斜、加粗倾斜字形的修饰:下划线、着重号、上下标、删除线···字符的颜色字符的宽度字符的间距字符的效果字符的排列方向什么是段落?用“回车”相互隔开的一组文字段落格式的设置:段落的对齐方式(两端对齐、分散对齐、居中对齐、左对齐、右对齐)段落的缩进方式(首行缩进、悬挂缩进、左缩进、右缩进)段间距和段内行距使用编号和项目符号段落添加边框和底纹首字下沉或悬挂段落与分页的关系设置段落的格式控制段落的缩进段落缩进是指段落中的文本到正文区左、右边界的距离,包括段落左缩进、右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个缩进标记来指示左缩进标记首行缩进标记右缩进标记右缩进左缩进首行缩进正文区右边界正文区左边界悬挂缩进标记页面格式的设置:设置纸张大小和页边距设置每页的行、列数目设置分栏数目与格式设置页码设置页眉和页脚

设置页面的格式设置页面的分栏“所见即所得”(操作效果屏幕立即可见,打印结果与屏幕所见完全相同)撤销(undo)和恢复(redo)操作格式刷多种视图(大纲视图与大纲编辑)自动更正、自动套用格式、自动编号、自动图文集······自动保存功能和自动备份功能样式、模板和向导(wizard)功能宏操作(Macro)提高Word操作效率的若干措施文本处理初步使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理文本处理举例:字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换词语排序,词语错误检测,文句语法检查自动分词,词性标注,词义辨识,大陆/台湾术语转换关键词提取,文摘自动生成,文本分类文本检索(关键词检索、全文检索),文本过滤文语转换(语音合成)文种转换(机器翻译)篇章理解,自动问答,自动写作等文本压缩,文本加密,文本著作权保护

什么是文本处理?例:MSWord的文本处理功能英文拼写检查和英语同义词检查字数统计自动编写摘要中文简繁体转换和术语转换中英词语翻译语法和格式检查语音识别(口授命令和听写)文档保护(防止打开或修改文档)5.1.3文本的分类简单文本(纯文本)

本书由南京大学出

版社(Publishing

HouseofNanjin

gUniversity)出版

文本

没有字体、字号的变化,无图片和表格,也不能建立超链接,其文件后缀名是.txt

在计算机中.txt文件由一串字符代码所组成,几乎不包含任何其他的格式信息和结构信息例:本书由南京大学出版社(PublishingHouseofNanjingUniversity)出版文本在计算机中的表示

B1BECAE9D3C9C4CFBEA9B4F3D1A7B3F6

B0E6C9E7285075626C697368696E67

20486F757365206F66204E616E6A696E

6720556E697665727369747929B3F6B0E6

丰富格式文本本书由南京大学出版社(PublishingHouseofNanjingUniversity)出版

有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”丰富格式文本中,除了正文内容之外,还使用了许多“标记”来描述字符的属性和格式的设置举例:下面标题的格式为:中文用黑体,西文用ArialBlack体,居中

使用HTML语言描述为:<palign="center"><fontface="黑体">本书由南京大学出版社</font><fontface="ArialBlack">(PublishingHouseofNanjingUniversity)</font><fontface="黑体">出版</font></p>用一对<>指出的是标记,如<fontface=“黑体”>和</font>等,用于说明排版的格式和文字属性,它们不属于正文内容正文内容超文本(www网页)WWW网页按照其内容的关联性相互进行链接,网页就是典型的“超文本”超文本也属于丰富格式文本网页A网页B网页C网页D网页E网页F网页G网页Ha1a2b2c2f1d1c1b1e1g1h1a3“超链”实际上就是一个指针,用于指向其他网页,也可以指向同一网页中的其他部分

超链是有向的,起点位置称为链源,它可以是网页中的一个标题、一句句子、一个关键词、一幅画、一个图标等小结:文本的分类文本类型

特点

在计算机内的表示

文件扩展名

用途简单文本没有字体、字号和版面格式的变化,文本在页面上逐行排列,也不含图片和表格由一连串与正文内容对应的字符的编码所组成,几乎不包含任何其他的格式信息和结构信息.txt网上聊天短信文字录入OCR输入丰富格式文本(线性文本)有字体、字号、颜色等变化,文本在页面上可以自由定位和布局,还可插入图片和表格除了与正文对应的字符编码之外,还使用某种“标记语言”所规定的一些标记来说明该文本的文字属性和排版格式等.doc.rtf.htm.html.pdf公文论文书稿网页丰富格式文本(超文本)除上述特征外,文本中还含有超链,使文本呈现为一种网状结构同上,但还应包含用于指出“链源”和“链宿”的标记.doc.rtf.htm.html.pdf.hlp同上,以及软件的联机文档(帮助文件)5.1.5文本的展现(输出)文本的展现(输出)目的:阅读、浏览或打印文本使用的软件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word,独立的软件:如Adobe公司的AcrobatReader,微软公司的IE等

文本展现的过程:对文本的格式描述进行解释生成文字和图表的映像(bitmap)传送到显示器或打印机输出附:输出过程中字形的生成

过程:先根据字符的字体确定相应的字库(font),再按照该字符的代码从字库中取出该字符的形状描述信息然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处2种不同的字库:点阵描述轮廓描述轮廓点直线二次曲线附:电子书阅读器“电子书阅读器”是一种专门用于阅读各种电子文档(如.txt、.doc、.html、.pdf等)的专用硬件设备采用电子墨水显示屏,被动发光,耗电极少,持续工作时间很长(1个月以上)阅读效果接近纸质图书轻薄,便于携带平板电脑的出现使其前景渺茫5.2图像与图形5.2.1

数字图像的获取5.2.2图像的表示与压缩编码5.2.3

数字图像处理与应用5.2.4计算机图形5.2.1

数字图像的获取图像的获取过程扫描模拟图像取样取样取样数字图像分色量化量化量化从现实世界中获得数字图像的过程称为图像的“获取”常用的图像获取设备:手机、扫描仪、数码相机、监控摄像头等图像获取过程:将画面划分为M×N个网格,每个网格称为一个取样点将彩色图像取样点的颜色分解成R,G,B三个基色测量每个取样点的每个分量(基色)的亮度值对取样点每个分量的亮度值进行A/D转换,使用数字整型量表示

5.2.2图像的表示与压缩编码数字(取样)图像的组成数字取样图像由M(列)×N(行)个取样点组成取样点是组成数字取样图像的基本单位,称为“像素”彩色图像的像素通常由3个彩色分量组成灰度图像和黑白图像的像素只包含1个亮度分量Red分量Green分量Blue分量像素复习:黑白图象的表示黑白图像黑白图像的每个像素只有一个分量,且只用1个二进位表示,其取值仅“0”(黑)和“1”(白)两种例1:灰度图象的表示灰度图像灰度图像的每个像素也只有一个分量,一般用8~12个二进位表示,其取值范围是:0~2n-1,可表示2n个不同的亮度例2:彩色图象的表示蓝色分量绿色分量红色分量彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设3个分量分别用n,m,k个二进位表示,则可表示2n+m+k种不同的颜色数字(取样)图像的主要参数图像大小(图像分辨率):水平分辨率x垂直分辨率

用来表示组成该图像的行列数目,亦即图像所包含的像素数目对图像清晰度和在屏幕上显示出来的大小有影响位平面数目,即像素的颜色分量的数目颜色空间的类型,指彩色图像所使用的颜色描述方法,如:RGB(红、绿、蓝)模型,显示器使用CMYK(青、品红、黄、黑)模型,彩色打印机使用HSB(色彩、饱和度、亮度)模型,用户界面中使用YUV(亮度、色度)模型,彩色电视信号传输时使用像素深度,即像素的所有颜色分量的二进位数目之和图像类型位平面数目像素深度(位数)颜色空间单色图像黑白图像仅1个1位不使用灰度图像仅1个2~12位不使用彩色图像彩色图像3个以上8~36位RGB,CMY,YUV等举例:分辨率与图像尺寸的关系520x376260x188130x94在显示比例相同时,显示在屏幕上的图像尺寸与图像分辨率成正比数字图像的数据量数字图像数据量的计算公式(以字节为单位):

数据量=水平分辨率×垂直分辨率×像素深度/8

几种常用格式的图像的数据量:图像大小8位(256色)16位(65536色)24位(真彩色)640×480300KB600KB900KB1024×768768KB1.5MB2.25MB1280×10241.25MB2.5MB3.75MB压缩之后数字图像的数据量计算(以字节为单位):数据量=(水平分辨率×垂直分辨率×像素深度/8)/压缩比数字图像的数据压缩图像数据压缩的必要性:节省存储数字图像所需要的存储器容量提高图像的传输速度,减少通信费用

图像数据压缩的可能性:数字图像中有大量的数据冗余人眼视觉有局限性,允许图像有一些失真图像数据压缩的两种类型:无损压缩:用压缩后的数据还原出来的图像没有任何误差有损压缩:用压缩后的数据还原出来的图像有一定的误差压缩编码方法的评价压缩倍数的高低(压缩比大小)重建图像的质量(有损压缩时)压缩算法的复杂程度数字图像的常用文件格式常用的图像文件格式有:不同的图象文件格式采用了不同的数据压缩技术和数据组织方法,适合不同的应用!名称压缩编码方法性质典型应用开发公司(组织)BMP不压缩无损Windows应用程序MicrosoftRAW不压缩或无损压缩无损高端数码相机等TIFRLE,LZW(字典编码)无损桌面出版Aldus,MicrosoftGIFLZW无损互联网CompuServeJPEGDCT(离散余弦变换),Huffman编码大多为有损互联网,数码相机等ISO/IECPNGLZ77派生的压缩算法无损互联网等W3C图像文件格式例1:BMP格式BMP图像格式是Windows操作系统下使用的一种标准图像格式支持单色、16色、256色、真彩色图像一个文件一幅图像,可以进行无损压缩,也可不压缩非压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows应用软件都能支持图像文件格式例2:GIF图像颜色数目不超过256色,适合用作插图、剪贴画等色彩数要求不高的场合,文件特别小,适合网络传输GIF图像格式具有累进显示功能,适合网络浏览器观看GIF图像格式能支持透明背景(JPEG不支持)GIF图像格式能支持动画透明背景缺点:不适合真彩色图片图像文件格式例3:JPEG图像JPEG是静止图像数据压缩编码的国际标准,采用JPEG标准的图像文件扩展名是.jpgJPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数码相机中已得到广泛应用JPEG的最新标准是JPEG2000(图像文件扩展名是.jp2),它采用更先进的技术,可取得更好的效果,目前在医学图像处理中使用5.2.3数字图像处理与应用数字图象处理:目的与内容目的:(1)提高图像的视觉质量(2)恢复与重建有失真和畸变的图像(3)图像分析,包括:图像的分类、识别和理解等(4)图像数据的变换、编码和数据压缩(5)图像的存储、管理与检索(6)图像内容与知识产权的保护

内容:去噪、增强、复原、分割、提取特征、压缩、存储、检索等Word和PowerPoint的图像编辑功能

使用“图片工具栏”编辑图片使用快捷菜单,屏幕上显示“图片”工具栏,进入图片编辑状态:颜色控制裁剪图片线型文字环绕设置图片格式设置透明色增加对比度降低对比度增加亮度降低亮度旋转图片压缩图片Word和PowerPoint的图像编辑功能

图片编辑举例(外形修改)缩小压扁放大拉长原始图片Word和PowerPoint的图像编辑功能

图片编辑举例(裁剪与旋转)旋转90度裁剪底部裁剪左部旋转任意角度原始图片Word和PowerPoint的图像编辑功能

图片编辑举例(图像属性修改)增加对比度降低对比度增加亮度降低亮度灰度图片黑白图片原始图片图像的特效处理原始图像波浪效果旋转效果旋涡效果图像去噪去噪之后的图像有噪声的图像图像增强增强前的图像增强后的图像图像恢复陈旧的老照片恢复后的照片抠图场景合成图像分割与识别原始图像戒指健身圈手分割后进行识别原始图像分割成若干部分人脸检测与识别数字图像处理的应用(1)图像通信,包括图像传输、电视电话、电视会议等。(2)遥感(3)医疗诊断(4)工业生产中的应用,如产品质量检测,生产过程自动控制等(5)机器人视觉(6)军事、公安、档案管理等其他方面的应用X光图像CT图像核磁共振图像指纹图像常用的图像编辑软件Word和PowerPoint具有基本的图像编辑功能Windows附件中的“画图”软件微软Office工具中的PictureManagerACDSystem公司的ACDSee32Adobe

PhotoShop5.2.4计算机图形什么是计算机图形(graphics)通过计算机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为“绘制”)计算机图形也称为计算机合成图像计算机制作图形的步骤如下:建模/造型(Modeling)景物的模型(model)(1)建模景物的视图

绘制(Rendering)(ImageSynthesis)(2)绘制计算机图形的绘制技术绘制(rendering),也称为图像合成(imagesynthesis)——依据景物的模型,根据观察位置和光线情况,生成该景物可视图像的过程景物图像的绘制过程取景变换视域裁剪三角化光栅化隐藏面消除明暗处理阴影生成纹理映射景物的模型景物的图像绘制流水线(RenderingPipeline)物体表面用多边形进行近似表示投影裁剪和消隐处理明暗处理、阴影生成和纹理映射图形绘制的硬件——显卡(图形卡)绘制的三个基本要求:每秒可处理的三角面片数量要大(108个),以生成复杂场景的图像纹理数据库要大(几~几十GB),以生成多种多样的高度真实感图像:绘制速度要快,游戏要求实时绘制(>25帧/秒)绘制过程中,每一个像素的颜色及其亮度都要经过大量的计算才能得到,因此绘制过程的计算量很大,特别是三维图形和动画显卡在绘制过程中起着关键作用绘图处理器承担着绘制过程中的大部分计算任务美国康乃尔大学SuzanneSmits和PriamosGeorgiades建模并绘制的俄罗斯茶壶

例1:俄罗斯茶壶例2:计算机绘制的钢笔画和铅笔画

木桶

玻璃瓶引用自:GeorgesWinkenbach,D.Salesin(Univ.ofWashington)pp.469-476,

SIGGRAPH’96例3:分形图案计算机图形的应用(1)计算机辅助设计和辅助制造(CAD/CAM)。(2)利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等。(3)作战指挥和军事训练。(4)计算机动画和计算机艺术。(5)其它:电子出版、数据处理、工业监控、辅助教学、软件工程等。常用的矢量绘图软件专业绘图软件:

AutoCAD、PROTEL和CAXA电子图板(机械、建筑等)MAPInfo、ARCInfo、SuperMapGIS(地图、地理信息系统)办公与事务处理、平面设计、电子出版等使用的绘图软件:Corel公司的CorelDraw,Adobe公司的Illustrator,Macromedia公司的FreeHand,微软公司的MicrosoftVisio等MSOffice中内嵌的绘图软件:Word和PowerPoint中的绘图功能(简单的二维图形)小结:图像与图形的比较计算机中的“图”按其生成方法可以分为两大类:通过数字化设备获取的“图”,它们称为取样图像、点阵图像,或位图图像等,通常简称图像(image)通过计算机建模并绘制而成的“图”,称为矢量图形,通常简称图形(graphics);两者在外观上很难区分,但它们有许多不同的属性,一般需要使用不同的软件进行处理图像图形小结:图像与图形的对比图像图形生成途径通过图像获取设备获得景物的图像使用矢量绘图软件以交互方式制作而成表示方法将景物的映像(投影)离散化,然后使用像素表示使用计算机描述景物的结构、形状与外貌表现能力能准确地表示出实际存在的任何景物与形体的外貌,但丢失了部分三维信息规则的形体(实际的或假想的)能准确表示,自然景物只能近似表示相应的编辑处理软件典型的图像处理软件,如PhotoShop典型的矢量绘图软件,如AutoCAD文件的扩展名.bmp.gif.tif.jpg.jp2等.dwg.dxf.wmf等数据量大小5.3数字音频及应用5.3.1数字音频的获取5.3.2数字音频的表示与应用5.3.3数字音频的编辑与播放5.3.4计算机合成音频5.3.1数字音频的获取声音/音频的特性和类型声音(sound)由振动产生,通过空气等介质进行传播声音是一种波,它由许多不同频率的谐波组成,谐波的频率范围称为声音的“带宽”两种音频:话音或语音(speech),专指人的说话声音,带宽仅为300~3400Hz全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz~20kHz人耳可听见的声音(20Hz~20kHz)在信息技术中称为音频信号,简称音频(audio)数字音频的获取步骤:2.量化(quantization,模数转换)3.编码(encoding)1.取样(sampling)取样模拟声音信号取样的目的是把时间上连续的信号转换成时间上离散的信号量化量化是把每个样本从模拟量转换成为数字量(8位或16位整数表示)数字音频01100011001···编码将所有样本的二进制代码组织在一起,并进行数据压缩时间上离散的一组样本一组二进制整数数字音频的获取设备音频的联机获取设备(声卡)声波转换为电信号音频的获取设备:手机、数码录音笔麦克风(microphone)声音卡(soundcard)模拟音频数字音频取样、量化和编码音频的重建与播放计算机输出声音分为两步:1重建:把音频信号从数字形式转换成模拟信号形式,由声卡完成2播放:将模拟音频信号经处理和放大后送到音箱(扬声器)关于音箱:普通音箱接收的是重建的模拟声音信号数字音箱直接接收数字声音信号,失真更小数字音频011010011101…插值数模转换解码把压缩编码的数字音频恢复为压缩编码前的状态把声音样本从数字量转换为模拟量把时间上离散的一组样本转换成在时间上连续的模拟音频信号重建的模拟音频信号声卡的功能与逻辑组成音频的获取与编码音频的重建与播放MIDI消息的输入MIDI音乐的合成DSPDMA接口PC总线取样,量化D/A重建,滤波声音输出声音输入音乐合成器mixerMIDI接口声卡的主要功能

声卡的物理实现

声卡主要由2块芯片组成:主处理芯片:包括数字信号处理器、MIDI控制、I/O控制等

CODEC芯片:负责多声道取样、A/D与D/A转换、混音处理等

当前PC机的声卡大多已不再做成独立的插卡形式,而是与主板集成在一起,称为集成声卡

声卡的几种类型硬声卡:除CODEC芯片外,主板上还有1块音频主处理芯片,很多音效处理任务无需CPU参与就可独立完成

声卡的类型独立声卡:以扩展卡形式插在机箱中使用集成声卡软声卡:主板上仅1块CODEC芯片,负责取样与量化处理,I/O控制器部分集成在主板上的南桥芯片中,DSP的功能需由CPU协助完成

声卡的组成部分均集成在主板上5.3.2数字音频的

表示与应用数字音频的表示及其参数数字音频是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织数字音频的主要参数有:取样频率:语音的取样频率低,一般为8k~16kHz全频带声音(如音乐)取样频率高,一般为44.1k~48kHz量化位数:通常为8位、12位或16位声道数目:单声道为1,双声道为2码率(比特率),即每秒钟的数据量未经压缩的数字音频最常用的文件扩展名为“.wav”数字音频码率的计算未压缩时数字音频的码率计算公式码率=取样频率

×

量化位数

×

声道数

例:声音类型信号带宽(Hz)取样频率(kHz)量化位数(bits)声道数未压缩时的码率数字语音300~340088164kb/sCD立体声20~2000044.11621411.2kb/s压缩编码之后数字音频的码率为:压缩后的码率=未压缩时的码率/压缩比例:上面CD唱片的立体声音乐压缩为MP3后,若压缩比是12,则该MP3音乐的码率是:1411.2/12≈118kb/s左右数字音频的数据压缩数据压缩的必要性:为了降低存储成本和提高在网络上的传输效率数据压缩的可能性:声音中包含有大量冗余信息;人耳灵敏度有限,允许有一定失真而不易察觉数字音频压缩编码的方法:全频带声音:国际标准MPEG;工业标准DolbyAC-3数字语音:固定电话使用ADPCM编码手机使用高效率的混合编码技术所谓“MP3音乐”,它是一种采用MPEG-1层3编码的高质量数字音频,压缩比大约10~12倍,使一张普通CD光盘上可以存储大约100首MP3歌曲,可连续播放10小时。数字音频的文件类型及其应用音频格式文件扩展名编码类型效果主要应用开发者WAV.wav未压缩声音达到CD品质支持多种采样频率和量化位数,获得广泛支持微软公司FLAC.flac无损压缩压缩比为2:1左右高品质数字音乐Xiph.Org基金会APE.ape无损压缩压缩比为2:1左右高品质数字音乐MatthewT.AshlandM4A.m4a无损压缩压缩比为2:1左右QuickTime,iTunes,iPod,RealPlayer苹果公司MP3.mp3有损压缩MPEG-1audio层3压缩比为8:1~12:1因特网,MP3音乐ISOWMA.wma有损压缩压缩比高于MP3使用数字版权保护因特网,音乐微软公司AC3.ac3有损压缩压缩比可调,支持5.1、7.1声道DVD,数字电视,家庭影院等美国Dolby公司AAC.aac有损压缩压缩比可调,支持5.1、7.1声道DVD,数字电视,家庭影院等ISOMPEG-2/MPEG-4什么是流媒体?在因特网上收听(看)音(视)频节目的2种方式:下载存储方式:先下载存储在计算机中,下载完毕后再播放(缺点:需要等待较长时间,并需要较大的存储容量)流式传输方式:边下载、边播放(优点:只需要下载一部分数据之后,就可以开始一边播放一边下载,等待时间短、存储需求小)流媒体就是一种允许在网络上让用户一边下载一边收看(听)音视频媒体的媒体分发(delivery)技术例如:RealNetworks公司的RealMedia(RealAudio和RealVideo)微软公司的WindowsMediaServices(WMA、WMV和ASF)苹果公司的QuickTime5.3.3数字音频的编辑数字音频编辑软件的功能主要功能:1

编辑音频:如声音剪辑、复制、调节音量2

效果处理:如混响、回声、淡入、淡出等3

录音4

音频的格式转换5播放声音数字音频的参数左声道信号波形右声道信号波形淡入淡出时间刻度播放标尺音频编辑软件的典型用户界面5.3.4计算机合成音频什么是计算机合成音频?计算机合成音频就是计算机模仿人说话或演奏音乐计算机合成音频有两类:计算机合成话音(语音):计算机模仿人把一段文字朗读出来,即把文字转换为说话声音(简称为TTS)应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等计算机合成音乐(MIDI):计算机模拟各种乐器发声并按照乐谱演奏音乐应用:计算机作曲、配器等计算机合成音乐(MIDI)音乐合成器音乐MIDI文件媒体播放器MIDI消息计算机合成音乐需要三个要素:乐器、乐谱和“演奏员”声卡上的音乐合成器能像电子琴一样模仿几十种不同的乐器发出声音,它按照MIDI消息合成出不同音色和音调的音符,通过扬声器播放出音乐来

乐谱在计算机中使用一种叫做MIDI的音乐描述语言来表示。使用MIDI描述的音乐称为MIDI音乐。一首乐曲对应一个MIDI文件,其文件扩展名为.MID或.MIDI媒体播放器软件相当于“演奏员”。播放MIDI音乐时,它先从磁盘上读入.MID文件,解释其内容,然后以MIDI消息的形式向声卡上的音乐合成器发出各种指令例:计算机合成的MIDI音乐MIDI的优点:数据量极小(比CD立体声少3个数量级,比MP3少3个数量级)易于制作和编辑修改可以与波形声音同时播放MIDI的不足:只能合成音乐,不能合成歌曲和语言音质与硬件设备相关小结:计算机中的音频音频的特点:是一种连续媒体,传输与播放有实时性要求数据量大,对存储和传输的要求比较高,必须进行压缩

计算机中音频的类型:数字音频数字语音:应用于电话、手机、多媒体配音等全频带声音:CD和DVD音乐,数字电视伴音等计算机合成音频合成语音合成音乐(MIDI)5.4数字视频及应用5.4.1数字视频基础5.4.2数字视频的压缩编码5.4.3数字视频的编辑与播放5.4.4计算机动画5.4.5数字视频的应用5.4.1数字视频基础

视频(video):以固定速率(24、25、30帧/秒)顺序地显示的一个位图图象序列,又叫运动图象或活动图象(motionpicture)常见视频:电视,电影,动画等.视频的特点:内容随时间而变化,伴随有与画面动作同步的声音(伴音),人类接受的信息70%来自视觉,其中活动图象是信息量最丰富、直观、生动、具体的一种承载信息的媒体。视频信息的处理是多媒体技术的核心。什么是视频(video)?数字视频的主要参数帧频、帧速率(framerate)——每秒钟显示多少帧图像,单位是fps帧大小——每帧图像的分辨率,即图像宽度x图像高度(单位:像素)颜色深度、像素深度——图像中每个像素的二进位数目(单位:bit)例:持续时间为1小时的一段数字视频,假设帧大小是640x480,像素深度为24位,帧速率为25fps,则:• 每帧的像素数目=640x480=307,200像素• 每帧的二进位数目=307,200x24=7,372,800=7.37Mb• 视频流的比特率(bitrate,BR)=7.37x25=184.25Mb/s• 视频流的大小(videosize,VS)=184Mbits/secx3600sec=662,400Mbits=82,800Mbytes=82.8Gbytes数字视频信号的获取

视频信号的数字化过程:

与图像、声音的数字化过程相仿,但更复杂一些(8-10bits)滤波取样量化编码数字视频信息模拟视频信号VUYUVY

数字视频的获取设备:

视频采集卡(简称视频卡)数字摄像头,通过光学镜头和CCD或CMOS采集动态图像,转换成数字信号并输入PC机脱机获取设备:数码摄像机数字摄像头分辨率为352×288~640×480,高清摄像头分辨率更高速度一般在30fps(每秒30帧)左右镜头的视角可达到45-60度支持USB接口或IEEE1394(火线)接口成像器件采用CMOS或CCD数码摄像机提供480线以上的分辨率,清晰度高自动对焦,自动曝光使用MPEG-2进行压缩编码,然后记录在存储卡或硬盘上具有录音功能数据量很大,采用USB接口或IEEE1394接口5.4.2数字视频的压缩编码数字视频的压缩编码视频数据压缩的必要性:数字视频的数据量大得惊人,1分钟的数字电视图像未压缩时其数据量可超过1GB,对存储、传输和处理都有很大的困难视频数据压缩的可能性:视频信息的每个画面内部有很多信息冗余相邻画面的内容有高度的连贯性人眼的视觉灵敏度有限,允许画面有一定失真结论:数字视频的数据量可压缩几十倍甚至几百倍数字视频编码的三大类国际标准公司标准:早期:Intel公司的IndeoVideo,苹果公司的Cinepak当前:RealNetwork公司的RealVideo,微软公司的WMV,Googlee公司的VP8、VP9等H.265/MPEG-HITU-TISO/IECITU-TISO/IEC2014目前流行的数字视频编码国际标准名称图像格式压缩后的码率主要应用MPEG-1360×288大约1.2Mb/s~1.5Mb/s适用于VCD、数码相机、数字摄像机等H.261360×288或180×144Px64kb/s(P=1、2时,只支持180×144格式,P≥6时,可支持360×288格式)应用于视频通信,如可视电话、会议电视等MPEG-2(MP@ML)720×5765Mb/s~15Mb/s用途最广,如DVD、卫星电视直播、数字有线电视等MPEG-2高清格式1440×11521920×115280Mb/s~100Mb/s高清晰度电视(HDTV)领域MPEG-4ASP分辨率较低的视频格式与MPEG-1,MPEG-2相当,但最低可达到64kb/s在低分辨率低码率领域应用,如监控、IPTV、手机、MP4播放器等MPEG-4AVC多种不同的视频格式采用多种新技术,编码效率比MPEG-4ASP显著减少已在多种领域应用,如HDTV、蓝光盘、IPTV、XBOX、iPod、iPhone等什么是MPEG-4ASP和MPEG-4AVCMPEG-4是数字音视频压缩编码的国际标准MPEG-4分成23个部分,其中part2和part10是视频编码为了适应不同应用对视频图像大小和质量的不同要求,每种视频编码标准都分成若干level和profile:MPEG-4Part2分成21个profile,ASP(AdvancedSimpleProfile)是其中之一,其技术特点是:画面分辨率较低,最低码率仅64kb/s左右,但画面质量好,复杂度中等MPEG-4Part10又称为MPEG-4AVC(AdvancedVideoCoding).它是目前技术最先进的视频编码案,分成7个profile,可用于HDTV常用音像文件(视频文件)的比较音像文件/视频文件名称(格式)视频编码格式音频编码格式

支持情况举例WMPiPhoneMate8MPEG(mpeg、mpg)MPEG-1/-2videoMPEG-1层I,II,III√√MPEG-4(.mp4)MPEG-2Part2H.263/MPEG-4ASPH.264/MPEG-4AVCVC-1,Dirac等MPEG-2/-4AACMPEG-1/2LayersI,II,III(MP3),AC-3,AppleLossless等√√√苹果QuickTime(.mov、.qt)(大体同上)(大体同上)仅低版本√3G通信合作项目(.3gp、.3g2)H.263/MPEG-4ASPH.264/MPEG-4AVCAMR,AAC-LC等√√√微软ASF(.asf、.wmv)(几乎所有格式)(几乎所有格式)√√微软AVI(.avi)(不支持可变码率、可变帧率等高级特性)(几乎所有格式)√MotionJPEG(.mj2、.mjp2)1280×720像素,每秒

30帧Ulaw、PCM立体声√√DivX公司(.divx)MPEG-4ASPMP3,PCM,AC-3√RealNetworks公司(.rm、.rmvb)RealVideo8,9,10RealAudio(HE)-AAC,Vorbis,√Matroska(.mkv、.mk3d)Google(.webm)VP8、VP9及包括H.265的所有格式MP2,MP3,Vorbis,AAC,AC3,PCM等√Adobe公司Flash(.flv、.f4v)H.264/MPEG-4AVCMP3,AAC等音像文件(视频文件)与播放器播放器(Plaper)实际上就是一种解码器,但通常既可以解码多种类型的信息(音频、视频、图片、···),还能解码多种不同格式的影音文件格式。PC上使用的是软件播放器,一台计算机可以安装多个不同的播放器:微软公司的“MicrosoftMediaPlayer”,苹果公司的QuickTimePlayer和iTunes,Real公司的RealPlayer(简称RealOne播放器)“全能”播放器:StormPlayer(暴风影音)、TheKMPlayer、绚彩魅影、变色龙万能播放器(PPStream)、豪杰超级解霸,等等硬件播放器(便携式):MP3播放器:以播放MP3格式的音频信息为主,也能收听广播、观看文本和图片,功能更强一些的还能播放视频信息MP4播放器:以播放视频为主,国外叫做PVP(个人视频播放器)或PMP(便携式媒体播放器),LCD屏幕较大,价格较高5.4.3数字视频的编辑例:简单的视频编辑软件

——WindowsMovieMaker由微软公司开发,在WindowsXP平台上运行功能:通过摄像机、数字摄像头或其他视频源将音频和视频捕获到计算机中打开已有的音频、视频或静止图片,对音频与视频内容进行编辑(包括添加片头、使用视频过渡或特技效果等)将制作的视频保存到硬盘中,或刻录在CD或DVD光盘上,供“媒体播放器”进行播放5.4.4合成视频——

计算机动画什么是计算机动画?计算机动画——使用计算机生成一系列内容连续的画面供实时演播的一种技术,它是一种计算机合成的数字视频,而不是用摄像机拍摄的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论