![第5章数字媒体与应用_第1页](http://file4.renrendoc.com/view/d38624fe89772bbef48e3e74392cc415/d38624fe89772bbef48e3e74392cc4151.gif)
![第5章数字媒体与应用_第2页](http://file4.renrendoc.com/view/d38624fe89772bbef48e3e74392cc415/d38624fe89772bbef48e3e74392cc4152.gif)
![第5章数字媒体与应用_第3页](http://file4.renrendoc.com/view/d38624fe89772bbef48e3e74392cc415/d38624fe89772bbef48e3e74392cc4153.gif)
![第5章数字媒体与应用_第4页](http://file4.renrendoc.com/view/d38624fe89772bbef48e3e74392cc415/d38624fe89772bbef48e3e74392cc4154.gif)
![第5章数字媒体与应用_第5页](http://file4.renrendoc.com/view/d38624fe89772bbef48e3e74392cc415/d38624fe89772bbef48e3e74392cc4155.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章数字媒体与应用第一页,共200页。第5章数字媒体及应用5.1
文本与文本处理5.2
图像与图形5.3
数字声音及应用5.4数字视频及应用第二页,共200页。5.1文本与文本处理
5.1.1字符编码5.1.2文本的分类5.1.3文本准备5.1.4文本编辑与排版5.1.5文本处理与相关软件5.1.6文本展现第三页,共200页。文字处理是计算机应用的基础计算机应用=使用计算机进行信息处理其中,文字信息处理是涉及面最广的一种计算机应用,几乎与任何领域任何人都有关。文字数值语言音乐图像···信息的形态有多种第四页,共200页。写作编辑排版印刷发行写作
传统的文字处理过程第五页,共200页。计算机文字处理过程文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体文本由一系列“字符”(character)组成,每个字符均使用二进制编码表示文本在计算机中的处理过程是:(文本编辑器)文本编辑与排版格式化的电子文本(2)文本展现(文本阅读器)(5)文本处理(文本处理软件)(3)文本准备电子文本(1)(文字与图表的输入)文本存储与传输(4)(存档/通信软件)第六页,共200页。5.1.1.
字符编码第七页,共200页。字符、字符集及其码表文字的基本元素是字母和符号,统称为“字符”
.包括:字母、数字、符号等字符集:一组特定字符的集合不同的字符集包含的字符数目与内容不同,如:中文字符集、西文字符集、日文字符集等字符的编码:字符集中每个字符都使用二进位(code)表示,称为该字符的编码(查看字库软件)不同的字符其编码各不相同字符集中所有字符的编码的一览表,称为该字符集的编码表第八页,共200页。1.西文字符的编码美国标准信息交换码(AmericanStandardCodeforInformationInterchange):使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。基本的ASCII字符集共有128个字符96个可打印字符(常用字母、数字、标点符号等)32个控制字符特殊字符的ASCII码记住:空格(32)A(65)a(97)0(48)第九页,共200页。1.西文字符的编码标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位,故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般保持为“0”,(最高位为0)在数据传输时可用作奇偶校验位。扩充ASCII字符集:扩充字符的编码均是高位为1的8位代码(十进制数128~255),称为扩展ASCII码。第十页,共200页。标准ASCII字符集及其码表
b6b5b4b3b2b1b0
012345670123456789ABCDEFb6b5b4b3b2b1b001101001101011第十一页,共200页。汉字如何编码?汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素汉字的特点数量大;多个国家和地区使用;字形复杂,同音字多,异体字多如何编码?确定收入多少字、哪些字?汉字在字符集中的排序方式确定使用的代码结构和代码空间第十二页,共200页。常用的汉字编码字符集国家标准GB2312汉字扩充规范GBK国家标准GB18030台湾地区的标准汉字字符集CNS11643(BIG5,俗称“大五码”)日本工业标准汉字字符集JISX0208-90韩国国家标准汉字字符集KSC5601-87第十三页,共200页。汉字的编码(GB2312)GB2312-80汉字编码一级常用汉字,共3755个按汉语拼音排列GB2312-80682个图形符号6763个常用汉字二级常用字,共3008个,按偏旁部首排列第十四页,共200页。汉字的编码(GB2312)区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每个汉字区号和位号分别用1个字节表示1…………83…………94……20大……94第十五页,共200页。汉字的编码(GB2312)“大”字的区号20,位号83,区位码是2083
用2个字节表示为:0001010001010011“大”的区位码:1453H国标交换码:解决方案:为了避免汉字区位码与通信控制码的冲突,ISO2022规定,每个汉字的区号和位号必须分别加上32(即二进制00100000)。“大”字的国标交换码是:0011010001110011(3473H)第十六页,共200页。汉字的编码(GB2312)机内码:问题:汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,它与单字节的标准ASCII码就会混淆不清。解决方法:把一个汉字看作两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位(b7)都等于“1”。这种高位为l的双字节(16位)汉字编码就称为GB2312汉字的“机内码”。
如:“大”字的内码是:1011010011110011(B4F3)第十七页,共200页。编码之间关系区位码国标交换码机内码十六进制表示在两个字节都加2020H两个字节的最高为分别置为1区位码机内码十六进制表示在两个字节都加A0A0H第十八页,共200页。汉字的编码(GB2312)例:已知“大”的区号20,位号83,求它的机内码。0001010001010011区位码国标交换码机内码十六进制表示在两个字节都加2020H两个字节的最高为分别置为1高低001101000111001110110100120831453H3473HB4F3H第十九页,共200页。汉字的编码(GB2312)已知“啊”的区号为16,位号为1,求它的区位码,国标码,机内码。思考题第二十页,共200页。习题
若中文Windows环境下西文使用标准ASCII码,汉字采用GB2312编码。设一段文本的机内码为BBF540547043CAC7D6B8,则这段文本中有几个汉字、几个西文字符?解:根据ASCII码的最高位0的特点,所以西文字符编码最大为7x。而汉字的机内码由2个字节组成,且每个字节最高位均为1。所以,BBF540547043CAC7D6B8中40、54、70、43分别为一个西文字符,共4个西文字符,而BBF5;CAC7;D6B8各为一个汉字,所以共3个汉字。第二十一页,共200页。GB2312汉字的编码每一个GB2312汉字使用16位(2个字节)表示每个字节的最高位均为“1”在16位代码空间中的码位分布:第1字节第2字节00 7EA1 FE0081A1FEGB2312图形符号汉字代码空间(6763个汉字)B0F716位的代码空间共有216=65536个码位第二十二页,共200页。GB2312汉字编码的不足之处GB2312汉字字数太少,无法满足一些特殊应用的需要:人名、地名;古籍整理、古典文献研究。没有繁体字编码效率不高:(6763+682)/65536第二十三页,共200页。汉字的编码(GBK)GBK汉字内码扩充规范问题:GB2312-80只有6763个汉字,使用时功能不够。解决方法:1995年发布GBK,全称为《汉字内码扩展规范》GBK字符集中一共有21003个汉字和883个图形符号。与GB2312保持兼容包含了繁体字在内的大量汉字和符号第二十四页,共200页。汉字的编码(GBK)GBK汉字内码扩充规范应用:操作系统——Windows95以上简体中文版,采用GBK代码,并提供了多种输入法和字体应用软件——Office95以上简体中文版本提供GBK码的检索和排序互联网应用——许多网站的网页使用GBK代码,第二十五页,共200页。BIG5码台湾、香港地区使用Big5汉字编码标准,简称大五码,采用双字节表示,与GB2312和GBK不兼容BIG5码非中国大陆颁布,仅仅支持繁体。第二十六页,共200页。UCS/Unicode通用编码字符集UCS/Unicode产生背景:约有6800种语言和文字在使用,需要建立一个多文种(Multilingual)处理环境;在ISO2022基础上,使用代码页号切换不同字符集的方法过于繁琐,且与其他系统不兼容;目标与途径:实现所有字符在同一字符集中统一编码第二十七页,共200页。UCS/Unicode产生标准:UCS(通用多8位编码字符集)和Unicode(统一码或联合码,微软、IBM等联合制定、与UCS完全等同的工业标准)通用编码字符集UCS/UnicodeUCS实现了对所有字符统一编码Unicode是UCS的工业标准UCS-4:4字节编码UCS-2:2字节编码UTF-8:可变长代码,与ASCII码兼容第二十八页,共200页。第二十九页,共200页。汉字的编码GB18030编码目的是向UCS过渡,同时与GB2312、GBK兼容用1、2或4字节编码单字节编码(129个)表示ASCII字符,与ASCII兼容双字节编码(23940个)表示汉字,与GBK兼容四字节编码(约158万个)表示UCS/Unicode中的其他字符第三十页,共200页。标准名称GB2312GBKGB18030UCS-2(Unicode)字符集6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)近3万汉字(包括GBK汉字和CJK及其扩充中的汉字)包含10万多字符,其中的汉字与GB18030相同编码方法双字节存储和表示,每个字节的最高位均为“1”
双字节存储和表示,第1个字节的最高位必为“1”部分双字节、部分4字节表示,双字节表示方案与GBK相同UTF-8采用单字节可变长编码
UTF-16采用双字节可变长编码兼容性编码不兼容!小结:几种汉字编码的对比编码保持向下兼容第三十一页,共200页。5.1.2文本的分类第三十二页,共200页。文本的分类按是否格式化分:简单文本(plaintext)
丰富格式文本(richtext)按结构分:线性文本超文本
(hypertext)第三十三页,共200页。简单文本(纯文本)没有字体、字号的变化,不能插入图片、表格,也不能建立超链接,其文件后缀名是.txt由一串用于表达正文内容的字符编码所组成,几乎不包含任何其他的格式信息和结构信息呈线性结构体积小,通用性好,手机短消息就是简单文本第三十四页,共200页。丰富格式文本有字体字号等属性变化、设置了段落和页面排版格式的文本称为“丰富格式文本”格式文本要用功能较强的文字处理软件来编辑,如MSWord和金山WPS等。由文字、图像、声音、视频等多种信息媒体复合而成的文本也是一种丰富格式文本,也称为多媒体文档。第三十五页,共200页。文本的分类超文本采用一种网状结构来组织信息,各信息块按照其内容的关系互相链接一个超文本由若干个文本块组成,这些文本块称为节点节点可以是文字、图形、图像、声音或视频基于多媒体信息结点的超文本,也称为超媒体。例:Windows中的
“帮助”
文件就是一种典型的超文本第三十六页,共200页。超文本若干文本或文本中的各个部分可按照其内容的关系互相链接起来,从而形成“超文本”ABCDEFGHa1a2b2c2f1d1c1b1e1g1h1a3“超链”实际上就是一个指针,用于指向其他文本块,也可以指向同一文本块中的其他部分
超链是有向的,起点位置称为链源,它可以是文本块中的一个标题、一句句子、一个关键词、一幅画、一个图标等文本块可以是一个网页,一个文档,一段文字,也可以是一张图片,甚至一段声音或视频
第三十七页,共200页。超文本标记语言HTMLHTML是用于创建超文本链接的基本语言,可以定义格式化的文本、色彩、图像与超文本链接等。HTML文档包含指向其他文档的链接项,即其他页面的URL,这样用户便可以通过一个页面中的链接项访问其他服务器中的页面或同一服务器中的其他页面。HTML文档可以将声音、图像、视频等多媒体信息集成在一起,用户在单一的浏览器界面中既可以阅读到文字信息,也可以欣赏到各种图片、动画,同时浏览器也会根据HTML文档中所集成的声音和视频信息的类型激活相应的播放程序。HTML文档具有.htm(或.html)后缀。各种类型文件(如字处理文件、电子表格文件、PowerPoint文件等)可以向HTML文件的转换。第三十八页,共200页。小结:文本的分类文本类型
特点
在计算机内的表示
文件扩展名
用途简单文本没有字体、字号和版面格式的变化,文本在页面上逐行排列,也不含图片和表格由一连串与正文内容对应的字符的编码所组成,几乎不包含任何其他的格式信息和结构信息.txt网上聊天短信文字录入OCR输入丰富格式文本(线性文本)有字体、字号、颜色等变化,文本在页面上可以自由定位和布局,还可插入图片和表格除了与正文对应的字符编码之外,还使用某种“标记语言”所规定的一些标记来说明该文本的文字属性和排版格式等.doc.rtf.htm.html.pdf公文论文书稿网页丰富格式文本(超文本)除上述特征外,文本中还含有超链,使文本呈现为一种网状结构同上,但还应包含用于指出“链源”和“链宿”的标记.doc.rtf.htm.html.pdf.hlp同上,以及软件的联机文档(帮助文件)第三十九页,共200页。5.1.3.文本准备
——文稿如何输入计算机
第四十页,共200页。文字符号输入计算机的方法键盘输入自动识别输入字符信息的输入人工输入(1)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等(3)字形编码,如五笔字形和表形码等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法第四十一页,共200页。文字符号输入计算机的方法键盘输入联机手写输入自动识别输入字符信息的输入人工输入优点:自然,流畅小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低第四十二页,共200页。文字符号输入计算机的方法键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入优点:自然,方便,适合移动计算不足:对说话人、说话方式、说话内容的适应能力要大大增强识别速度和正确性还需大大提高第四十三页,共200页。文字符号输入计算机的方法印刷体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入扫描仪OCR数字文本纸介质文本文本的映象(image)识别率已达到98%功能:简、繁体字混合识别中文、西文混合识别文字、表格混合识别智能校对功能第四十四页,共200页。文字符号输入计算机的方法印刷体识别手写体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入
技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的识别!第四十五页,共200页。汉字的键盘输入
汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码”优秀的汉字键盘输入编码应具有的特点:易学习、易记忆效率高(平均击键次数较少)重码少容量大(可输入的汉字字数多)用不同的输入编码方法输入同一个汉字,其内码是一样第四十六页,共200页。汉字键盘输入方法的比较类型原理举例优点缺点数字编码使用一串数字来表示汉字电报码区位码仅使用10个数字键难记忆字音编码把汉语的拼音作为汉字的输入编码智能ABC紫光微软拼音输入简单易学,适合于非专业人员重码多,需增加选择操作,不会汉语拼音或不知道读音时无法使用字形编码把汉字的部件或笔画作为码元,按照汉字结构及其切分规则作为编码依据,确定每个汉字的输入代码五笔字形表形码郑码重码少、输入速度较快,适合于专业录入员、打字员使用缺乏统一的规范,编码规则不易掌握音形编码(或形音编码)采用字音及字形两种属性作为码元的汉字编码输入方法粤音输入法同上同时要掌握音、形两种取码方法或规则,对普通用户比较困难第四十七页,共200页。5.1.4文本的编辑与排版第四十八页,共200页。复习:使用Word的操作流程创建新文档或打开老文档文稿输入编辑排版文档存盘、打印或发送输入中西文字、符号和图表进行增、删、改操作,保证文本的正确性满足清晰、美观、便于使用等要求第四十九页,共200页。目的:确保文本内容正确无误操作:对字、词、句和段落进行添加、删除、修改等操作MSWord的功能:在文本的任何位置都可以插入新的文字从文本的任何位置都可以删除不需要的文字将一段文字从一处移动到另一处将一段文字从一处复制到另一处在文本中自动查找指定的词语用一个词语自动替换文本中指定的词语文本编辑(textediting)第五十页,共200页。目的:使文本清晰、美观、便于阅读操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整:对字符格式进行设置对段落格式进行设置对文档页面进行格式设置文本排版(格式化)第五十一页,共200页。“所见即所得”(操作效果立即可见,且打印结果与屏幕所见相同)撤销(undo)和恢复(redo)操作格式刷多种视图(大纲视图与大纲编辑)自动更正、自动套用格式、自动编号、自动图文集······自动保存功能和自动备份功能样式、模板和向导(wizard)功能宏操作(Macro)提高操作效率的若干措施第五十二页,共200页。5.1.5文本处理与相关软件第五十三页,共200页。文本处理是用计算机对文本中包含的文字信息进行深层次的分析、加工和处理。其目的是为了提高文本的写作质量,自动生成与文本相关的许多辅助信息。
文本处理第五十四页,共200页。字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换词语排序,词语错误检测,文句语法检查自动分词,词性标注,词义辨识,大陆/台湾术语转换关键词提取,文摘自动生成,文本分类文本检索(关键词检索、全文检索),文本过滤文语转换(语音合成),文种转换(机器翻译)篇章理解,自动问答,自动写作等文本压缩,文本加密,文本著作权保护文本处理内容第五十五页,共200页。例:Word2003的文本处理功能英文拼写检查和英语同义词检查字数统计自动编写摘要中文简繁体转换和术语转换中英词语翻译语法和格式检查语音识别(口授命令和听写)文档保护(防止打开或修改文档)第五十六页,共200页。面向通信的文本处理软件微软公司的OutlookExpress。面向办公的文本处理软件Office的WordWPS2012永中Office面向出版的文本处理软件“飞腾”排版软件美国Adobe公司的PageMaker和PDFWriter面向网络信息发布的文本处理软件FrontPageDreamweaver文本处理软件第五十七页,共200页。5.1.6文本的展现(输出)第五十八页,共200页。文本的展现(输出)目的:阅读、浏览或打印文本使用的软件:文本阅读器/文本浏览器嵌入在文本编辑(处理)软件中,如微软的Word,独立的软件:如Adobe公司的AcrobatReader,微软公司的IE等
文本展现的过程:对文本的格式描述进行解释生成文字和图表的映像(bitmap)传送到显示器或打印机输出第五十九页,共200页。附:输出过程中字形的生成
过程:先根据字符的字体确定相应的字库(font),再按照该字符的代码从字库中取出该字符的形状描述信息然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处2种不同的字库:点阵描述轮廓描述轮廓点直线二次曲线第六十页,共200页。例:按16×16点阵存放国标GB2312-80中一级汉字(共3755个)的汉字库,大约需占存储多大的空间解:点阵就是M×N的点阵,每个点有2个状态,分别可以使用0和1表示,所以1个点就是1比特位。 每个字是16×16点阵,即256个点,需要的存储空间是256
b。GB2312-80中一级汉字共3755个,所以总计需占存储空间为:256b×3755/8≈117
KB。第六十一页,共200页。附:电子书阅读器“电子书阅读器”是一种专门用于阅读各种电子文档(如.txt、.doc、.html、.pdf等)的专用硬件设备采用电子墨水显示屏,被动发光,耗电极少,持续工作时间很长(1个月以上)阅读效果接近纸质图书轻薄,便于携带颇有发展前景第六十二页,共200页。5.2图像与图形5.2.1基础知识5.2.2图像的获取途径与图像数字化5.2.3图像的表示与压缩5.2.4常用图像文件格式5.2.5数字图像处理与应用5.2.6计算机图形学与图形处理技术第六十三页,共200页。5.2.1
基础知识第六十四页,共200页。色彩三要素可以用亮度、色调和色饱和度3个物理量描述,称之为色彩三要素。亮度:描述光作用于人眼时引起的明暗程度感觉,是指彩色明暗深浅程度。最亮为白色,最暗为黑色。色调(颜色的类别)如红色、绿色和蓝色等。饱和度:指某一颜色的深浅程度(或浓度)。对于同一色调,饱和度越高,颜色越鲜明,如深红、深蓝等。例如,红色加入白光后,变成粉红色,饱和度降低。第六十五页,共200页。三基色原理任何一种颜色都可以用3种基本颜色按不同比例混合得到。绝大多数颜色光可以分解成红、绿、蓝3种颜色光,这就是色度学中最基本的三基色原理。三基色的选择是相互独立的,即任何一种颜色都不能由其他两种颜色合成。三基色光按不同比例相加可产生混色光,如:红色+绿色=黄色红色+蓝色=品红(洋红)
绿色+蓝色=青色红色+绿色+蓝色=白色红蓝绿白黄青紫第六十六页,共200页。彩色空间彩色空间指彩色图像所使用的颜色描述方法,也称为彩色模型。RGB彩色空间CMY彩色空间YUV彩色空间HSB彩色空间第六十七页,共200页。选讲内容查看多张网络图片,引出矢量图与位图概念欣赏美景图片展Silverlight:HardRock:世界天文望远镜:Photosynth:第六十八页,共200页。图像与图形的概念数字图像按其生成方法分为通过数字化设备获取的图像,简称图像(image)计算机合成的图像,简称图形(graphics)第六十九页,共200页。图像与图形的概念两者在外观上很难区分两者有许多不同的属性,一般需要使用不同的软件进行处理第七十页,共200页。矢量图形
(a)放大前 (b)放大后矢量图放大效果第七十一页,共200页。位图图像位图图像是指用像素点来描述的图像。位图图像在计算机内存中由一组二进制位组成,这些位定义图像中每个像素点的颜色和亮度。屏幕上一个点也称为一个像素,显示一幅图像时,屏幕上的一个像素也就对应于图像中的某一个点。位图适合于表现比较细腻、层次较多、色彩较丰富、包含大量细节的图像,并可直接、快速地在屏幕上显示出来。第七十二页,共200页。位图图像位图图像的放大与缩小是通过增加或减少像素实现的,在将图像文件放大、缩小和旋转时,会产生失真。由于位图图像是一个像素矩阵,所以局部移动或其他操作就会破坏原图形状,但这也是数字位图处理的途径所在。位图图像文件保存的是组成位图的各像素点的颜色信息,颜色的种类越多,图像文件越大。第七十三页,共200页。位图图像
(a)放大前 (b)放大后位图放大效果第七十四页,共200页。5.2.2图像的获取途径与
图像数字化第七十五页,共200页。图像获取的途径1)从网上获取2)从屏幕截图3)从扫描仪采集图像4)使用数码相机拍摄与采集图像5)用摄像头采集图像素材第七十六页,共200页。2.图像数字化(1)扫描
:将画面划分为M×N
个网格(取样点)
(2)分色
:将每个点分成R、G、
B三个基色。
(3)取样
:测量每个取样点每个
分量的亮度值
(4)量化
:对每个分量进行A/D
转换,再用数字量表示第七十七页,共200页。图像的数字化过程量化量化量化数字图像分色扫描模拟图像取样取样取样第七十八页,共200页。图像的数字化过程动画演示第七十九页,共200页。5.2.3图像的表示及压缩第八十页,共200页。像素1.每个取样点是组成取样图像的基本单位,称为像素。(两亿像素图片)2.单色图像用一个矩阵来表示
彩色图像用一组矩阵表示(一般3个),矩阵的行数称为图像的垂直分辨率,列数称为图像的水平分辨率,矩阵中的元素是像素颜色分量的亮度值,一般是8位至12位第八十一页,共200页。黑白图像的表示Blackandwhiteimage第八十二页,共200页。灰度图像的表示Grayscaleimage第八十三页,共200页。彩色图像的表示蓝色分量绿色分量红色分量第八十四页,共200页。1.图像的属性信息图像大小颜色模型图像大小,也称图像分辨率(包括垂直分辨率和水平分辨率)像素深度第八十五页,共200页。举例:分辨率与图像尺寸的关系520x376260x188130x94在显示比例相同时,显示在屏幕上的图像尺寸与图像分辨率成正比第八十六页,共200页。1.图像的属性信息图像大小颜色模型彩色图像所使用的颜色描述方法。常用模型:RGB、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等像素深度第八十七页,共200页。1.图像的属性信息图像大小颜色模型像素深度像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色(亮度)的最大数目第八十八页,共200页。1.图像的属性信息图像大小颜色模型像素深度像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色(亮度)的最大数目第八十九页,共200页。真彩色和伪彩色彩色是指组成一幅彩色图像的每个像素值中,有R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。在一些场合,把RGB以8∶8∶8方式表示的彩色图像称为真彩色图像或全彩色图像。伪彩色:图像中每个像素的颜色不是由3个基色分量的数值直接表达,而是把像素值作为地址索引,以便在彩色查找表中查找这个像素实际的R、G、B分量。第九十页,共200页。照片的属性第九十一页,共200页。2.图像的压缩编码图像数据量计算公式(字节为单位)
数据量=图像水平分辨率×垂直分辨率×像素深度/8
数据压缩的必要性数据压缩的可能性数据压缩的两种类型压缩编码方法的评价第九十二页,共200页。一副具有真彩色(24位)、分辨率为1024×768的数字图像,在没有进行数据压缩时,它的数据量的大小是
。
A.900KBB.18MBC.3.75MBD.2.25MB一幅分辨率为512*512的彩色图像,其R、G、B三个分量分别用8个二进位表示,则未进行压缩时该图像的数据量是
KBD7683.一架数码相机,一次可以连续拍摄65536色的1024×1024的彩色相片40张,如不进行数据压缩,则它使用的flash存储器容量是
MB。80第九十三页,共200页。数字图像的数据压缩为了节省存储数字图像所需的存储空间,对图像数据进行压缩是很有必要的。图像数据压缩的两种类型:无损压缩:用压缩后的数据还原出来的图像没有任何误差有损压缩:用压缩后的数据还原出来的图像有一定的误差压缩编码方法的评价压缩倍数的高低重建图像的质量(有损压缩时)压缩算法的复杂程度第九十四页,共200页。JPEG20003.图像压缩编码的国际标准JPEG第九十五页,共200页。5.2.4常用图像文件格式第九十六页,共200页。常用图像文件格式名称压缩编码方法性质典型应用BMPRLC无损Windows应用程序TIFRLC,LZW无损DesktoppublishingGIFLZW无损InternetJPEGDCT,Huffman无损/有损Internet,数码相机等JP2小波变换,算术编码无损/有损Internet,数码相机等第九十七页,共200页。1.PSD格式PSD格式的文件扩展名为.psd。Photoshop软件专用的文件格式。优点:可以保存图像的每一个细节部分,也是唯一可以存取所有Photoshop特有的文件信息和所有色彩模式的格式。第九十八页,共200页。2.BMP图像文件是微软公司提出,在Windows操作系统下
使用的一种标准图像格式支持单色、16色、256色、真彩色图像一个文件存放一幅图像,可以使用行程
长度编码RLC进行无损压缩,也可不压缩
图像数据非压缩的BMP文件是一种通用图像文件格
式,几乎所有Windows应用软件都支持第九十九页,共200页。3.JPEG格式扩展名.jpeg或者.jpg高效的压缩图像文件格式,占硬盘空间较小,但不适合放大观看。有损压缩JPEG是国际标准,在计算机和数码相机中被广泛地应用。现在有JPEG2000标准,扩展名jp2。第一百页,共200页。4.TIF一种工业,很多软件支持此格式大量用于扫描仪和桌面出版,使用RLC、LZW等方法对图像数据进行无损压缩。(可以使用OCR)支持单色、彩色图像第一百零一页,共200页。5.GIF图像
互联网上广泛使用的一种图像文件格式,它的颜色数目较少(不超过256色),文件特别小,适合网络传输。由于颜色数目有限,GIF适用于插图、剪贴画等色彩数目不多的应用场合。GIF格式能够支持透明背景,具有在屏幕上渐进显示的功能。尤为突出的是,它可以将许多张图像保存在同一个文件中,显示时按预先规定的时间间隔逐一进行显示,从而形成动画的效果,因而在网页制作中大量使用。第一百零二页,共200页。GIF图像的累进显示第一百零三页,共200页。GIF图像的累进显示第一百零四页,共200页。GIF支持透明背景GIF图像中的某个色彩,在浏览器显示该图像时被忽略而不被显示出来效果是使图像浮现在页面上,增强了网页的外观例:第一百零五页,共200页。GIF数张图片存成一个文件,从而形成动画效果
1打开第1张图片; 2插入其他的图片;
3调整每张图片显示的时间4设定重复次数;
5放入网页
第一百零六页,共200页。6.EPS格式扩展名.eps常用于绘图或者排版软件在排版软件中以低分辨率预览进行排版、编辑等操作,并且可以在打印或者输出胶片时以高分辨率输出第一百零七页,共200页。7.PNG格式PNG格式的文件扩展名为.png。为了替代GIF和TIFF文件格式而开发的,同时还增加了一些GIF文件格式所不具备的特性。用PNG格式来存储灰度图像时,灰度图像的深度可达到16位;存储彩色图像时,彩色图像的深度可达到48位第一百零八页,共200页。5.2.5数字图像处理与应用第一百零九页,共200页。数字图象处理:目的与内容目的:(1)提高图像的视觉质量(2)恢复与重建有失真和畸变的图像(3)图像分析,包括:图像的分类、识别和理解等(4)图像数据的变换、编码和数据压缩(5)图像的存储、管理与检索(6)图像内容与知识产权的保护
内容:去噪、增强、复原、分割、提取特征、压缩、存储、检索等第一百一十页,共200页。数字图像处理的应用(1)图像通信,包括图像传输、电视电话、电视会议等。(2)遥感(3)医疗诊断(4)工业生产中的应用,如产品质量检测,生产过程自动控制等(5)机器人视觉(6)军事、公安、档案管理等其他方面的应用X光图像CT图像核磁共振图像指纹图像第一百一十一页,共200页。常用的图像编辑软件Word和PowerPoint具有基本的图像编辑功能Windows附件中的“画图”软件微软Office工具中的PictureManagerACDSystem公司的ACDSee32Adobe
PhotoShop第一百一十二页,共200页。5.2.6计算机图形学与
图形处理技术第一百一十三页,共200页。什么是计算机图形(graphics)通过计算机和软件对景物的结构、形状与外貌进行描述(称为“建模”),然后根据该描述和选定的观察位置及光线状况,生成该景物的图形(称为“绘制”或“图像合成”)计算机图形也称为计算机合成图像计算机制作图形的步骤如下:建模/造型(Modeling)景物的模型(model)景物的视图
绘制(Rendering)(ImageSynthesis)第一百一十四页,共200页。美国康乃尔大学SuzanneSmits和PriamosGeorgiades建模并绘制的俄罗斯茶壶
例1:俄罗斯茶壶第一百一十五页,共200页。例2:计算机绘制的钢笔画和铅笔画
木桶
玻璃瓶引用自:GeorgesWinkenbach,D.Salesin(Univ.ofWashington)pp.469-476,
SIGGRAPH’96第一百一十六页,共200页。计算机图形的应用(1)计算机辅助设计和辅助制造(CAD/CAM)。(2)利用计算机生成各种地形图、交通图、天气图、海洋图、石油开采图等。(3)作战指挥和军事训练。(4)计算机动画和计算机艺术。(5)其它:电子出版、数据处理、工业监控、辅助教学、软件工程等。第一百一十七页,共200页。矢量绘图软件专业绘图软件:
AutoCAD、PROTEL和CAXA电子图板(机械、建筑等)MAPInfo、ARCInfo、SuperMapGIS(地图、地理信息系统)办公与事务处理、平面设计、电子出版等使用的绘图软件:Corel公司的CorelDraw,Adobe公司的Illustrator,Macromedia公司的FreeHand,微软公司的MicrosoftVisio等MSOffice中内嵌的绘图软件:Word和PowerPoint中的绘图功能(简单的二维图形)第一百一十八页,共200页。小结:图像与图形的比较计算机中的“图”按生成方法可分为两类:通过数字化设备获取的“图”,它们称为取样图像、点阵图像,或位图图像等,通常简称图像(image)通过计算机建模并绘制而成的“图”,称为矢量图形,通常简称图形(graphics);两者在外观上很难区分,但它们有许多不同的属性,一般需要使用不同的软件进行处理图像图形第一百一十九页,共200页。小结:图像与图形的对比图像图形生成途径通过图像获取设备获得景物的图像使用矢量绘图软件以交互方式制作而成表示方法将景物的映像(投影)离散化,然后使用像素表示使用计算机描述景物的结构、形状与外貌表现能力能准确地表示出实际存在的任何景物与形体的外貌,但丢失了部分三维信息规则的形体(实际的或假想的)能准确表示,自然景物只能近似表示相应的编辑处理软件典型的图像处理软件,如PhotoShop典型的矢量绘图软件,如AutoCAD文件的扩展名.bmp.gif.tif.jpg.jp2等.dwg.dxf.wmf等数据量大小第一百二十页,共200页。DWG格式第一百二十一页,共200页。5.3数字声音及应用5.3.1声音信号基本概念5.3.2声音的获取5.3.3数字声音的获取与播放5.3.4数字声音的压缩方法5.3.5声音文件格式5.3.6声音文件的编辑5.3.7计算机合成声音第一百二十二页,共200页。5.3.1声音信号基本概念第一百二十三页,共200页。声音的三项指标声音是通过空气传播的一种连续的波,即声波。声波在时间和幅度上都是连续的模拟信号,通常称为模拟声音(音频)信号。音量(也称响度):声音的强弱程度,取决于声音波形的幅度,即取决于振幅的大小和强弱。音调:人对声音频率的感觉表现为音调的高低,取决于声波的基频。基频越低,给人的感觉越低沉,频率高则声音尖锐。音色:人们能够分辨具有相同音高的不同乐器发出的声音,就是因为它们具有不同的音色。一个声波上的谐波越丰富,音色越好。第一百二十四页,共200页。声音的特性和类型计算机处理的声音类型:话音或语音(speech),专指人的说话声音,带宽仅为300~3400Hz全频带声音(如音乐声、风雨声、汽车声等),其带宽可达到20Hz~20kHz人耳可听到的声音统称“可听声”(audio),20Hz~20kHz第一百二十五页,共200页。5.3.2声音的获取第一百二十六页,共200页。声音获取途径下载声音素材声音素材的录制录音机声音片段的截取Audition等第一百二十七页,共200页。5.3.3波形声音的获取与播放第一百二十八页,共200页。数字波形声音的获取步骤:2.量化(quantization,模数转换)3.编码(encoding)1.取样(sampling)取样模拟声音信号取样的目的是把时间上连续的信号转换成时间上离散的信号量化量化是把每个样本从模拟量转换成为数字量(8位或16位整数表示)数字声音···编码将所有样本的二进制代码组织在一起,并进行数据压缩第一百二十九页,共200页。声音信号的数字化模拟的声音信号转变成数字形式进行处理的优点:以数字形式存储的声音重放性能好,复制时没有失真数字声音的可编辑性强,易于进行效果处理数字声音能进行数据压缩,传输时抗干扰能力强数字声音容易与其他媒体相互结合(集成)数字声音为自动提取“元数据”和实现基于内容的检索创造了条件第一百三十页,共200页。数字波形声音的获取设备声音的联机获取设备(声卡)声波转换为电信号声音的脱机获取设备:数码录音笔麦克风(microphone)声音卡(soundcard)模拟声音数字声音取样、量化和编码第一百三十一页,共200页。声卡的功能与逻辑组成
波形声音的获取、编码;波形声音的重建、播放;
MIDI消息的输入;
MIDI声音的合成、播放;第一百三十二页,共200页。声音的重建与播放计算机输出声音分为两步:1声音的重建:把声音从数字形式转换成模拟信号形式,由声卡完成2声音播放:将模拟声音信号经处理和放大后送到音箱(扬声器)数字声音1…插值数模转换解码把压缩编码的数字声音恢复为压缩编码前的状态把声音样本从数字量转换为模拟量把时间上离散的一组样本转换成在时间上连续的模拟声音信号重建的模拟声音信号第一百三十三页,共200页。3.声音的播放声音的重建也是由声卡完成的。声卡输出的声音需送到音箱去发音。音箱分类普通音箱:接收的是重建的模拟声音信号数字音箱:可直接接收声卡输出的数字声音信号,避免信号在传输中发生畸变和受到干扰,其音响效果更加突出第一百三十四页,共200页。声音的数字化过程与播放过程示意图第一百三十五页,共200页。5.3.4数字声音的压缩方法第一百三十六页,共200页。数字波形声音的表示及其参数数字波形声音是使用二进位表示的一种串行比特流,其数据按时间顺序进行组织,文件扩展名为“.wav”数字波形声音的主要参数有:取样频率:语音的取样频率低,一般为8k~16kHz全频带声音(如音乐)取样频率高,一般为44.1k~48kHz量化位数:通常为8位、12位或16位声道数目:单声道为1,双声道为2码率(比特率),每秒钟的数据量第一百三十七页,共200页。数字波形声音码率的计算未压缩时数字波形声音的码率计算公式码率=取样频率
×
量化位数
×
声道数
压缩编码之后数字波形声音的码率为:压缩后的码率=未压缩时的码率/压缩倍数
例:CD唱片的立体声音乐压缩为MP3后,若压缩倍数是12倍,则该MP3音乐的码率是:118kb/s左右第一百三十八页,共200页。数字波形声音的数据压缩数据压缩的必要性:为了降低存储成本和提高在网络上的传输效率数据压缩的可能性:声音中包含有大量冗余信息;人耳灵敏度有限,允许有一定失真而不易察觉数字波形声音压缩编码的方法:全频带声音:国际标准MPEG;工业标准DolbyAC-3数字语音:固定电话使用ADPCM编码手机使用高效率的混合编码技术所谓“MP3音乐”,它是一种采用MPEG-1层3编码的高质量数字声音,压缩比大约10~12倍,使一张普通CD光盘上可以存储大约100首MP3歌曲,可连续播放10小时。第一百三十九页,共200页。例题一张CD盘(650MB)能存放多长时间的高保真的数字音乐?解:高保真的数字音乐码率=采样频率(Hz)×量化位数(b)×声道数=44.1
kHz×16×2
=1411.2
kb/s=176.4
kB/s
存放的时间=650
MB/176.4
kB/s
=650×1024
KB/176.4
kB/s≈3773
s。第一百四十页,共200页。5.3.5声音文件格式第一百四十一页,共200页。波形声音的文件类型及其应用文件类型开发者编码类型效果主要应用WAV微软公司未压缩声音达到CD品质支持多种采样频率和量化位数,获得广泛支持FLACXiph.Org基金会无损压缩压缩比为2:1左右高品质数字音乐APEMatthewT.Ashland无损压缩压缩比为2:1左右高品质数字音乐M4A苹果公司无损压缩压缩比为2:1左右QuickTime,iTunes,iPod,RealPlayerMP3ISO有损压缩MPEG-1audio层3压缩比为8:1~12:1因特网,MP3音乐WMA微软公司有损压缩压缩比高于MP3使用数字版权保护因特网,音乐AC3、AAC美国Dolby公司有损压缩压缩比可调,支持5.1、7.1声道DVD,数字电视,家庭影院等第一百四十二页,共200页。Wave文件(.WAV)WAV是微软公司的音频文件格式,它来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。利用该格式记录的声音文件是未压缩的波形声音,能够和原声基本一致(CD相当),质量非常高,但文件数据量大。第一百四十三页,共200页。M4AM4A文件由苹果公司开发,也采用无损压缩,压缩比为2:1左右,主要用于苹果公司产品,如QuickTime、iTunes、iPod。上面三种格式属于无损压缩,比WAV数据量小一半,但音质保持不变。第一百四十四页,共200页。MP3MP3是一种音频压缩技术,全称叫MPEGAudioLayer3(MPEG-1层3),所以人们把它简称为MP3压缩比:1:10甚至1:12体积小、音质高的特点使得MP3格式几乎成为网上音乐的代名词每分钟音乐的MP3格式只有1MB左右大小,每首歌的大小只有3~4MB。使用MP3播放器可对MP3文件进行实时的解压缩(解码)播放第一百四十五页,共200页。WMAWMA的全称是WindowsMediaAudio,是微软力推的一种音频格式。压缩比一般可以达到1:18,生成的文件大小只有相应MP3文件的一半,质量没有明显变化。WMA还可以通过DRM方案加入防止复制,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。第一百四十六页,共200页。RealAudio文件(.RA)RA、RAM和RM都是Real公司成熟的网络音频格式,RA格式具有强大的压缩量和较小的失真,采用了“音频流”技术,所以非常适合网络广播。RA可以称为互联网上多媒体传播的霸主,适合于在网络上进行实时播放,是目前在线收听网络音乐最好的一种格式。第一百四十七页,共200页。什么是流媒体?流媒体就是一种允许在网络上让用户一边下载一边收看(听)音视频媒体的媒体分发(delivery)技术目前流行的主要有3个公司的流媒体技术:RealNetworks公司的RealMedia(RealAudio和RealVideo)微软公司的WindowsMediaServices(WMA、WMV和ASF)苹果公司的QuickTime第一百四十八页,共200页。5.3.6波形声音的编辑第一百四十九页,共200页。波形声音编辑软件(演示GoldWave)主要功能:1
编辑声音:如声音剪辑、复制、调节音量2
声音的效果处理:如混响、回声、淡入、淡出等3
录音4
声音的格式转换5播放声音数字声音的参数左声道信号波形右声道信号波形淡入淡出时间刻度播放标尺声音编辑软件的典型用户界面第一百五十页,共200页。5.3.7计算机合成声音第一百五十一页,共200页。什么是计算机合成声音?计算机合成声音有两类:计算机合成话音(语音):计算机模仿人把一段文字朗读出来,即把文字转换为说话声音(简称为TTS)应用:有声查询、文稿校对、语言学习、语音秘书、自动报警、残疾人服务等(介绍方正畅听软件)计算机合成音乐:计算机模拟各种乐器发声并按照乐谱演奏音乐应用:计算机作曲、配器等第一百五十二页,共200页。例:计算机合成的语音Hello,everybody(1)你好,我是贝尔实验室的中文语音合成系统(BellTTS1)南京大学计算机系2002年招收了202名本科生,15名博士生,130多名硕士生。(中科大讯飞公司)
(Bell)安徽中科大讯飞信息科技有限公司是专门从事中文语音及语言技术软件(讯飞)我们都是同行,我们一路同行,去参加人参培植研讨会(讯飞)
(Bell)需要进一步提高之处:发音和断句要正确,提高自然度,丰富表现力bellTTS1科大讯飞bell科大讯飞科大讯飞bell第一百五十三页,共200页。154语音合成技术进展(科大讯飞)语音合成系统最关键的是自然度综合指标:
年份1995年1998年1999年2001年2010年自然度<3.03.0STOP原文:9,这是乔丹参加1984年奥运会和1992年奥运会时的球衣号码。在1984年洛杉矶奥运会上,由于前苏联以及东欧诸国……第一百五十四页,共200页。计算机合成音乐(MIDI)音乐合成器音乐MIDI文件媒体播放器MIDI消息计算机合成音乐需要三个要素:乐器、乐谱和“演奏员”
声卡上的音乐合成器能像电子琴一样模仿几十种不同的乐器发出声音,它按照MIDI消息合成出不同音色和音调的音符,通过扬声器播放出音乐来
乐谱在计算机中使用一种叫做MIDI的音乐描述语言来表示。使用MIDI描述的音乐称为MIDI音乐。一首乐曲对应一个MIDI文件,其文件扩展名为.MID或.MIDI媒体播放器软件相当于“演奏员”。播放MIDI音乐时,它先从磁盘上读入.MID文件,解释其内容,然后以MIDI消息的形式向声卡上的音乐合成器发出各种指令第一百五十五页,共200页。例:计算机合成的MIDI音乐MIDI的优点:数据量极小(比CD立体声少3个数量级,比MP3少2个数量级)易于制作和编辑修改可以与波形声音同时播放MIDI的不足:只能合成音乐,不能合成歌曲和语言音质与硬件设备相关例1音乐之声(6KB)例2用flash弹钢琴swf第一百五十六页,共200页。例2:军港之夜对比格式长度大小军港之夜伴奏mid1分16秒6.42KB军港之夜原唱MP32分59分2.73MB军港之夜原唱伴奏WMA2分26秒0.97MB第一百五十七页,共200页。小结:计算机中的数字声音数字声音的特点:是一种连续媒体,传输与播放有实时性要求数据量大,对存储和传输的要求比较高,必须进行压缩
数字声音的类型:取样(波形)声音数字语音:应用于电话、手机、多媒体配音等全频带声音:CD和DVD音乐,数字电视伴音等计算机合成声音合成语音合成音乐(MIDI)第一百五十八页,共200页。5.4数字视频及应用5.4.1基础知识5.4.2数字视频的压缩编码5.4.3视频的获取4.4.4数字视频的应用5.4.5计算机动画5.4.6视频的文件格式第一百五十九页,共200页。5.4.1数字视频基础知识第一百六十页,共200页。彩色电视信号的发送与接收彩色电视信号的发送与接收:PAL制彩色电视信号的颜色不使用RGB表示,而是使用亮度信号Y和两个色度信号U、V来表示为进行远距离传输必须进行调制RGBRGBYUV
复合
调制摄像机话筒发射天线RGBYUV分路解调接收天线RGB将Y、U、V信号转换成为R、G、B信号,然后再进行显示使用Y、U,V彩色空间的原因:①与黑白电视保持兼容②利用人的视觉特性来节省电视信号的带宽和发射功率第一百六十一页,共200页。数字视频信号的获取
视频信号的数字化过程:
与图像、声音的数字化过程相仿,但更复杂一些(8-10bits)滤波取样量化编码数字视频信息模拟视频信号VUYUVY
数字视频的获取设备:
视频采集卡(简称视频卡)数字摄像头,通过光学镜头和CCD或CMOS采集动态图像,转换成数字信号并输入PC机脱机获取设备:数码摄像机第一百六十二页,共200页。5.4.2数字视频的压缩编码第一百六十三页,共200页。数字视频的压缩编码视频数据压缩的必要性:数字视频的数据量大得惊人,1分钟的数字电视图像未压缩时其数据量可超过1GB,对存储、传输和处理都有很大的困难视频数据压缩的可能性:视频信息的每个画面内部有很多信息冗余相邻画面的内容有高度的连贯性人眼的视觉灵敏度有限,允许画面有一定失真结论:数字视频的数据量可压缩几十倍甚至几百倍第一百六十四页,共200页。数字视频的三类编码标准ITU-T国际标准:H.261(Px64)标准、H.263标准等ISO/IEC国际标准:MPEG-1标准,MPEG-2标准(等同于ITU-TH.262),用于低分辨率、低码率视频应用的MPEG-4ASP,代表当前技术水准的MPEG-4AVC视频编码标准(等同于ITU-TH.264),在HDTV、蓝光盘、XBOX、iPod、iPhone等众多领域得到推广应用。公司标准:Intel公司的Indeo•Video,苹果公司在QuickTime中使用过的Cinepak,RealNetwork公司的RealVideo,微软公司的WMV,Adobe公司Flash播放器中使用的VP6等第一百六十五页,共200页。目前流行的数字视频编码标准名称图像格式压缩后的码率主要应用MPEG-1360×288大约1.2Mb/s~1.5Mb/s适用于VCD、数码相机、数字摄像机等H.261360×288或180×144Px64kb/s(P=1、2时,只支持180×144格式,P≥6时,可支持360×288格式)应用于视频通信,如可视电话、会议电视等MPEG-2(MP@ML)720×5765Mb/s~15Mb/s用途最广,如DVD、卫星电视直播、数字有线电视等MPEG-2高清格式1440×11521920×115280Mb/s~100Mb/s高清晰度电视(HDTV)领域MPEG-4ASP分辨率较低的视频格式与MPEG-1,MPEG-2相当,但最低可达到64kb/s在低分辨率低码率领域应用,如监控、IPTV、手机、MP4播放器等MPEG-4AVC多种不同的视频格式采用多种新技术,编码效率比MPEG-4ASP显著减少已在多种领域应用,如HDTV、蓝光盘、IPTV、XBOX、iPod、iPhone等第一百六十六页,共200页。5.4.3视频的获取第一百六十七页,共200页。视频的获取途径从互联网上下载视频视频从数码摄像机获取视频从摄像头获取视频从视频采集卡获取视频视频文件格式转换第一百六十八页,共200页。数字摄像机使用MPEG进行压缩编码,然后记录在磁带、硬盘或存储卡上具有录音功能数据量很大,采用USB接口或IEEE1394接口第一百六十九页,共200页。数字摄像头分辨率为352×288~640×480速度一般在30fps(每秒30帧)左右镜头的视角可达到45-60度支持USB接口或IEEE1394(火线)接口成像器件采用CMOS或CCD第一百七十页,共200页。从视频采集卡获取视频对于旧款的非数码摄像机拍摄的视频,不能直接复制或移动到计算机中,此时就需要在计算机上安装视频采集卡,将摄像机、视频采集卡与计算机相连,将摄像机中的视频录制到计算机中。第一百七十一页,共200页。视频卡、显卡与主机的关系视频捕获器视频缓冲器叠加/转换器TV编码器图形控制器显示存储器内存CPUDSP处理器PCI总线视频信号显示器TV机硬盘硬盘(主机)视频信号数字化并存入硬盘在屏幕上监看视频信号计算机图形文字输出在电脑上播放视频在电视机上播放视频视频卡显示卡第一百七十二页,共200页。视频文件格式转换格式之间的相互转换推荐软件:格式化工厂第一百七十三页,共200页。5.4.4数字视频的应用第一百七十四页,共200页。什么是VCD,什么是DVD?VideoCD(简称VCD):按MPEG-1标准将60分钟的音频/视频节目记录在一张CD光盘上,图像质量为VHS(352×240),即家用录放像机的水平,可播放立体声DVD-Video(简称为DVD影碟):按MPEG-2标准将音频/视频节目记录在DVD光盘上,图像质量为广播级(720×576),可播放5.1声道的环绕立体声,单面单层DVD(容量为4.7GB)光盘可记录120分钟以上的影视节目第一百七十五页,共200页。VCD与DVD的比较VCDDVD视频压缩编码标准MPEG-1video,图像分辨率为352×240(家用电视质量)MPEG-2video,图像分辨率为720×480(广播级电视图像质量)音频压缩编码标准MPEG-1audio,层2,支持双声道立体声MPEG-2audio或杜比AC-3,支持5.1声道的三维环绕立体声光盘存储容量650MB左右有多种不同规格。单面单层DVD容量为4.7GB,单面双层为8.5GB播放时间1小时左右单面单层DVD光盘可播放2小时左右其他功能较少支持多种辅助功能,如多种文字字幕,多种语言声音,多种视角,多种宽高比等第一百七十六页,共200页。可视电话和视频会议可视电话:通话双方能互相看见的一种电话系统电话机具有摄像、显示、声音等功能,内置高质量CCD镜头及MODEM视频会议:多人同时参与的一种音/视频通信系统类似于可视电话,但多人参加通话,提供的功能也更加丰富两种实施方式:在电信局的数字通信网上进行,费用高在互联网上进行,例如使用下列即时通信软件: 微软的MSNMessenger,腾迅的QQ,网易的POPO,新浪的UC等第一百七十七页,共200页。什么是数字电视?数字电视指的是:电视节目的制作(摄录、编辑)、处理、传输、接收播放全过程的数字化,特别是将电视信号进行数字化之后以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- PB-22-N-5-Hydroxypentyl-3-carboxyindole-metabolite-生命科学试剂-MCE-1773
- L-Glutamic-acid-ammonium-生命科学试剂-MCE-7975
- 1-Octadecyl-lysophosphatidic-acid-PA-O-18-0-0-0-生命科学试剂-MCE-8369
- 2025年度绩效合同签订与履行指南
- 二零二五年度未签合同员工劳动仲裁应对措施及赔偿协议
- 二零二五年度物业与业主之间绿化赔偿合作协议
- 2025年度烟酒店员工培训与职业发展合同
- 柴油发电机组技术协议
- 施工日志填写样本防雷工程施工
- 小学语文人教一年级上册识字2《日月明》教学设计
- 充电桩知识培训课件
- 2025年七年级下册道德与法治主要知识点
- 2025年交通运输部长江口航道管理局招聘4人历年高频重点提升(共500题)附带答案详解
- 老年髋部骨折患者围术期下肢深静脉血栓基础预防专家共识(2024版)解读
- 广东省广州市2025届高三上学期12月调研测试(零模)英语 含解析
- 偏瘫足内翻的治疗
- 药企质量主管竞聘
- 信息对抗与认知战研究-洞察分析
- 心脑血管疾病预防课件
- 手术室专科护士工作总结汇报
- 2025届高三听力技巧指导-预读、预测
评论
0/150
提交评论