多媒体技术应用课件_第1页
多媒体技术应用课件_第2页
多媒体技术应用课件_第3页
多媒体技术应用课件_第4页
多媒体技术应用课件_第5页
已阅读5页,还剩506页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章多媒体计算机技术概论1.1多媒体计算机技术1.2发展多媒体计算机技术的意义1.3多媒体计算机的核心技术1.4多媒体计算机系统的历史1.5多媒体技术的应用前景 多媒体计算机技术从诞生之日起就被认为是会对计算机的未来发展产生革命性影响的一个新生事物。它现在已不仅仅是一个使人类可以更加直观地接触计算机的界面技术,同时为计算机技术与应用的多方面发展提供了一个有力的手段。特别是随着国际互联网的普及和应用,多媒体技术已经涵盖了计算机网络通信、信息检索、虚拟现实等多个领域。 多媒体计算机技术以超乎人们想象的速度迅猛发展并进入人们的工作及生活的各个领域。多媒体计算机技术的进步将会极大地促进管理信息系统、可视电话/会议系统、计算机远程教育、计算机远程医疗、视频点播以及计算机支持的协作工作等计算机应用。多媒体应用已成为名副其实的信息高速公路的运载对象。1.1多媒体计算机技术 多媒体一词来源于英语单词Multimedia,其中multi表示“多”,media表示“媒体”。对媒体一词并不陌生,也有译为媒介或媒质的。过去一般称报纸、出版物、电视及电影等为大众媒体。事实上根据媒体一词的精确定义,媒体的含义包括表示媒体、显示媒体、存储媒体、传输媒体及感觉媒体等。各种媒体的定义如下。

表示媒体:为传输感觉而研究出来的中间手段,以便能更有效地将感觉从一地传向另一地,表示媒体包括各种语音编码、音乐编码、图像编码、文本编码、活动图像编码和静止图像编码等。

显示媒体:用于通信中电信号和感觉媒体之间转换所用的媒体。显示媒体有两种:输入显示媒体(它包括键盘、鼠标器、摄像机、扫描仪、光笔和话筒等)和输出显示媒体(它包括显示器、扬声器和打印机等)。

存储媒体:用于存储表示媒体,以便本机随时调用或供其他终端远程调用。存储媒体有硬盘、软盘、光盘、磁带和存储器等。

传输媒体:用来将表示媒体从一地传输到另一地的物理实体。传输媒体的种类很多,如电话线、双绞线、同轴电缆、光纤、无线电和红外线等。

感觉媒体:能直接作用于人的感官,使人产生感觉的媒体。感觉媒体包括人类的语言、音乐和自然界的各种声音、活动图像、图形、曲线、动画以及文本等。这里所说多媒体意义上的媒体主要指其中的感觉媒体,即能直接作用于人的感官,使人产生感觉的一类媒体。所谓多媒体计算机技术实质上是将以自然形式存在的各种媒体信息数字化,然后利用计算机对这些数字化信息进行加工,以一种最友好的方式提供给使用者交互使用。计算机将一改过去冰冷的面孔,人们在操作计算机时可看到喜闻乐见的图形、图像和听到优美的声音。这里给出一个目前公认的关于多媒体技术的定义:计算机综合处理各种媒体信息,包括文本、图形、图像、声音以及动画,在这些信息间以某种方式建立逻辑连接,并集成为一个具有实时交互能力的系统。从以上多媒体技术的定义中可以看到,集成性、交互性和实时性为多媒体技术的精髓。集成性是指将不同的媒体信息有机地组合成为一个完整的多媒体信息;交互性是指人们可主动地对媒体信息进行冻结、缩放、变换等操作并产生一种全新信息的交流方式;实时性则是指要支持对媒体信息的实时处理而不能产生停顿。实时性的主要表现形式为音频和视频信息,在多媒体信息中特别要强调音频和视频的存在。 可以说,多媒体技术是一种基于计算机科学的综合技术。它包括数字化信息处理技术,音频和视频技术,计算机软件和硬件技术,人工智能和模式识别技术,通信和网络技术等,是正处于发展过程中的一门跨学科的综合性高新技术。1.2发展多媒体计算机技术的意义首先,多媒体计算机技术改善了用户操作计算机的人机界面。其次,从信息处理的角度看多媒体计算机为信息的表达提供了一种全新的方式。再者,多媒体计算机的出现为计算机家庭应用提供了广阔的前景。最重要的是多媒体技术将引发一场信息社会的变革。多媒体技术与信息高速公路的结合将会给人类社会的工作和生活方式带来极其深远的影响。1.3多媒体计算机的核心技术 应该说处理音频和视频的软硬件技术就是多媒体技术的核心技术。此外,还有不可缺少的多媒体信息光学存储技术、伴随多媒体发展的触摸屏技术、超文本与超媒体技术、多媒体数据管理技术及多媒体通信和网络技术等。多媒体软件平台Windows及多媒体开发工具也是多媒体技术中的主要内容。多媒体的音频处理技术指声音的采集、量化、编码、译码、放大和播放这样一个全过程中用到的软硬件和算法。对声音进行采集后经模数转换才能输入计算机。为了减少数字化声音所占内存空间还必须对声音信息进行压缩编码。压缩编码的方法很多,有全频带编码、子带编码、参数编码和混合编码等。一般是将编码算法制作在音频专用芯片上,音频专用芯片不仅集成度高,能大大提高处理速度,而且有利于产品标准化。视频处理技术是实现多媒体技术的关键,在多媒体计算机的诸核心技术中,视频图像的处理是最困难的部分。视频处理技术同样包括图像数据的捕捉、模数转换、量化、压缩编码和彩色坐标转换等内容。视频信号的数据量比音频信号的大得多。压缩编码的方法也很多,从大的方面分类有无损编码和有损编码两种。国际标准组织制定了著名的JPEG标准和MPEG标准。光学存储技术就计算机硬件而言,处于一个举足轻重的地位。不论是音频还是视频数据的处理,或是大规模文字信息的处理,不解决存储媒体问题都无法进行。所以要扩充多媒体功能首先要有CD-ROM驱动器或DVD驱动器。近几年来光学存储技术有了飞速的进步。各种新技术正在开发中。 超文本和超媒体技术用于存储和检索非线性的媒体数据。超文本技术用链把数据节点联成一个网状结构,特别适合于联想式检索和对多种媒体信息的调用。超文本技术可以说是最早对多媒体功能的一种探索,由只对文本数据检索的超文本发展到了对声音、图像等多种媒体检索的超媒体,进而成为多媒体系统中一个主要的数据管理技术。 多媒体技术的特点决定了其数据量极为庞大,因而多媒体数据的管理就显得极为重要。此外,多媒体数据的制作也有许多特点,且获取、转换、传输和存储的费用相当高,一个好的管理可以降低成本、提高效率。多媒体数据模型和多媒体数据库与传统的数据库有很大的不同。 如前所述,多媒体信息的传送需求是发展高速通信网络的直接动因。多媒体信息主要通过综合业务数字网、光纤分布式数据接口等来传输。在网上要能方便地传送文本、声音、图形和图像等信息。多媒体通信的实现保证了可视电话、电视会议等多媒体应用的成功。分布式多媒体计算机系统将系统资源分散到分离的服务器和客户机上。触摸屏这种定位设备随着多媒体计算机技术而日益成熟,现今它以新的姿态出现在信息查询等应用中。触摸屏种类繁多,工作原理也不同,根据不同的应用目的选用相应的触摸屏可为应用增色不少。具有多媒体功能的计算机被称为多媒体计算机,具有多媒体功能的计算机系统即是多媒体计算机系统。1.4多媒体计算机系统的历史 多媒体计算机出现于20世纪80年代,形成商品化的产品和一定的市场规模则是在20世纪90年代初,1995年得到飞速地发展和普及。多媒体计算机是应社会的需要而诞生的,多媒体计算机的发展也随计算机技术的进步而不断取得进展,早期各厂商都生产了自己的多媒体产品,它们有:Apple公司的Macintosh系统。Commodore公司1985年推出了Amiga系统。这可以称为世界上第一个多媒体计算机系统。Philips和Sony公司于1986年合作开发的CD-I系统,其操作系统为CD-RTOS(光盘实时操作系统)。Intel和IBM公司于1989年合作开发了DVI系统,其核心是三块专用的DVI接口板:DVI视频板、DVI音频板及DVI多功能板,同时配有CD-ROM驱动器。最著名的还属多媒体个人计算机(MPC)。它发展最快且得到大部分厂商的支持,目前已成为多媒体计算机的主流。 音频信号的处理技术是多媒体计算机(MPC)技术的重要组成部分。同时由音频信号处理技术得来的语言、音乐播放功能也是MPC诸功能中最重要的功能之一。由MPC的基本硬件组成也可以看出这一点。一般而言,一个最简单的MPC也会包含一个声卡。我们所说的音频处理技术是指声音的采集、量化、编码、译码、放大、播放这样一个全过程中用到的软硬件和算法,下面将简要介绍。2.1声音 在计算机应用系统中加入声音可以极大地加强计算机处理信息的效果。早期的计算机以处理数值和文字信息为主,简单的声音应用也只是加入一些用扬声器报警的振铃声或者是控制音响设备。在实际应用中存在着种类繁多的声音,且需要对它们进行数值化处理。 人类获取信息的方法主要有“听”和“看”两种。看是通过眼睛读或是观察文字、图形和图像等,听则要用耳朵来接受语音、音乐及其他声音。因而在多媒体系统中加入声音功能是必不可少的,我们希望一个计算机系统既能发音又能记录各种声音,当然还要能对声音进行编辑制作。 当一种物体使空气发生振动时就产生了声音。比如讲话时声带的振动、拉琴时琴弦的振动以及扬声器纸盆的振动等都会产生声音。这样的声音可以用声波来表示。声波是一条随时间变化的连续曲线,图2.1为声波的示意图。图中的基线为时间t,声波有两个基本参数,频率和振幅。频率f是指声音信号每秒钟变化的次数,以赫兹(Hz)为单位。与频率有关的一个参数是周期T,它是指两个相邻峰点或谷点之间的时间。周期与频率的关系是互为倒数,即f=1/T。振幅是指波形的最高点或最低点与时间轴之间的距离。它反映了声音信号的强弱程度。为了表示上的方便,一般是用分贝(dB)来表示声音的强度,它是对声音信号取对数运算后得到的值。人类能听到的声音强度在0分贝至120分贝之间,也就是从能听到开始到耳膜感到疼痛为止,但因人略有不同。2.2多媒体中的音频信号 声音按其频率的不同可分为次声、可听声和超声。低于20Hz的为次声,高于20kHz的为超声,位于中部的即为可听声。多媒体计算机中的声音主要指20Hz~20kHz的可听声——音频信号。因此,我们就把多媒体计算机的声音处理技术称为音频信号处理技术。音频信号主要有3种:语音、音乐和效果声。语音的作用与文字一样,主要用于说明、回答和叙述,也可用作命令;音乐在多媒体系统中起到提示及加强效果的作用,在娱乐性多媒体应用中为播放的内容;效果声即自然界的声音,如打雷声、鼓掌声等,可为应用系统锦上添花。音频信号又可根据其覆盖的带宽分为电话、调幅广播、调频广播及激光唱盘4种质量的声音。其大致关系如图2.3所示。 一般说来,覆盖频率越宽则声音质量越好。通常语音信号电话或调幅广播质量的声音已基本可以满足要求,而对于音乐则要求具有调频广播或激光唱片的声音质量。语音常用可懂度、清晰度和自然度来衡量,而音乐则要用保真度、空间感和音响效果等指标来衡量。2.3音频信号的采集与量化 多媒体中的声音主要有两种来源。一种是由语言或音乐合成器合成的,把合成器合成的信号还原出来即为我们听到的声音。但能合成的声音总是有限的,不能全部满足我们的要求。另一种来源是从世界上已有的声音或乐曲中获得的。这里所说的获得是指把已有的音频信号经数据采集、量化后将波形形式的模拟信号转换为数字信号,再经过编码压缩后存入计算机,需要时经过解压和数模转换后还原为声音的全过程。2.3.1模拟信号与数字信号 模拟信号是一种连续变化的电信号,它用电信号模拟原有的信息。显然模拟信号的取值可以有无限多个,图2.4所示为一个话音声压随时间而连续变化的模拟信号。数字信号是一种离散信号,它的取值是有限个,像电报系统中那样,只能用“0”和“1”来表示信号的值,数字信号不能像模拟信号那样其取值可直接与信息相对应,它是用数字信号的编码来反映信息。 图2.5所示是一个电报码的例子。图2.5中有电流用“1”表示,无电流用“0”表示。电报码中以“10”表示“点”,以“1110”表示“划”,图中为“101110”,即一点一划的图形。 历史上,大多数电信号的处理一直是用模拟元部件(如晶体管、电阻、电容等)对模拟信号进行处理,但是开发一个具有相当精度且不受环境变化影响的模拟信号处理元件相当困难。如果把模拟信号转换为数字信号,用数字量来表示模拟量,那么难点就发生了转移。 在数字域中作信号处理有许多优点,首先,数字信号计算是一种精确的运算方法,它不受时间和环境变化的影响。其次,仅用数学运算去模拟功能部件相对容易实现。此外,欲改变算法或改变某些功能,还可对数字部件进行再编程。 综上所述,多媒体计算机音频处理技术中的一个重要内容是将声音的模拟信号转换为数字信号并进行相应的一系列计算和处理。2.3.2采样与量化 音频信号是一种典型的连续时间信号。这种信号的特点是在一个指定的时间范围内有无穷多个幅值。在某些特定的时刻对这些信号进行测量叫采样,由这些特定时刻采样得到的信号称为离散时间信号。 对声音的采样过程如图2.6所示。采样得到的信号幅值是无穷多个值中的一个,这种由有限个数值组成的信号叫离散时间信号。如图2.6所示,我们可以把声音信号自身的最高频率称为样本频率,把采集信号的频率称为采样频率。根据采样定理,为了正确地重构原信号,采样频率至少要为样本频率的两倍。因而对于音频信号的采样频率一般取44.1kHz,这主要是因为音频的最高频率为20kHz。低于此采样频率则会影响声音还原的质量,即会产生失真。声音信号输入计算机的流程如图2.7所示。2.5音乐合成与MIDI 用声波可以表示音乐,也可对音乐波形进行采样、量化和编码,但对于计算机来说一段乐曲会产生多得无法接受的数据。事实上,音乐的每一个音符可用击键的位置、力量的大小及持续的时间来描述,这就是音乐的数字式表示。最常用的就是所谓的MIDI。 MIDI是MusicalInstrumentDigitalInterface的缩写。MIDI规定了数字乐器接口的国际标准,它定义了不同厂家的乐器连接到计算机的电缆和硬件的规范,它定义了从一个设备向另一个设备传送数据的通信接口。2.5.1MIDI术语

MIDI文件:记录MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个通道的乐器定义。文件中含有每个音符的信息,包括键、通道号、持续时间、音量和力度等。

通道:MIDI可为16个通道提供数据,每个通道对应一个逻辑合成器。

合成器:是一种使用数字信号合成器(DSP)或其他生成音乐和声音的芯片的电子设备。DSP可生成长修改波形,然后通过一个声音生成器和扬声器输出。

音序器:为MIDI作曲而设置的计算机程序或电子设备。可用来记录、播放和编辑MIDI文件。

复音:是指一个合成器每次可支持的最多音符个数。

音色:音色就是音质,指与某特定的乐器相关联的特有的声音。

音轨:一种把MIDI数据分成单独组与并行组的文件概念,通常用通道来分隔,1号格式的MIDI文件保留不同的音轨,0号MIDI文件将这些音轨混合成一个音轨。

MIDI设备:能传递MIDI信息的设备称之为MIDI设备。

MIDI信息:MIDI信息实际上是一段对音乐的符号描述。当一套MIDI信息通过音乐合成芯片播放时,该芯片的合成器解释这些符号并产生音乐。2.5.2MIDI协议 MIDI协议是20世纪80年代由几个乐器制造厂商联合制定的一个用于电子乐器与计算机互联的协议,目前已成为国际标准。 MIDI协议规定,每一种MIDI装置通常由一个接受器和一个发送器组成,接受器与发送器可通过一种通用的异步收发器互相连接,数据传输率为每秒3125字节。MIDI键盘共有128键,编号为0~127。MIDI信息按标准文件格式存储于MIDI文件上,MIDI文件中包括每个音符的关键字、通道号、延续、音量及速度等。MPC的声卡上包含一个内部合成器和标准的三类MIDI接口。它们分别为从MIDI设备接收信息的MIDI输入,向MIDI设备发送信息的MIDI输出,以及从MIDI设备输入并转到其他MIDI设备的MIDIthru。使用MIDI文件的好处在于MIDI文件为符号序列而不是波形,它占用的存储空间少,MIDI文件的长度也很小。MIDI协议中还规定,MIDI接受器共有16个通道,它们可以同时向声音合成器传送16路不同的声音。通道的编码为0~15,0通道为基本通道。MIDI文件中包含了一连串的MIDI信息,MIDI信息由若干个字节组成。表2.1为MIDI信息标准。通常第一个字节为状态字节,其高位为1,数据字节高位为0。例如信息:9nkkvv,9表示音乐起始,n表示通道号(0~15),kk表示键编号(0~127),vv表示速度(0~127)。2.5.3MIDI音乐合成 音乐合成器有许多不同的类型和芯片集。目前主要有两种合成技术:FM合成和波形表合成。FM合成是通过硬件产生正弦信号,再经过处理合成乐音;波形表的原理是在ROM中已存储着各种实际乐器的声音采样,合成时调用这种实际声音采样合成该乐器的乐音,它的效果优于FM合成。波形表合成的关键因素之一是ROM中乐器演奏的声音采样信号集的大小,亦即ROM容量的大小。一般而言,ROM的容量越大,合成的质量越好。 MIDI音乐合成的过程如图2.16所示。MIDI乐器的键盘在演奏乐曲时,将乐曲的演奏过程记录了下来,包括键位、力度、通道号和持续时间等,形成了MIDI信息。这些信息可与作曲软件中的MIDI信息一起进行编辑和修改,原始文件和修改过的文件可存入磁盘中。当需要播放时,从MIDI文件中读出MIDI信息经声音合成器生成所需要的波形,再经功放后,从扬声器中输出。 与波形声音相比,MIDI数据不是声音而是指令,所以它的数据量要小得多。30分钟的立体声音乐,如果用波形文件约需300MB的存储空间,而MIDI数据只需200KB。MIDI由于数据量小,可以在多媒体应用中与其他波形文件配合使用,起到配乐的效果。两个波形文件不能同时使用。在音序器的帮助下,可自由地改变音调、音色等特性。2.6声卡 声卡是MPC硬件的重要组成部分,有了它才使得计算机音频信号的输入和输出得以实现。较早的CD-ROM的专用接口也安装在声卡上。从最简单的意义上讲,在一般PC机上加装一个CD-ROM驱动器和一个声卡即可称之为一台简单的多媒体计算机。2.6.1一些常见声卡 声卡的关键技术包括:数字音频、音乐合成、MIDI和音效。数字音频部分包括以44.1kHz的频率采样和以16位的分辨率录制和播放声音信号,还包括声音信号的压缩方法,一般是采用自适应脉冲代码调制(ADPCM)法。音乐合成主要有FM合成和波形表合成法。 几乎所有的多媒体计算机都遵守MIDI的国际标准。音效是近年来集成电路工业中数字声音信号处理技术进步的结晶,也可以说是声卡发展的推动。已有不少的声卡采用了音效芯片,从硬件上实现回声、混响以及和声等,使得声卡发出的声音更生动。 ZleW声卡的数字音频部分采用通用的DSP芯片,因而成本最高。采用这种方案的优点是,实现何种功能取决于软件编程,灵活性较大。它既可以实现音频服务,也能够完成调制解调器、VGA到NTSC扫描制式转换器等功能,因此可以制成一些高度综合的产品。Creative公司出品的声霸卡,数字音频部分的芯片是该公司自己生产的DSP芯片,有自己的CPU,所以具有较高的智能程度和灵活性,但相应的成本较高。与上一种声卡相比,这种声卡的音质出色一些。这两种卡的共同之处是,都采用了DSP技术,都有自己的CPU。 使用CODEC类芯片的声卡(ADSP-16),所有功能由硬件完成,需要CPU控制的地方完全由主机完成,与带CPU的声卡相比成本较低,也代表了声卡的一种类型。2.6.2声霸卡 声卡中比较有影响的产品是新加坡CreativeLabs公司的声霸卡(SoundBlaster)。下面详细介绍其有关情况。声霸卡按推出的时间先后有以下系列产品:SBV1.0,SBV1.5,SBPROV1.0,SBPROV2.0,SBl6ASP,SBl6以及改进型SBDELUXE,SBPRODELUXE,新产品SB16valuePnP,SB32PnP,SBAWE32PnP。 所有声霸卡上都有数字信号处理(DSP)电路,实现音频信号的采样和回放,它还能产生可被MIDI接口理解的信号。音频合成器也是基本器件,用来合成乐器音或语音,声霸卡采用Yamaha公司的OPL-2或OPL-3FM合成电路。SB卡上还有两个CMOS芯片插座,用户可插入CMOS301电路,以便与早期的GameBlaster兼容。 卡上都有话筒插口、立体声输出口、音量控制钮、游戏棒和MIDI连接器。立体声输出端具有每通道4W的输出功率,驱动立体声耳机或立体声放大器。自SBPROV2.0问世后,声霸卡还增加了一个音频输入插口,允许把录音机、电视机、录像机和激光唱盘机等的低幅音频的输出作为卡上的输入。图2.17为一个SBPRO的示意图。 从SBPRO产品开始总线由8位改为16位,增加了一片FM合成器和一个混合电路,可将多个声源混合成一个声音,设置了CD-ROM控制器,还安装了内部扬声器引脚,若将PC机的扬声器输出接到这里,原来由扬声器发出的声音就由声霸卡的音箱发出。 SB16ASP是声霸卡中的高档产品,它用先进的ASP代替了原来的DSP,它能对立体声进行16位采样和高达44.1kHz的数字化,而使声卡的音质与激光唱盘一样,它能用硬件手段实现音频数据的压缩和解压缩,以节省CPU的开销。此外,还可以通过编程来加入回声、混响、淡入和淡出等效果。ASP的另一个功能是能够在时间上压缩或拉长声音样本,慢入或快放数字音不会改变其音调。ASP的强有力的信号处理功能为声霸卡增加语音识别功能提供了可能性。SBl6ASP的混合器也有改进,它能混合10个通道的声音,还可控制音调。SB16没用ASP芯片,速度稍慢。 CreativeLabs还推出了一些辅助产品,其中WaveBlaster卡可用来改善所生成的音乐质量。卡上有4MB存储器,存放了许多称为乐器音库的MIDI文件,其中包括128种乐器音、18种打击乐器音和40种音效,另外,此卡还能实现32种声音的多韵律回放,即同时播放32种声音。 SBl6ValuePnP是一个完整的即插即用音频应用方案,它使用了3D立体声增强技术,提供了16位CD音质的声音输出,更具真实感和现场感。另外,通过支持WaveBlaster升级,可以轻松地获得波表合成技术的功能以及更加真实的乐器与声音效果。 SBAWE32PnP是在国际上多次获奖的SBAWE32的即插即用版本。它是物美价廉的波表合成卡,能够产生真实的乐器音色和数字声音效果。具有32种复音在多达16个MIDI通道上体现出16种音色的能力。2.6.3音箱 为好的声卡搭配一个有源防磁高保真音箱也是很重要的。 大部分声卡配备的放大器仅提供每声道4W或更小的功率,严重影响了音质。我们推荐购买自身含放大器的扬声器,然后将其直接插入声卡上的立体声低级馈出插口。通常,每声道10W的内置放大器已足以胜任。除了音箱应自含电源外,多媒体计算机的音箱还应是防磁的,这样其电磁场才不会干扰显示器和硬盘。多媒体计算机的音箱在相互间隔几十厘米并且距离用户几十厘米的情况下应能提供最佳品质的立体声音效,一般在一个桌面上摆放两个音箱。此外还有一种三件式产品,在桌面上有两个立体声卫星音箱和一个可藏于桌下的小亚低音音箱。卫星音箱再现中高音调(150~20kHz),亚低音音箱处理更深沉的低音音调(低于150Hz)。 对于音效如何来选择的问题,目前还没有一个分级和规范,因此音箱的质量只能依靠亲自聆听。一个办法是挑选一张最喜欢的CD唱盘,在你考虑购买的音箱上逐个播放,选择你感觉最动听的那种音箱。2.7音频数据的采集与处理音频数据的采集就是将声音通过声卡设备,利用声音采集软件将其以数字信息的形式保存在计算机中。音频数据的处理就是将我们采集到的音频信号利用音频处理软件对其进行降噪、剪接以及各种效果处理等。常用的声音采集(录音)与处理软件有Windows附件中的录音机、GoldWave、SoundForge和CoolEditPro等。2.7.1Windows录音机的使用 Windows中的“录音机”可以用来录制、播放和简单编辑声音波形文件(.wav)。只要你的计算机装有声卡以及一个麦克风,就可以使用录音机了。 在“附件”中启动录音机,如图2.18所示。“位置”显示框可以精确地显示当前播放或录制的位置。在波形显示框中你可以看到播放的声音的波形。“长度”显示框则显示了该波形文件的总长度。可以拖动进度指示器上的游标来改变放音的位置。它的控制按钮与“媒体播放机”中的相同。录音一般分为麦克风输入(Micin)和线性输入(Linein)。选用麦克风录音时,将麦克风插入到声卡的“Micin”插孔中,如果是用外接音源录音(如CD机),就将音频线插入到声卡“Linein”中。根据录音方式的不同,录音的设置也不同。双击位于任务栏的声音控制图标,在弹出如图2.19所示的音量控制窗口中可以设置录音方式。选择“选项”菜单下的“属性”命令,在弹出的属性对话框中的“调节音量”中选择“录音”,在“显示下列音量控制”中选择要显示的音量控制按钮。如图2.20所示。如选择“Microphone”和“Linein”,点击“确定”按钮。弹出如图2.21所示的录音控制面板。如果是麦克风录音就在“Microphone”一栏的“选择”前打勾,如果是用线性输入就在“Linein”一栏的“选择”前打勾。一切准备就绪,然后点击录音按钮就可以录制声音了。如果有声音输入,在波形显示框中会显示出起伏的波形,如图2.22所示。声音录制好后,选择“文件”菜单中的“保存”命令,将声音数据保存为WAV格式的声音文件。Windows98中的“录音机”还提供了简单的声音编辑与处理功能,你可以根据需要进行删除片段、插入声音、添加回响或反转声音等操作。如要将声音文件插入到其他声音文件中,可在“文件”菜单上,单击“打开”,然后双击待修改的文件,再将滑块移动到目标文件的插入点后,在“编辑”菜单上,单击“插入文件”,输入要插入的文件即可。尽管WAV声音被定为Windows中标准的声音格式,但是它也有一个非常大的缺点——容量大。通过Windows的录音机程序可以把它压缩一下,对它进行“减肥”。具体操作如下。打开WAV文件,然后执行“文件”→“另存为”命令。在“另存为”对话框中单击“更改”按钮,调出声音选定对话框,在“格式”栏我们可以选择“MPEGLayer-3”(也就是MP3)格式,最后输入文件名即可。如图2.23所示。由于采用了MP3压缩算法,该文件小了许多,而音质几乎没有什么变化。2.7.2其他常用音频编辑软件简介1.CoolEditPro CoolEditPro是一个集录音、混音和编辑于一体的多轨数字音频编辑软件。这个软件目前的最高版本是2.1,是应用比较广的软件之一。它功能强大且简单易用,能够录制128个声部的音乐。有很多软效果器,支持外挂插件。图2.24是CoolEditPro2.1的“波形编辑视图”,用来编辑立体声音乐。 图2.25是CoolEditPro2.1的“多轨操作视图”,用来进行多声部的录音和混音合成,通过左上角的按钮可以进行两个视图间的切换。 CoolEditPro2.1支持的文件格式有.wav、.mp3、.au、.pcm、.wma等。2.SoundForge SoundForge的最高版本为6.0,尽管它定位于业余音乐爱好者,但也有很多专业软件的品质,当然,它的最大特点是易用性,只要会用计算机的人,基本不用学习可直接上手,所以它在网上非常流行。3.Cubase Cubase最高版本为2.0。Cubase是流行音乐、摇滚音乐制作人喜欢用的软件,这是因为它有各种怪异的效果器,可以做出千奇百怪的电子声,而且有大量的效果插件可以在它上面使用。4.Samplitude MAGIXSamplitudeProducer2496是当今最伟大的多轨音频软件,是德国SEK'D公司的得意产品(现已经被Magix公司收购),它有多个版本,现在的最新版本是7.0。Samplitude将分为两个版本:SamplitudeClassic,SamplitudeProfessional。SamplitudeProducer2496是一个专业的多轨音频软件,具有数字影像和模拟视频录制的编辑功能和5.1环绕声制作功能。具有无限音轨,无限AuxBus,无限SubmixBus,支持各种格式的音频文件,能够任意切割、剪辑音频,自带有频率均衡、动态效果、混响效果、降噪、变调等多种音频效果器,能回放和编辑MIDI。因为它采用非破坏的处理方式,所以不同于传统的CoolEditPro,对文件的各种处理不会一次性叠加到来源文件上而无法恢复。Samplitude是专业录音棚必备的软件,是音频处理软件中的专业之王。5.另类软件Fruityloop 之所以说这是个另类软件,是因为它不像前面介绍的软件那样,把声音分成一轨一轨地来处理,而是以小节(或几个小节)为单位,制作几十个小片段,再把这些片段用不同的组合方式(或循环重复,或叠在一起,或前后连接)来组成一首乐曲。它使用软音源,支持ASIO,对硬件要求较高。正因为它有循环(Loop)的特点,所以特别适合制作迪曲、舞曲、鼓点等,俗称鼓点软件。目前最高版本为3.5。2.8MIDI制作软件Cakewalk使用简介 Cakewalk是当今世界最流行的MIDI制作软件。Cakewalk3.0已经推出十多个年头了,但现在还有不少人在使用它。后来,Cakewalk公司推出了CakewalkProAudio6.0/8.0/9.0三个经典版本。2002年又推出了CakewalkHomeStudio2002和Sonor2.0两款顶级软件,功能越来越强大,应用范围也越来越广。现在的Cakewalk已经不仅仅是MIDI制作软件,而是集MIDI制作、音频处理、视频剪辑和动画制作为一身的多媒体处理中心。下面简单介绍一下目前比较流行的CakewalkProAudio9.0的使用方法。1.第一次打开Cakewalk 第一次打开Cakewalk时,会出现一个MigrateCakewalkPreferences对话框,如图2.26所示。它的作用是自动查找计算机中安装的旧版的Cakewalk,并把其参数全部移植到新软件中来。单击OK开始自动移植。移植完闭后,会出现一个信息框(如图2.27所示),显示在这台计算机上找到的全部Cakewalk旧版信息,单击OK继续,出现一个消息框,如图2.28所示,告诉用户旧版数据已经移植完成。 之后出现的是CakewalkWaveProfiler对话框,如图2.29所示,询问是否检测硬件。单击“是”进行检测,单击“否”跳过检测。检测完后会出现一个检测报告,告知用户检测成功。如果检测到多个硬件,则会出一个选择对话框,询问使用哪一个设备,单击OK即可。 接着就进入了Cakewalk主界面。但是一般在第一次使用时还会出现一个NoMIDIOutputs对话框,如图2.30所示,提示用户,现在还没有选择任何MIDI输出端口。单击“ChooseMIDIPortsNow…”就可以选择MIDI输入输出端口,如图2.31所示,左边列出的是计算机上的MIDI输入端口,右边列出的是输出端口,用单击来选中或取消某一端口,蓝色表示已选中。最后单击OK完成。以上内容只在第一次打开Cakewalk时出现,如果以后需要用到它们,也可以通过菜单打开。终于看到主界面了,首先看到的是QuickStart窗口,习惯称其为“快速打开”窗口,从这里可以快速打开一个新文件,或者继续编辑一个以前的文件。2.Cakewalk的主窗口 关闭“QuickStart”后,就看到了Cakewalk的主窗口,如图2.32所示。和大多数软件一样,Cakewalk也有标题标、菜单栏、工具栏、工作区、任务栏和滚动条等。和其他软件完全一样的基本操作就不多讲了,例如文件的打开、关闭和另存为等,这里仅介绍和其他软件不同的地方。 主窗口中的每一行叫做音轨(Track),在最左边用数字标明序号。每一行音轨又被中间的一条纵向的分割线分为左右两部分。左边显示音轨的基础信息,具体说明如下。Name:音轨名称。用户可自己随意定义。Source:MIDI数据时钟来源,这一参数一般不用修改。Key+:音轨移调。0表示不移调,以半音为单位。Vel+:力度加。对音轨中的全部音符增大或减小(用负数)力度。Time+:时间加。让音轨中的全部音符推迟或提前演奏。单位是四分音符的120分之1。Port:输出端口。Chn:声部(1~16),规定这一音轨通过MIDI的哪一个声部输出。Bank:音色库。如果电脑上安装的MIDI设备支持多音色库,可以通过这个参数方便地调用不同音色库中的音色。Patch:音色。Vol:音轨总音量。Pan:音轨总声向。Size:音轨数据量。这一参数用户不能自己改动,在修改乐曲时,它会自动改变。修改以上某一个参数的具体操作如下。方法一:①单击要修改的参数;②用键盘输入数据;③按回车键确认修改。方法二:双击Patch参数,在出现的TrackProperties窗口中进行修改,最后单击OK确认修改。 音轨的右边显示的是旋律线,最顶上的一行标出了小节数,叫做小节数标尺,播放的时候,会有一条纵线在旋律线上走动,这条线是播放指针,表示乐曲播放到什么地方了,用鼠标单击小节数标尺可以自由定位播放指针。通过滚动条和右下角的放大、缩小按钮,可以查看乐曲的其他部分。 中间的分割线可以用鼠标拖动来调整其位置,用来满足用户的需要。3.如何把音符写入MIDI文件 写入音符的方法非常多,这里只介绍较简单的方法。(1)用鼠标写入音符 在主窗口左边单击准备写入音符的音轨,单击任何一个参数都可以。然后单击工具栏上画着五线谱和一个8分音符的小图标,这个小图标的名字是StaffView,即查看乐谱。这时,会有一个新的窗口打开,如图2.33所示。这个窗口的工具栏简单明了,图中标出了按钮的功能,只要按照软件提示操作,就可以完成写入的操作。如果写错了音,用“铅笔”工具可以修改,如果要写变化音,则在单击鼠标左键后不要放开,单击一下右键放开,再继续用左键上下拖动音符,即可出现变化音。在MIDI中一般不用重升、重降号。音符写好后,可单击右上角的关闭按钮返回主窗口。(2)使用钢琴卷帘窗 在主窗口单击音轨,再单击工具栏上有一个电子琴键盘图形的小图标,就可以打开这个音轨的钢琴卷帘窗,如图2.34所示。 钢琴卷帘的左侧,是一个纵向排列的键盘,表示音高,顶端的标尺,表示小节数。中间则是一个表格,表格中用彩色的条形图,形象地表述乐谱中的音符。下方的彩色纵向线段,用来形象地表示音符的力度。可见钢琴卷帘是用图形来表示音乐的走向。用铅笔工具,可以通过单击写入音符,也可以通过拖动来修改音符。用拖动能够修改音高、时值等。用直线工具可以方便地修改力度,只要在下方的力度线上画线就可以做到。在使用钢琴卷帘窗时,铅笔工具有一个精度问题,调节精度,可以改变铅笔修改音符时值时的最小精确度。方法:在小节数的标尺上单击鼠标右键,出现一个快捷菜单,选择其中的SnapProperties,在出现的小对话框中选中需要的时值即可,有效值范围是从全音符到32分3连音。窗口中的分割线的位置,可以用鼠标拖动来调整,用滚动条和缩放键可以调整视觉效果。在乐谱窗和钢琴卷帘窗中,可以对音符进行剪切复制的操作,在操作之前可用选择工具选定被操作的音符,之后的操作和一般软件基本相同。播放指针的作用相当于文字处理软件中的光标,单击小节数标尺,就可以定位“光标”到需要的位置上。在进行“复制”和“剪切”操作时,会出现一个小的选择对话框,其中有音符、速度变化、调号和拍号变化以及书签等,把需要复制或剪切的项目画钩。在粘贴时,也会出现一个小对话框,要填写粘贴到哪一音轨、小节数,还有循环粘贴的次数。4.调号和拍号的设置 单击工具栏上的调号、拍号小图标,打开拍号、调号窗口,如图2.35所示。 如果乐曲中没有调号或拍号的改变,那么拍号、调号窗口只列出第一小节的拍号、调号标记。要对第一小节的拍号或调号进行改变,操作如下。①在拍号/调号窗口中单击第一小节,使其变为蓝色。②单击“修改标记”按钮,打开修改标记对话框如图2.36所示。③选择需要的拍号和调号,单击OK。如果要添加新的拍号/调号标记,单击“添加标记”,出现的窗口和图2.35很相似,只是多了一个选择小节数的项目。要删除一个标记,只要单击要删除的标记,再单击“删除”(或按键盘上的Delete)即可。用Cakewalk可以在乐曲中间任意改变调号和拍号。图2.37就是一首频繁改变拍号的曲子。5.调整速度 如果一首乐曲中间不变速,我们直接在工具栏上的速度小窗口写上速度,再按回车就可以了。 如果在某处需要变成另一个速度,可以在乐曲中插入新的速度标记。操作如下。①在主窗口(或其他有小节数标尺的窗口)中定位播放指针到要变速的位置。②单击工具栏上的添加新速度,出现速度对话框,如图2.38所示。③单击InsertaNewTempo,在最上面输入一个速度值。④如果要修改添加到乐曲中的位置,在右下的小窗中填写一个位置。单击“OK”按钮。 有时需要在乐曲中有渐快、渐慢的地方,这时可以用速度窗来实现。单击工具栏上的速度窗按钮,打开速度窗,如图2.39所示。 第一次打开速度窗时,可能精确度会太高,只看到一个无边的表格,这时要用缩放按钮缩小它到合适的尺寸,这样就一目了然了。速度窗上方也有小节数标尺,左边是速度标尺,中间的表格中有一条彩色的线,表示乐曲的速度,用铅笔或直线工具,可以在速度窗的表格中任意画线,用橡皮可以擦掉速度标记。图2.40是一段曲折变化的速度。 在多媒体计算机信息处理中用到最多的是图形与图像处理。图形与图像是对一个实际物体的一种特殊表现形式。它具有直观、形象和易于理解的特点。本章主要介绍静态的平面图像的基本概念和数据处理方法。这些概念和方法也同样是三维动画与视频图像的基础。我们将在这一章学习图形与图像的定义,图像的获取方法,图像压缩编码方法及图像处理软件Photoshop的使用技巧。3.1计算机图像基础3.1.1图形与图像 计算机绘制的图像有两种:向量图形和位图。它们构成了活动图像的基础。它们的共同特点是都属于视觉媒体,是能被我们眼睛所观察到的。1.向量图形 向量图形是用指令形式存在的图形,用指令来描述图形中的直线、圆、弧、矩形及其形状和大小等,也可用更为复杂的形式表示图像中的曲面、光照、材质等效果。显示图形时从文件中读取指令并转化为屏幕上的形状。图3.1是几个向量图形的例子。本图形最大的优点是不需要对图上每一点进行量化保存,只需让计算机知道所描绘对象的几何特征即可。比如,对于一个圆只要知道它的半径和圆心的坐标,计算机便可调用相应的函数画出图形。所以图形需要的内存空间相对较小。 但向量图形也有一个缺点就是当图形复杂时,每调用一次费时相当大。因为它是通过执行指令一条一条地生成图形。尤其是在生成三维图形时除了要画线条外,还要处理光照、着色等效果,花费时间就更多了。实用中往往是先用向量方法生成图形,然后转换成位图来使用。 著名的软件AutoCAD及3DS等均是向量图形的代表。正是因为向量图形是靠指令来生成的,具有容易控制的特点。所有的图形均可用数学来表达,所以我们可以用它来设计工程图及制作二维动画或三维动画。它也适合做建筑绘图和版面设计等。2.位图图像 位图由计算机的内存位来组成,这些位定义图像中每个像素点的颜色和层次。位图可直接存入内存并在显示器上显示出来,其显示速度要比向量图形快得多,但位图占的内存空间要比向量图大得多。 位图图像是指在空间和亮度上已经离散化了的图像,可以把一幅位图图像理解为一个矩阵,矩阵中的任一元素都对应图像上的一个点,在内存中对应于该点的值为它的灰度。这个数字矩阵的元素就称为像素,像素的灰度层次越多则图像越逼真。一般照片都是用位图图像来表示,它适合于做电视图像和动画等。图3.2为位图图像的例子。3.1.2图像的获取 获取图像的方法非常多。最简单的可以从CD-ROM的图像库中获取,也可以自己来捕捉。捕捉的方法主要有以下几种。

用专用软件创建图像。这样的软件提供了许多供你在屏幕上创作图像的工具,如画笔、喷笔、滚筒、橡皮等,也提供了图形旋转、调色、模糊画面等工具,还提供了定义和剪裁画面的功能。

用扫描仪或数字化设备把平面图像转化为位图图像。扫描是从平面图中获取全彩色图像的最简单方法,不足之处是费时较多。

从视频设备上捕捉图像。使用摄像机对准图像并通过接口将图像传入计算机,经过转换后存入外存储设备上。3.2图像数据压缩方法的分类 数据压缩的任务在不影响或少影响图像质量的前提下,尽量设法减少图像数据中的数据量。其首要任务是设法去掉各种冗余的数据。数据压缩实际是一个编码的过程,即将原始数据进行编码压缩。数据解压缩是数据压缩的逆过程,即将经过压缩的数据还原成原始数据。因此数据压缩方法也称编码方法。评价压缩方法的优劣主要从以下3个方面来衡量。(1)压缩比:压缩比指原始图像经A/D转换后未经压缩所产生的数据量与经压缩所产生的数据量之比。(2)图像质量:还原出来的图像质量比原始图像有多大失真,一般采用人的视觉效果和信噪比两个方法。前者是通过人在两米内观察所作的评价,后者通过仪器测量。(3)实现难度:即实现压缩及还原算法的难易程度,亦即完成压缩所需要的时间与空间开销或硬件实现的复杂性。压缩的方法主要有以下几种(见图3.3)。无损编码可以完全恢复原始图像而不引入失真,它利用数据的统计特性来进行数据压缩,解压缩后的还原图像与原始图像完全一致。有损编码不能完全恢复原始数据,而是利用人的视觉特性使解压缩后的图像和原来一样。把上述方法结合起来即为混合方法。下面介绍几种常用的压缩方法。3.3霍夫曼编码 霍夫曼编码是无损编码的一种,是一种基于统计特性的可变字长的编码方法。属于无损编码的还有行程编码、算术编码等。下面来看霍夫曼编码。设被编码的符号如下。s1,s2,s3,…,sn它们出现的概率分别为:p1,p2,p3,…,pn假设采用不等字长编码,每个符号的码长分别为:m1,m2,m3,…,mn 数学上可以证明,符号序列{si}的任何一种编码方案,其平均码长必定大于或等于H。也就是说,H是该符号序列的理想最小平均码长。平均码长越接近H,我们说该编码方案越好。数学上还可以证明,在可变字长编码中,对于出现概率大的符号编码成短字长的编码,对于概率小的符号,编以较长的字长编码。如果码字长严格按照所对应符号的出现概率的大小逆序列排列,则平均码长一定小于其他任何符号顺序方式,即这是一种最接近于熵值的“最佳编码”。霍夫曼编码是实现上述最佳编码的一种算法。下面看一个示例。大部分数字信息的编码都是采用定长编码。意即采用相同的位数对数据进行编码。如常用的ASCII就是定长编码,它用7位二进制数来表示每一个字符。但是实际上在文章中每个字符出现的概率并不相等。我们现在假设有a,b,c,d,e5个字符。其出现概率分别为0.12,0.40,0.15,0.08,0.25。用以下方法来求得其霍夫曼编码。将5个字符按其概率大小排序,然后把最小的两项的概率值相加,归并成新的一项。然后再选最小的两项合并,一直重复作到只剩最后一项为止。本例实现过程参见图3.4。下面再来构造霍夫曼编码树。这是一棵二叉树,我们从图3.5中的右方开始向左取值,根结点概率为1.0,以下左分枝取概率小的项,右分枝取概率大的项。对于归并项,按此规则一直分解到最右方为止。如图3.5所示为构造好的霍夫曼编码树。如图3.5所示,我们给每个左分枝标以0,给每个右分枝标以1,则从根结点至每个叶结点的路径即为该叶结点代表字符的编码。如图3.5右方所示。本例中熵的值为2.09,编码的平均码长为2.15,非常接近。霍夫曼编码的优点是简单易行,缺点是解码时必须知道所使用的码表,这给存储和通信带来不便。另一个缺点是它依赖于原始数据的概率,这在实际应用中受到许多限制。3.4预测编码 预测编码用于图像编码时与声音的压缩编码很类似,它也是根据过去已编码的像素(也称为参考像素)来预测当前的像素值(称为预测值),然后对当前的像素值与预测值之差进行编码,这就是差分编码(DPCM)。这种编码是利用图像本身的相关性及视觉的差值灵敏度特性,差值大时,可以粗量化。图像编码用地较多的是二维预测,如图3.6所示。3.7Photoshop的使用3.7.1Photoshop6.0简介1.Photoshop的功能 Photoshop是美国Adobe公司20世纪80年代开发的图像处理软件。自诞生以来,版本不断升级,Photoshop6.0已成为出版界中图像处理的专业版本,目前已经推出Photoshop7.0版本。Photoshop以其强大的图像处理功能和丰富的美术处理技巧,为众多专业人士所青睐。它在图像处理方面,被誉为目前世界上最优秀的图像处理软件。作为图像处理工具,Photoshop着重在效果处理上,即能对原始图像进行艺术加工,并有一定的绘图功能。Photoshop能完成色彩修正,修饰缺陷,合成数字图像以及利用自带的滤镜功能创作各种艺术效果,等等。2.Photoshop6.0的界面组成 Photoshop应用程序窗口由标题栏、菜单栏、选项调板、工具箱、图像窗口、控制面板和状态栏等7部分组成。如图3.11所示。(1)标题栏(2)菜单栏(3)选项调板(4)工具箱(5)图像窗口(6)状态栏(7)控制面板3.7.2文件的基本操作1.打开图像文件 打开一个已有的图像,通常我们的方法是,点击“文件”菜单,在下拉菜单中选择“打开”命令,弹出“打开”对话框,如图3.13在“查找范围”的列表框指定要打开的图像文件所在的文件夹,在其下方的白色区域选择要进行处理的文件,对话框的最下方显示该图像的预览图,如选择“山丘”,单击“打开”按钮,就会将所选择的图像调入Photoshop。 Photoshop允许同时打开多个图像,每个图像对应一个图像窗口。按住Shift键并同时在“打开”对话框的文件名显示区单击要打开的多个文件的名称可选中它们,然后单击“打开”按钮可以将选中的全部文件打开。2.新建图像文件 用“文件”菜单中的“新建”命令,可以创建一个空白的Photoshop图像。“新建”对话框如图3.14所示。在“新建”对话框可以输入新建图像文件的文件名称,图像宽度、高度、分辨率及图像的色彩模式。“内容”栏有三个选项:“白色”选项是用白色填充背景;“背景色”是用当前工具箱中所设置的背景颜色填充图像;“透明”选项用于创建一个单层的图像,这个图像只包含一个没有颜色的透明图层而不是背景。如果“内容”栏选择为“透明”,该图像与其他图像进行合成时,是透明叠加。3.保存图像文件 与其他应用软件一样,Photoshop对图像进行处理后,要对处理过的图像进行保存和关闭。保存文件,有两种选择。单击“文件”菜单,在下拉菜单中有“保存”和“保存为”两种保存方式。 使用“保存”命令,则以图像原有的文件名和文件格式保存文件的处理结果,原始图像文件会被覆盖。使用“保存为”命令会弹出对话框,如图3.15所示。在对话框中可以更换文件名和文件类型来重新保存文件。原始文件可以保留。 处理图像时,我们的原则是保留原始图像,所以在第一次修改后保存图像时,我们一般选用“保存为”命令,在文件名称栏里输入新保存后图像文件的文件名称,在保存类型中选择一种类型进行保存。在选择文件类型时,要根据你的实际需要选择不同的类型保存。 一般,如果处理的中间过程保存为Photoshop自带格式(.psd),这样保存的文件包括了处理过程中用的图层、通道等Photoshop所特有的内容,以便下次能够继续处理。如果是最后的满意效果,可以保存成压缩的文件类型如.jpeg等,这样图像的图层等将会被合并压缩。3.7.3图像的基本处理 使用Photoshop可以对图像的整体作处理和调整,也可以利用选区处理图像的局部。对图像的整体处理主要包括调整图像的色彩属性、色彩模式,调整图像的大小,调整画布大小,图像的滤镜处理等。1.调整图像的色彩属性、色彩模式 对于一幅彩色图像,我们在扫描它的时候,可能会出现偏色的情况,或者由于某种需要,我们要对一幅图像的颜色进行调整。调整方法是,打开要调整的图像,执行“图像”→“调整”命令,子菜单中包含有关图像色彩的所有调整选项,根据具体情况选择要调整的内容,如亮度/对比度、色相/饱和度等,如图3.16所示。 选择色相/饱和度后,弹出色相/饱和度的对话框,如图3.17所示。拉动色相、饱和度、明度的滑杆可以调整相应的参数,观察图像前后的变化。对于子菜单中其他各项的调整,读者可以自己试着操作,这里就不再赘述了。要对图像进行模式转换,首先打开要转换模式的图像,然后执行“图像”→“模式”命令,在模式子菜单中选择相应模式就可以完成这种模式的转换。模式子菜单如图3.18所示。 将图像从一种模式转换为另一种模式会永久性地改变图像中的颜色值。例如:将RGB图像转换为CMYK模式时,CMYK色域之外的RGB颜色值被调整落入CMYK色域之内。因此,在转换图像之前,最好在图像原来模式下,在转换之前保存一个备份。将图像转换为灰度模式,会去掉像素的色相和饱和度信息,而只保留亮度值。将图像转换为位图模式会使图像减少到两种颜色,简化图像中的颜色信息,并减小文件大小。要将图像转换为位图模式,必须首先将其转换为灰度模式,通常最好是在灰度模式中编辑图像,然后再转换为位图模式。模式子菜单的第二组有“8位/通道”和“16位/通道”两个选项,用于定义每个颜色通道的颜色深度。大多数情况下,RGB、灰度和CMYK图像的每个颜色通道包含8位数据,因而解释为24位深度RGB、8位灰度以及32位深度CMYK。Photoshop也支持“16位/通道”的图像,即每个颜色通道包含16位数据,16位/通道的图像提供精细的颜色区,但其文件大小比8位/通道的图像大得多。“8位/通道”的图像与“16位/通道”的图像合成时,需要将它们转换为统一的数据深度。2.调整图像的大小 Photoshop可以调整一幅图像的像素尺寸和文档大小。像素尺寸是指该图像所包含像素的数目,是宽度和高度上像素的乘积。如1024×768。文档尺寸是指图像打印输出的尺寸。 调整图像的大小,从“图像”菜单中选择“图像大小”命令,弹出“图像大小”对话框,如图3.19所示。对话框中的“像素大小”栏用于设置宽和高各包含多少个像素,其值决定图像的显示大小。当显示器的分辨率一定时,像素值越大,图像的显示尺寸就越大。“文档尺寸”栏用于设置图像的打印尺寸,其中“分辨率”是指打印分辨率,其值决定每单位打印长度包含的像素个数,单位有两个,“像素/英寸”和“像素/厘米”。如果要减小图像的打印尺寸同时又要保持图像的质量,可以固定“像素大小”,增大“分辨率”的值。经常在Internet上上传图像时,为了较快传送图像,要减小图像的大小,在不影响观看的情况下,可以减少“像素大小”栏中宽度和高度上的像素,从而减小图像文件的大小。为了使图像不至于变形,要选中“约束比例”(在“约束比例”前打勾)。改变宽度时,高度也按照相应的比例变化,反之亦然。同时,改变像素大小,必须选中重定图像像素复选框。Photoshop会自动地给新图像分配新的颜色值。3.调整图像的画布大小 画布是指图像周围的工作空间。调整画布会改变图像的像素尺寸,但不会改变图像的分辨率。增大画布时,添加的画布会以背景填充在图像的周围;减少画布会将图像裁切掉。 “画布大小”命令在“图像”菜单中,执行“画布大小”命令,弹出“画布大小”对话框如图3.20所示。在“新建大小”的宽度和高度上输入相应值就可以增减画布大小。4.图像的滤镜效果 利用Photoshop的滤镜功能很容易实现对图像进行各种特殊效果处理,使图像具有美学艺术创作效果。Photoshop自带了丰富的滤镜效果,十几组之多,每组又有很多种,为我们的创意提供了强大的支持。除此之外,网络上还有其他的第三方软件作为Photoshop的插件可以使用,使Photoshop有了更大的魅力。 单击“滤镜”菜单,弹出下拉菜单如图3.22所示。点击每组滤镜效果右边的小黑箭头会有子菜单,包括具体的滤镜效果。 几个简单的滤镜效果。(1)图像的浮雕效果(2)马赛克拼贴效果(3)绘图笔素描效果3.7.4工具箱中常用工具的使用1.选择工具与移动工具 处理图像很多情况下是对图像的局部进行处理,所以在处理之前首要的工具就是对要处理的局部进行区域的选择,我们要介绍的选择工具就是要完成这样的任务,即创建选区。Photoshop工具箱中提供了选框、套索、魔棒三组用于创建选区的工具,统称为选择工具。如图3.29所示。2.裁切工具3.图章工具 图章工具具有类似复制图像的功能。Photshop的工具箱中提供了两种图章工具,如图3.37所示。4.渐变工具 渐变工具包括线形渐变工具、放射状渐变工具、角状渐变工具、对称渐变工具、钻石状渐变工具。这些渐变工具用法相同,只是产生的渐变效果不同。3.7.5图层的概念以及图层的基本操作1.图层的概念 图层是Photoshop提出的最有价值的概念之一,正是由于图层的使用,才使得Photoshop的图像处理功能得以淋漓尽致地发挥。 图层的概念是把图像看作是一层层的叠加。类似于画家作画,先画远景作为背景,再画中间景,最后画近景。Photoshop的图层,就象是在背景,中间景,近景之间加了一张透明的玻璃,对每个图层的操作就好象是在玻璃上操作,任何操作都不会影响其他图层。换句话说就是,每个图层都可以独立于其他图层进行绘画、编辑、移动、删除等操作,而且各层的不透明度可以随时更改,图层的透明部分能显示其下一层图像,不透明部分则遮盖下一层的图像。图层的叠放顺序也可以调整,整体图像的外观是所有图层的总体体现。一幅图像可以由多个图层叠加而成。Photoshop允许在一幅图中创建100多个图层,每个图层都有自己的混合模式和不透明度。一般的多层图像的最底层为背景层,如果在创建图像时,在“新建”对话框的“文档背景”选项中选择“透明”,则新创建的图像就是没有背景层的单图层的图像,这样的图像只能以Photoshop的格式存储。对图层的操作主要通过“图层”菜单和“图层控制面板”来完成。菜单的使用比较简单,我们重点介绍一下“图层控制面板”。“图层控制面板”如图3.49所示。2.图层的用法(1)增加图层(2)删除图层(3)显示图层或隐藏图层(4)当前工作图层(5)改变图层的顺序(6)图层的关联3.7.6Photoshop中的蒙版 蒙版是Photoshop处理图像很重要的一种高级技术,,其主要用途有两个:一个是用来隔离和保护图像中的某一部分区域,使之不受编辑修改等操作影响,与建立选区的作用类似,可以将图像的修改局限在图像的某一区域中;另一个是控制不同图层之间的显示效果。 Photoshop的蒙版主要有两种模式:快速蒙版模式和图层蒙版模式。1.快速蒙版模式 快速蒙版作为让用户创建和查看图像的临时蒙版,可以将图像的任何选区作为蒙版进行编辑。将选区做为蒙版编辑的优点是几乎可以使用任何Photoshop工具或滤镜修改蒙版。例如可以使用矩形选框工具创建一个矩形选区,进入快速蒙版模式并使用画笔扩展或收缩选区。画笔颜色为白色选区被扩大;画笔颜色为黑色蒙版区域被扩大。2.图层蒙版模式 图层蒙版是浮在图层之上的一块挡板,它不改变图层中的图像像素,只是用来控制该层图像各部分透明效果。使用图层蒙版的功能对图像合成大有帮助。 添加图层蒙版的方法有两个,一个是利用图层控制面板;另一个是利用“图层”菜单。 利用图层控制面板添加蒙版的方法是:首先在图层面板上选中要添加蒙版的图层,接着在面板的下面用鼠标单击添加蒙版图标,在该层缩略图后面就会出现白色的方块,即为该层添加了白色蒙版(层中的图像没有变化)。若按住Alt键的同时用鼠标单击添加蒙版图标,则在该层缩略图后面就会出现黑色的方块,即为该层添加了黑色蒙版(层中的图像完全不显示)。 利用“图层”菜单添加图层蒙版的方法是:执行“图层”→“添加图层蒙版”命令,选择显示全部,生成的就是白色蒙版;选择隐藏全部生成的是黑色的蒙版。3.7.7通道的概念 通道具有存放颜色信息以及建立和存储选择区域的作用。 每幅图像都具有颜色信息通道。如RGB模式的图像都有内定的红、绿、蓝三个颜色信息通道以及一个用于编辑图像的复合通道。如图3.57所示是一个RGB模式的图像的颜色信息通道。 同时,对于某些选区,我们也可以以通道的形式将其保存,这样的通道叫Alpha通道。当需要我们存储的选区时,可以将Alpha通道调出。 视频和基于计算机的动画已成为多媒体系统的基本媒体并且是多媒体计算机的关键技术之一。计算机能处理生动的图形、图像和动画使得多媒体计算机更具有影响力。在多媒体应用中视频图像的处理也是最困难的部分。所谓视频信号的处理主要包括视频图像的获取、压缩和存储,各种编码技术、变换技术和传输技术等。4.1活动图像 由于人眼的惰性,在亮度信号消失后约1/20秒内仍然保留着图像。活动图像正是根据这一特性产生的。多幅连续的图像以每秒25帧的速度均匀地播放,我们就会感到这是一幅真实的活动图像。电影和电视都是根据这一原理来设计的,计算机的活动图像也是如此。活动图像一般分为动画和视频两类。 用计算机实现的动画与电影动画片的制作一样,分造型动画和帧动画两种。造型动画是先对活动对象分别造型,然后用对象组成画面。帧动画是由一幅幅连续的画面组成的图形序列。视频主要指影像视频。它也由连续的画面组成,但画面是自然景物或实际人物的图像。在计算机中处理时必须全部数字化。但它终归是脱胎于电视技术,处处受到电视的影响。多媒体应用中的一个关键技术是要解决视频信息的获取、压缩、播放及通信等问题。4.1.1动画 多媒体系统中说的动画是特指基于计算机的动画。意即我们通过计算机图形工具来实现的动画。计算机动画的制作分为以下几个步骤。 (1)通过绘图程序绘制图形或光学扫描输入图形/图像并进行后处理。 (2)加入前景和背景为最终的动画构成单个的动画帧。(3)在运动画面的一个关键位置到另一个关键位置的变化过程中加入一些中间过渡的帧。主要技术包括线性插值法和样条函数法等。后者的平滑效果要好于前者。如图4.1所示是一个用线性插值法在物体上抛动画中插入中间帧的示例。为了能在计算机上显示,动画帧在显示前必须被转换为位图且图像的传送时间不能超过100ms。4.1.2视频技术1.模拟视频(1)扫描原理(2)同步(3)分辨率(4)彩色电视(5)彩色电视制式2.数字视频 计算机多媒体技术中要把前述模拟视频技术应用于计算机图像处理中,它们之间的差别在于扫描模式的不同;电视亮度和色度为复合编码,而计算机的图像工作在RGB空间;电视显像管和计算机显示器的分辨率多不相同。电视数字化的方法有两种。(1)先从彩色电视图像中分离出彩色电视信号,然后数字化。即先分离成YUV、YIQ或RGB彩色空间中的分量信号,然后用三个A/D转换器分别对它们进行数字化。(2)先对彩色电视信号进行数字化,然后在数字域中进行分离,以获取所希望的YUV、YIQ或RGB分量信号。用这种方法对电视图像数字化时,用一个高速A/D转换器即可实现视频信号的发送与接收。计算机彩色视频信号发送与接收的原理如图4.4所示。3.VGA显示 PC机通过显示器来输出图形和图像。其原理和电视基本相同,但也存在一些差异。电视机的每帧图像行数为625行,每秒25帧。而显示器为每帧480行,每秒60帧,有的甚至能达到每帧1024行。显示器要通过显示卡才能工作。早期为PC机配套的显示器有两种:单色显示器(MDA)和彩色图形显示器(CGA),MDA只能显示黑白信息而CGA分辨率又较低(320×200),许多场合不能满足要求。后来又相继推出了增强型图形显示器(EGA)和视频图形阵列显示器(VGA)。特别是VGA显示器在分辨率、颜色、容量、速度等方面有了明显地改进和提高,目前已成为国际市场上个人计算机的一种标准。 显示卡向显示器发出的信号有两类,即同步信号和亮度信号。同步信号分行同步与帧同步两种。亮度为红绿蓝(RGB)三色的亮度分量,三色亮度信号分别用来控制各自的电子束的电压强度,显示器上的一个点实际由三色元素点构成,不同色的电子束只通过相应的颜色元素点。 亮度信号是从0至最高电位范围之间的电平值,标准VGA规定亮度分为64级。每一个亮点由三个色点组成,则某一时刻该点可能显示的颜色和亮度可用三原色分量[R,G,B]来表示。[0,0,0]时为黑,[63,0,0]时为红,[0,63,0]时为绿,[0,0,63]时为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论