学习presented by大二下多媒体技术_第1页
学习presented by大二下多媒体技术_第2页
学习presented by大二下多媒体技术_第3页
学习presented by大二下多媒体技术_第4页
学习presented by大二下多媒体技术_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章数第三章数3.1多数据压缩技术概述3.23.3→第四章 3.4图像 →第五章 →第七章 数据数据压缩编码技术概基本概念数据:物理空间如器、磁盘、光盘等数 介时间区间如传输给定消息集合所需电磁频谱区域如传输给定消息集合所需的带宽等数据压缩:取消或减少冗余数据的过注意:压缩不一定用编码,而编码数据压数据压缩的必要世界范围内信息量增速1950年(计算机产生前)每150年翻一1950-1960(计算机使用后)每10年翻一1960-1992(计算机普及)每5年翻一2020年以后(预计)每73天翻 数据量巨B5(180×255mm)、→661MB/页,CD-ROM98双声道立体声激光唱盘(CD-44100×16×2=141Mb/s,650M:~约一小数字音频磁带(DAT)SIF(SourceInputFormat)格式,NTSC制式,4:4:4采每帧:352×240×3=253KB、每秒:253×30=7数据压缩的必要CCIR(InternationalConsultativeCommitteeforRadio)格每帧:720×576×3=124MB,每秒:124×25=31176×144的 在10Mbps的LAN上传送速率约3帧/陆地 遥感 水平、垂直分辨率为2340×3240,四波段采样精度为b的幅图像的数据量12b,按每0幅计算,其数据量为6.36Gb,而每年的数据量则高达2300Gb24BitBitmap 24bit256color压缩比特流中每个像素所需的比特数,即图象质量→无损压缩(质量不变评价(如5级制)和客观评价(均方误差、信噪比等数据压数据压缩的可行空间冗时间冗信息熵冗视觉冗听觉冗其它冗结构冗知识冗数据冗余的类型——空间冗A数据数据冗余的类型——时间冗T数据冗余的类型——信息熵冗余(编码冗余信息熵(entropy)H=-Pilog2Pi(i=0~k-k为数据类数或码Pi为第i个数据类数或码元发生d=Pi (i=0~k-b(yi)是分配给码元yi的比特数,理论上应该b(yi=-log2Pi,实际中很难估计出码元的的概率,当选数据冗余的类型——数据冗余的类型——人类视觉系统一般的分辨能力约为26一般图像量化采用28人耳对不同频率 的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,存在听觉数据冗余的类型——其它冗图音图标3.1.2数据压缩方法分多用于文本、数据的压非线性编辑系统为了保证质量有些高档系采用的是无失真压缩方法。有损压缩法、有失真压缩法(变换压缩法图像、声音、3.1.23.1.2统计编码压编码位数越少。大,行程编码(Run-LengthEncoding词典编码(DictionaryEncodingSystem)-LZW 编码(Shannon-FanoEncoding编码(HuffmanEncoding算术编码(ArithmeticEncoding图像……将一个相同值的连续串用一值和串长来代行程长度(runlength),简称长度。或相邻行的像间具有较强的相关性)——效果好;纯随机的“型”图像——效果差行程编消零(消空白如数字序 行程编行程编码压行(游)程(runlength)任何重复的字符序列可被一个短格任何重复44重复次数”代替例如数字序编码Name:M10CR用RLE编码方法得到的代码 80315084180行程编码压压缩率15bytes2bytes压缩率22bytes10bytes压缩率13bytes26bytes编编码流程行程编码行程编码压随之而来的问据的 变成 压缩编码且要对Bit进行编码,而忽略Byte和Word 像(monochrome对Byte进行编码,而忽略Bit和Word2字节的数据包,适用于对Pixel进行编码,一个Pixel用多个Byte一个Pixel包含多少个Byte的信息保存的图像的Header行程行程编码压行程行程编码压RLE(CompuServe,Utah以格式有)词典编码压LZ77(LempelZiv)算LZSS(LempelZivStorerSzymanski)算LZ78(LempelZiv)算LZW(LempelZivWaltch)算JZiv和ALempel在1978年首次了介绍这种编码方法的文章。在此研究基础上,TerryAWeltch在1984年了改进这种编码算法的文章,因此把这种编码方法称为ZW压缩编码ZW算法得到普遍采用,对ZW算法的进一步改进是增加可变的码字长度以及在词典中删除老的缀-符串。在GI图象格式和UNIX的压缩程序中已经采用了这些改进措施之后的ZW算法。企图查找正在压缩的字符序列是否在以前输入的数据中词典编码企图从输入的数据中创建一个“短语词典(dictionaryof当遇到已经在词典中出现的“短语”时,编就输出这个词典词典编码压缩——LZW词典编码压缩——LZW用字符串表中的一个索引代码来替代响应的字符在具体实现时,大多都使用12位的索引代码来代替8位的输入字符。字符串表有4096个 前256个空间用来 单个字符(location0stores0,location1stores1,等)。<256>专门用 代码,<257>专门用于信息结束代当从输入字符串中发现一个新串时,将其添加到字符串表中其 空间从 ,数据解析器一直解析新输入的字符,只要新生成的字符串位于字符串表中。一旦的字符产生了一个新的字符串,把这个新的字符串添加字符串表中,并输出上次已知的字符串的索引代码词典词典编码压缩——LZWSTRING=第一个输入字符WHILE输入流中还有字符CHARACTER=下一个输入字IFSTRING+CHARACTER在字符串表STRING=STRING+输出STRING的索把STRING+CHARACTER添加到字STRING=CHARACTEREND输出string的索引代outputBAA001100110101词典编码压缩——LZWOLD_CODE所代表的字符WHILE输入流中还有代码=IFNEW_CODESTRINGOLD_CODE所对应的字符(串)STRING=STRING+CHARACTERSTRINGNEW_CODE所对应的字符(串)STRING=OLD_CODECHARACTER添加到字符串表中OLD_CODENEW_CODEENDStringBAAABAAAAA-编-编 (1)Entropy(熵)的概念 某 的信息量用Ii=-pi*log2pi表示,其中pi为第i 的概0<pi(2)信源S的熵的定义按 (Shannon)的理论,信源S的熵定义H(S)=E{Ii}=pi*log2(1/pi)其中pi是符号Si在S中出现的概率;log2(1/p)表示包含在S中的信息量,也就是编码Si所需要的位数。ABCDE7765符符出现的次数需要的A15(01B7(02C7(02D6(02E5(03总比特数ABCDEE T(- Q(--.-重复步骤2,得到各节点,形成一棵“树”,其中最后一从根节点开始到相应于每个符号的“树叶”,从上到下标上“”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的;从根节点开始顺着树枝到每个叶子分别写出每个符号的符符出现的次数分配的代需要的A15(010B7(02C7(02D6(02E5(03总比特数编000110110编码方 如,码串中的第10A011”,那么它就代表符号D“”,即码簿,那么就可以根据码簿一个码一个码地依次进行译码信源信源符出现概组成的二元码22333455熵平均码出现概率组成的二元码2-112-22-32-42-52-62-72-7码2224444小Huffman不是唯一的。( 时必须参照Huffman算数算数 统计编码压缩——算数0的概率1的概率:Pe1-序序符CA11203141统计编码压缩——算数最后子区间的起始位置=(85/256)d= 子区间的长度=(27/256)d= 子区间尾=(7/16)d=(0.0111“0.011”,可编码为“011”。算数步算数步输入编码间 编从,0.514402)中选择一个数作符概区[0,[0.1,[0.5,[0.7,11[05,0符号的间隔范围[0502[05,0[0507)间隔的第一个3[0514,0[05052)间隔的最后34[0514,0[0514,052)间隔的第5[05143,0[051405146)间隔的第6开始,二个6[0[05143,051442)间隔的最后307,[0514384,051442)间隔的401/10,从第21/10开符编码间译码1[05,0051439在间隔[05,02[05,0051439在间隔[05,07)13[0514,0051439在间隔[05,052)74[0514,0051439在间隔[0514052)15[05143,0051439在间隔[0514,05146)的第5个6[00051439在间隔[05143,051442)的第77 0051439在间隔 ,0514402)的2算数算数算术编对整个消息只产生一个码字,这个码字是在间隔[0,1)中的一个实数,因此译在接算数在静态算术编码中,信源符号的概率是在自适应算术编码出现的频繁程度动态地进行修改。中估算概率。因此动态建模就成为确定编压缩001-2003-6-3.1.3常用数据压缩方法 本原定 是指先对信号进行某种函数变换,从一种信(空间)变换到另一种信号(空间信号进行编码。输入AU输出填反变编变3.13.1.3常用数据压缩方离散变换设信源序列为一个n行k列矩阵X(例如扫描到的图像数据);假设采用一维变换,变换后输出序列为Y;变换矩阵为。则有Y (信源端如果取正交变X=T-1Y(接收端关键T的寻找,协方差矩阵3.1.3常用数据压缩方法的基本原1.最佳的正交变换(K-L变换定义也称Karhunen-Loeve变换,变换后协方差矩阵为对关键对已知X,根据其协方差矩阵寻找正交变换T,使特点1)质量高,对图像信号,变换后2bit/采样征确定,非恒定形式;3)计算量大、实用性不太高2.次最佳的正交变换DFT变 变换后协方差矩阵接近对角阵。变换阵固定简便、易于实复数运算,运算量大,可用快速算法(FFT)DCT变换是DFT取实部,有快速算法,对于平稳过渡的量可与7bit/采样值的质量相比拟;2)变换矩阵由信源通过分析原始数据,将其分解为一系列更适于表示的基元或从中提更有本质意义的参数,编码仅对这些基元或特征参数进行;而则借助于一定的规则或模型,按照一定的算法将这些基元或参数再合成原始数据的一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论