第二章——多媒体数据处理技术2014-_第1页
第二章——多媒体数据处理技术2014-_第2页
第二章——多媒体数据处理技术2014-_第3页
第二章——多媒体数据处理技术2014-_第4页
第二章——多媒体数据处理技术2014-_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1页n 数字音频基础n 音频卡工作原理n 音频编码n 音频信息处理(核心章节)n 视觉媒体信息的处理(核心章节) 第2页n 数字音频的采样与量化n音频数字化:模拟音频信号音频数字化:模拟音频信号有限个数字表示的离散有限个数字表示的离散序列序列n音频的采样:按一定的时间间隔(音频的采样:按一定的时间间隔(T)取值,得到)取值,得到x(nT).T称为采样周期,称为采样周期,1/T称为采样频率。称称为采样频率。称x(nT)为为离散信号。离散信号。 n常用的采样频率:常用的采样频率:8kHz, 11.025kHz, 22.050kHz, 44.1kHz, 8kHz,16kHz, 48kHz.第3页n

2、 数字音频的采样与量化n音频的量化:先将整个幅度划分为有限个小幅度(量音频的量化:先将整个幅度划分为有限个小幅度(量化阶距)的集合,把落入某个阶距内的样本值归为一化阶距)的集合,把落入某个阶距内的样本值归为一类,并赋予相同的量化值。如果量化值是均匀分布的,类,并赋予相同的量化值。如果量化值是均匀分布的,称为均匀量化。称为均匀量化。 设设为量化阶距,为量化阶距,Xmax为量化器最大范围,则:为量化器最大范围,则:对于样值对于样值s, , 如果如果 ,则其量化值,则其量化值均为均为 。max22BX1122isi i第4页n 音频信息的采集(录制)n用Microsoft Windows录音机进行录

3、音,形成.wav格式文件。第5页n 音频信息的采集(录制)n用CoolEditPro的录音功能进行录音第6页n 音频信息的采集(录制)n用Matlab语言实现录音,存储,播放(DEMO) 用单声道录音,存储,播放Fs=11025;y=wavrecord(5*Fs, Fs, double);wavplay(y,Fs);wavwrite(y, Fs, testlininrecord.wav)用双声道录音,存储,播放Fs=11025;y=wavrecord(5*Fs, Fs, 2, double);wavplay(y,Fs);wavwrite(y, Fs, testlininrecord2.wav)

4、audiorecorder();audioplayer;pause();resume();play();stop();第7页n 音频信息的显示与理解声音是由于空气振动产声音是由于空气振动产生的,其表现形式就是生的,其表现形式就是声波。声波。声波的振幅决定音量的声波的振幅决定音量的大小大小声波的频率决定音调声波的频率决定音调第8页nwav文件格式nwav文件:文件:Microsoft公司的音频文件格式。记录公司的音频文件格式。记录声音波形。声音波形。n利用该格式记录的声音文件能够和原声基本一致,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。质量非常高,但这样

5、做的代价就是文件太大。nwav文件所需存储空间(文件所需存储空间(byte/sec) 采样频率采样频率(Hz)量化位数量化位数(bit)声道数声道数/8n常用音频文件格式第9页nmp3数字音频的文件格式 MPEG-1,Layer-3,扩展名,扩展名MP3:现在最流行的声:现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛,但和用广泛,但和CD唱片相比,音质不能令人非常满唱片相比,音质不能令人非常满意意。nReal Audio数字音频的文件格式 Real Audio,扩展名,扩展名rm:压缩比大,失真小。压缩比大,失真小。与与

6、MP3相同,它也是为了解决网络传输带宽资源而设计的,因此相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是主要目标是压缩比和容错性,其次才是音质压缩比和容错性,其次才是音质。n常用音频文件格式第10页n音频信号的分类n语音信号,有复杂的语义和语法信息(语音信号,有复杂的语义和语法信息(非特非特定人,孤立词定人,孤立词连续词、小词汇量连续词、小词汇量大词汇量大词汇量 算法算法:聚类、基于动态规则的匹配:聚类、基于动态规则的匹配n80年代中期,年代中期,隐马尔可夫模型隐马尔可夫模型(HMM)为基础的各种系为基础的各种系统,美国统,美国CMU的的Sphinx系统系统 IBM的的Tangor

7、a20和和VoiceType3.0系统系统 DRAGON公司的公司的Dragon Dictate系统系统n现在:关键时期,新模型、新方法及实用化系统研究现在:关键时期,新模型、新方法及实用化系统研究n 语音识别第57页n 语音识别的发展和分类(Cont.)n分类n按识别词汇量大小分按识别词汇量大小分n小词表语音识别小词表语音识别(识别词汇识别词汇100)n中词表语音识别中词表语音识别(100识别词汇识别词汇1000)n按语音的输入方式分按语音的输入方式分n孤立词:以单音节或短语为条目,条目内音节连续,孤立词:以单音节或短语为条目,条目内音节连续,条目间有明显停顿,如:条目间有明显停顿,如:09

8、数字,人名、地名、控数字,人名、地名、控制命令、英语单词、汉语音节、短语制命令、英语单词、汉语音节、短语n连接词:多条目,需拆分连接词:多条目,需拆分n连续语音:自然语言连续语音:自然语言n 语音识别第58页n 语音识别的发展和分类(Cont.)n分类n按发音人按发音人n特定人:用特定人声音训练后使用特定人:用特定人声音训练后使用n限定人:多个特定人训练限定人:多个特定人训练n非特定人:不需要训练非特定人:不需要训练n按实现技术分按实现技术分n基于模板匹配的基于模板匹配的n基于概率统计模型基于概率统计模型n 语音识别第59页n音节性很强:每个字都是以单音节为单位,共有音节性很强:每个字都是以单

9、音节为单位,共有400400多音多音节,加上四声共节,加上四声共13401340个,识别基元少个,识别基元少n音节构成,简单规整:声母韵母、韵母音节构成,简单规整:声母韵母、韵母n有调语言:音节发音时间长,有稳定的有调段有调语言:音节发音时间长,有稳定的有调段n音节偕同发音与音变少音节偕同发音与音变少优势优势难点难点n 语音识别n 汉语语音识别n汉语特点(相对于英语)n同音字多同音字多n内涵语言,语义与上下文、语气均关连,语法简单、变化内涵语言,语义与上下文、语气均关连,语法简单、变化灵活灵活凭据凭据-评剧评剧-萍聚萍聚意义意义-异议异议-意译意译中国队大胜(大败)美国队中国队大胜(大败)美国

10、队第60页n 汉语语音识别n汉语语音识别系统工作原理数据采集波形自动切分预处理与特征参数提取声学模型时间对准组句分析识别结果整句输出声学基元模型库语言模型库统计信息与规则分帧后的语言特征矢量集合声学音节候选语句候选语音流切分参数提取模板识别n 语音识别第61页n 汉语语音识别(Cont.)n汉语语音识别系统工作原理n连续语音流预处理:连续语音流预处理:n模拟语音数字化模拟语音数字化n信号处理,包括带通滤波、变换等信号处理,包括带通滤波、变换等n波形切分:找出语音信号中的各种识别基元(音素、音节、波形切分:找出语音信号中的各种识别基元(音素、音节、半音节、声韵母、单词、意群)的起点和终点位置,将

11、连半音节、声韵母、单词、意群)的起点和终点位置,将连续语音处理变为对各个语言单元的处理续语音处理变为对各个语言单元的处理n特征参数提取:特征参数提取:n表达语音特征又能彼此区别的参数,是语音识别基础表达语音特征又能彼此区别的参数,是语音识别基础n如:线性预测参数、倒频谱系数、如:线性预测参数、倒频谱系数、(RefRef.Chapter 2.Chapter 2语音识别语音识别 倒频谱系数倒频谱系数.doc.doc)n参数模板库参数模板库n识别判决识别判决n 语音识别第62页n 汉语语音识别(Cont.)n语音识别系统的最终目的n不限制说话人,即非特定人不限制说话人,即非特定人n不限制词汇量,即基

12、于大词汇表不限制词汇量,即基于大词汇表n不限制发音方式,即识别连续自然发音不限制发音方式,即识别连续自然发音n高识别率,应达到人对自然语言的识别能力高识别率,应达到人对自然语言的识别能力n 语音识别第63页n 汉语语音识别(Cont.)n语音识别系统的困难n使用者的差别大,排除差异、保留共性难(口音、年龄、使用者的差别大,排除差异、保留共性难(口音、年龄、性别、发音速度、发音强度、发音习惯)性别、发音速度、发音强度、发音习惯)n识别的词汇量大识别的词汇量大, ,将导致系统的识别性能急剧下降而失去将导致系统的识别性能急剧下降而失去可用性,原因是:可用性,原因是:1 1)需要的时间和空间开销多;)

13、需要的时间和空间开销多;2 2)词与)词与词之间的差异细微;词之间的差异细微;n基元的识别有一定的局限性,而连续音识别又不能实现基元的识别有一定的局限性,而连续音识别又不能实现n实用的系统要求高可靠性,因此参数的鲁棒性、抗噪声能实用的系统要求高可靠性,因此参数的鲁棒性、抗噪声能力,环境适应性等要求高,力,环境适应性等要求高,太复杂太复杂n 语音识别第64页n 汉语语音识别(Cont.)n语音识别技术的应用 作为人机交互的手段,语音识别是为了实现听写和命令控制n办公自动化:在多种场合方便文件起草和编辑办公自动化:在多种场合方便文件起草和编辑n电话商业服务:电话和计算机语音识别的结合电话商业服务:

14、电话和计算机语音识别的结合, ,将为将为语音识别开辟一个很大的应用领域。语音识别开辟一个很大的应用领域。n 语音识别30/downloads/bighttp:/ 汉语语音识别(Cont.)n演示 (Vista; Windows Phone 7 Tellme; iPhone 4s Siri)n 语音识别http:/ 说话人识别与语音识别的区别n 说话人识别(Speaker Recognition, SR):从相同的一段语言中,识别出是谁在讲话。n 语音识别:关注说话的内容,把其转换成对应的文字,主要用于语音信息录入。而不关注是谁在讲。第67页n 说话人识别技术

15、n 说话人识别(Speaker Recognition, SR):以语音对说话人进行区分,从而进行身份鉴别与认证的技术。n SR基本问题: (1)如何选取能够唯一表征人的有效而可靠的参量,如何对它进行处理 (2)如何规定相似性的测度,使相似性的计算既简单又可靠; (3)考虑到人的状况在不断变化,为使系统能够可靠工作,如何使它的参考量不断更新以适应使用者。第68页n 说话人识别技术n 说话人识别常用技术 (1)模板匹配法 (2)概率模型法(如:HMM) (3)矢量量化法(VQ)第69页n 视频信息的采集n计算机常用图像及其获取手段计算机常用图像及其获取手段一张用扫描仪扫描的图像2400dpi(d

16、ot per inch)图形静态图像动态图像计算机软件扫描仪视频数字化设备数码相机第70页n 视频信息的采集n计算机常用图像及其获取手段计算机常用图像及其获取手段第71页n 视频采集卡的分类和特点n按输入信号类型分为:n数字视频输入卡数字视频输入卡n模拟视频输入卡模拟视频输入卡n数字视频卡nUSB接口:当前最流行,低接口成本,传输速度(接口:当前最流行,低接口成本,传输速度(USB2.0为为 480Mbps,USB1.1为为12Mbps )n1394接口:低接口成本接口:低接口成本(100-300元元),传输速度传输速度(30-40Mbps)nCamera Link接口:接口成本接口:接口成本

17、(1万元万元),传输速度传输速度(600Mbps)n 视频信息的采集视频采集卡1394第72页n 视频采集卡的分类和特点(Cont.)n模拟视频卡n黑白黑白/彩色彩色nVideo(包括:包括:P制、制、N制和多制制和多制)n分量输入(包括:分量输入(包括:YUV(亮度和色差),电视台常用;(亮度和色差),电视台常用;RBG,医学上常用),医学上常用)nS-Video输入:亮度和色度分离输入:亮度和色度分离n压缩卡、非压缩卡压缩卡、非压缩卡n 视频信息的采集视频采集卡第73页n 视频采集卡的供应商及特点n国外n最大厂商:加拿大最大厂商:加拿大Matroxn其次:比利时其次:比利时Euresysn

18、特点:价格高出国内或合资一个数量级,信噪比高,特点:价格高出国内或合资一个数量级,信噪比高,多用于非批量及专业图像处理多用于非批量及专业图像处理n 视频信息的采集视频采集卡第74页n 视频采集卡的供应商及特点(Cont.)n国内n最大厂商:大恒图像最大厂商:大恒图像 特点:特点:支持多操作系统,各特殊需求或行业的技术支持强,支持多操作系统,各特殊需求或行业的技术支持强,适合中批量的产品开发适合中批量的产品开发n合资企业:德加拉、图码合资企业:德加拉、图码 特点:特点:低价格,不重视个性服务(或者说技术来源于国外低价格,不重视个性服务(或者说技术来源于国外其他企业,技术服务成本高),大量产品(硬

19、盘录像机)用其他企业,技术服务成本高),大量产品(硬盘录像机)用n台湾:台湾:Liseview 特点:特点:分工明确,研发、生产、销售由不同的企业完成,分工明确,研发、生产、销售由不同的企业完成,OEM (Original Equipment Manufacturer)造成多品牌,单造成多品牌,单家企业生产,批量很大成本很低,适合家庭使用家企业生产,批量很大成本很低,适合家庭使用n 视频信息的采集视频采集卡第75页n 视频采集卡的工作原理复合视频输入1 或Y1复合视频输入2 或C2复合视频输入3 或Y2复合视频输入4 或C3多路开关数字解码A/DYUV4:2:2缓存PCI总线 VGA显示卡系统

20、内存DH-VRT-CG200 图像板复合视频输入5 或Y3复合视频输入6 或C1驱动监视器n 视频信息的采集视频采集卡第76页n 视频采集卡的硬件安装n与VGA卡连接 n 视频信息的采集视频采集卡第77页n 视频采集卡的硬件安装n与VGA显示器连接 n 视频信息的采集视频采集卡第78页n 视频采集卡的硬件安装n与视频信号源的连接 n 视频信息的采集视频采集卡视频线(同轴电缆)第79页n 图像类型n 真彩色图像(24bit)n又称又称RGB图像,用图像,用R、G、B三个颜色分量表示一个三个颜色分量表示一个像素的颜色,通过三基色可以合成出任意颜色。像素的颜色,通过三基色可以合成出任意颜色。n对一个

21、尺寸为对一个尺寸为mn的彩色图像来说,在的彩色图像来说,在MATLAB中存储为一个中存储为一个mn3的多维数组。的多维数组。n图像图像a中任中任意意一点(一点(x,y)处的像素值)处的像素值 a(x,y,1:3);n真彩色图像可用真彩色图像可用“double”型存储,亮度值的范围型存储,亮度值的范围0,1,(0,0,0)代表黑色,代表黑色,(1,1,1)代表白色代表白色n真彩色图像也可用真彩色图像也可用“uint”型存储,亮度值范围型存储,亮度值范围0,255第80页n 图像类型n 索引色图像n不同颜色对应不同序号,各像素不同颜色对应不同序号,各像素存储的是颜色的序号存储的是颜色的序号,而不是

22、颜色本身。而不是颜色本身。n索引色图像包含两个结构:调色板和图像数据矩阵。索引色图像包含两个结构:调色板和图像数据矩阵。最多最多64K。n调色板是一个调色板是一个m3的色彩映射矩阵,矩阵的每一行代的色彩映射矩阵,矩阵的每一行代表一种色彩,通过三基色颜色强度的双精度数,形成表一种色彩,通过三基色颜色强度的双精度数,形成一种特定的颜色。一种特定的颜色。n用用Matlab的的hot(m)产生一个产生一个m3的调色板。颜色从的调色板。颜色从黑经过红、橘红、黄到白。黑经过红、橘红、黄到白。第81页n 图像类型n 索引色图像(Demo)Demo:每个竖线代表一个颜色索引但是具体显示颜色由colormap决

23、定imagesc(1:63);colormap(bone);colormap(pink);colormap(hot);Colormap有:Autumn,bone,colorcube,cool,copper,flag,gray,hotHsv,jet,lines,pink,prism,summer,white,winter第82页n 图像类型Demo:RGB索引色m1=imread(cyx.JPG);imagesc(dither(m1,bone);imagesc(dither(m1,hot);imagesc(dither(m1,cool);imagesc(dither(m1,pink);image

24、sc(dither(m1,bone);colormap(bone);DITHER Convert image using dithering. X = DITHER(RGB,MAP) creates an indexed image approximation of the RGB image in the array RGB by dithering the colors in colormap MAP. MAP cannot have more than 65536 colors.Demo:RGB索引色RGB = imread(cyx.jpg);X,map = rgb2ind(RGB,16

25、);imshow(X,map);IMAGESC Scale data and display as image. IMAGESC(.) is the same as IMAGE(.) except the data is scaled to use the full colormap.第83页n 图像类型n 灰度图像n灰度图像只有强度信息,而没有颜色信息。灰度图像只有强度信息,而没有颜色信息。n存储灰度图像只需要一个数据矩阵,每个元素表示对应位置的存储灰度图像只需要一个数据矩阵,每个元素表示对应位置的像素的灰度值。像素的灰度值。n灰度图像的数据类型可以是灰度图像的数据类型可以是double型,

26、也可以是型,也可以是uint型。型。n 二值图像n只有黑白两种值的图像。只有黑白两种值的图像。n每个像素只取每个像素只取0或者或者1两个数。两个数。第84页n 彩色空间(review)n RGBn HSV(HSI):面向用户的一种符合主观感觉的色彩模型,比RGB更接近人们对颜色的感知。nH(Hue)色度,表示颜色的种类;由)色度,表示颜色的种类;由0变到变到1,HSV颜色颜色由红变为黄,绿、青(由红变为黄,绿、青(cyan)、洋红()、洋红(magenta)、然)、然后变回红色。后变回红色。nS(Saturation)饱和度;由)饱和度;由0变到变到1,颜色由不饱和变为,颜色由不饱和变为饱和。

27、饱和。nV (Value)亮度;由)亮度;由0变到变到1,颜色越来越亮。,颜色越来越亮。第85页n 彩色空间的理解DEMO:用用PHOTOSHOP体会体会HSV和和RGB彩色空间彩色空间第86页n RGB图像空间的理解DEMO:D:Chapter 2imrender.m第87页n RGB图像空间的理解如何绘制二次色图呢?第88页n RGB图像空间的理解10020030050100150200250300100200300501001502002503001002003005010015020025030010020030050100150200250300RGB第89页n 静态图像的文件格式n

28、图形变换格式图形变换格式(graphics interchange format, GIF) 由由Compu-Serve公司于公司于1987年为制定彩色图像传输协议而开发年为制定彩色图像传输协议而开发的,它支持的,它支持64000像素的图像,像素的图像,256到到16M色的调色板色的调色板 支持一个文件包含多个子图像(也称子文件支持一个文件包含多个子图像(也称子文件subfiles)n 图像文件格式及其转换GIF格式文件第90页n 静态图像的文件格式n图形变换格式图形变换格式(graphics interchange format, GIF) n 图像文件格式及其转换DEMO:用用FLASH制

29、作含多个子制作含多个子图像的图像的GIF格式文件格式文件制作步骤:(1)插入文本(2)右键,转换为图形元件(3)20帧处插入关键帧(4)用变形工具将文字变形(5)插入补间动画(6)发布设置,选中GIF(7)在GIF选项卡中将“动画”选中(8)导出成GIF格式动画第92页n 静态图像的文件格式n标记图像文件格式标记图像文件格式(tag image file format, TIFF),也,也支持一个文件包含多个子图像支持一个文件包含多个子图像n 图像文件格式及其转换TIFF格式文件第93页n 静态图像的文件格式n目标图像格式目标图像格式(target image format, TGA) TIP

30、S软件使用的文件格式。由描述图像属性的软件使用的文件格式。由描述图像属性的文件头文件头(header)和描述各点像素值的和描述各点像素值的文件体(文件体(body)组成组成n 图像文件格式及其转换TGA图像文件结构原理图第94页n 静态图像的文件格式n位图位图(bitmap, BMP) 与设备无关与设备无关 Windows推荐使用推荐使用 位映射的存储形式位映射的存储形式n 图像文件格式及其转换BMP图像文件结构原理图第95页n 动态图像的文件格式nAVI格式文件转换为格式文件转换为MPEG格式格式DEMO (AimOne) DEMO (WinMPG)n 图像文件格式及其转换Drive.avi

31、Drive.mpg第96页n 动态图像的文件格式nAVI格式文件转换为格式文件转换为.GIF格式图像格式图像 DEMO (AniMake) :用Windows Movie Maker录像,用AniMake进行文件格式转换,保存为序列GIF图,改变播放速度,改变播放顺序,改变图片方向,在某(些)帧增加说明性文字。用Photoshop处理,然后返回保存n 图像文件格式及其转换Drive.aviDrive.gif第97页n 用Matlab实现图像的读写和显示n命令命令1: imread Imread函数,用于读入各种图像文件函数,用于读入各种图像文件 举例:举例:img1=imread(huangg

32、uoshu.jpg);n命令命令2: imwrite Imwrite函数,用于读入各种图像文件函数,用于读入各种图像文件 举例:举例:img1=imwrite(huangguoshu.jpg);n命令命令3: imageImage函数,用于显示图像文件函数,用于显示图像文件举例举例 image(img1);n 视频信息的处理读写和显示图像文件第98页n 用Matlab实现图像的叠加效果(DEMO)m1=imread(koala.JPG);m2=imread(penguins.JPG);axes(position,0 0 1 1);image(double(m1)/2+double(m2)/2)

33、/256);colorbar;n 视频信息的处理图像的叠加、二值化、边缘提取n 用Matlab实现图像的二值化m1=imread(koala.JPG);im2bw(m1);第99页n 图像信息的处理边缘提取与图像切割n 用Matlab实现边缘提取(方法一)m1=imread(cyx.JPG);imshow(bwperim(im2bw(m1);n 用Matlab实现边缘提取(方法二)m1=imread(cyx.JPG);imshow(edge(rgb2gray(m1),canny); n 用Matlab实现图像切割m1=imread(huangguoshu.JPG);subplot(1,2,1)

34、;axis equal;image(m1);subplot(1,2,2);axis equal;image(m1(300:1300,200:1200,:);试验另一种算子: prewitt第100页n 用Matlab实现移动目标提取(帧差法)function imgdiffimg1=imread(i1.bmp);img2=imread(i2.bmp);h=figure(1);set(h,Position,10 40 300*3 200);sub1=subplot(1,3,1);set(sub1,Position,0 0 1/3 1);image(img1);axis off;sub2=subp

35、lot(1,3,2);set(sub2,Position,1/3 0 1/3 1);image(img2);axis off;sub3=subplot(1,3,3);set(sub3,Position,2/3 0 1/3 1);image(uint8(abs(double(img2)-double(img1);axis off;return;n 视频信息的处理移动目标提取第101页nDemo(D:Chapter 2imageprocessingimgdiff.m)n 视频信息的处理移动目标提取背景图一帧图像帧差法处理后图像第102页n 基于文字本质特征的方法基于文字本质特征的方法n 视频信息的

36、处理文字提取 A 上上 (English) (Chinese) (Japanese) 文字有线段构成 每个线段宽度基本相同 每个线段长宽比例适中第103页n Demon 视频信息的处理文字提取 原始视频信息 文字提取结果第104页n 视频信息的处理文字提取 Wearable Computer Display Digital Camera n 系统构成系统构成第105页n 视频信息的处理文字提取n 系统工作原理系统工作原理OCRSystemImageTextDetectionCutting &RotationBinarisationImageSize, Location &Dir

37、ectionTranslatorCameraCut andRotatedImageBinarizedImageTranslated TextDisplayWearable ComputerRecognized TextOCR (Optical Character Recognition,光学字符识别) 中国OCR信息网http:/ 第106页n 视频信息的处理文字提取n OCROCR在线识别在线识别DEMODEMOhttp:/原文件原文件。A. Image Cutting and Rotation After detecting the characters, we should integr

38、ate some single characters into one wo涌which is much easier to be企derstood眷the we企er. We realize this function based on clustering. According to the difference of character size for different languages, we can predefine some thresholds. If the distance between some characters is less than the thresh

39、old, then they are clustered into one class (In English, it may be a word or some words). We use rectangles to confine the extracted words, seeing Figure 7. In order to speedup the recognition企OCR system, only the confined rectangle images are input into OCR system.,Wearable Robot Intelligent Glasses OCR识别结果识别结果第107页n 视频信息的处理文字提取n OCROCR在线识别在线识别DEMO-DEMO-汉王汉王PDF OCRPDF OCR系统系统原文件原文件图像文件格式及其转换_静态图像的文件格式_图形变换格式(graphics interchange format, GIF) 由Compu-Serve公司于1987年为制定彩色图像传输协议而开发 的,它支持64000像素的图像,256到16M色的调色板GIF格式文件OCR识别结果识别结果第108页n 视频信息的处理文字提取n DemoChapter 2视频信息处理视频信息处理wear_new.avi第109页n 视频信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论