




已阅读5页,还剩117页未读, 继续免费阅读
(教育技术学专业论文)图像元数据特征提取及其在检索中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 网络资源的日益膨胀,使得人们对资源的使用、管理产生更迫切的要求。面 对众多的异构系统不同格式的资源,元数据标准化建设应运而生。 在教育领域对教学资源的建设同样也产生出多种元数据标准。图像是教学资 源建设中的重要组成部分。但到现在对图像元数据标准的建设仍是基于文本,对 图像做外围的标注。 、 做基于内容的图像应用和做元数据标准建设目前在两条道上向前奔跑,没有 相交,我们本文所做的工作恰恰就是使这两条道在某个点上相交,这个点我们定 义它为图像元数据。 元数据的概念我们是借鉴元数据标准建设中的概念,而本文的图像则不是通 常意义上的图像概念,它是特指基于内容意义上的图像。在图像特征提取上我们 应用的基于内容的视觉信息检索技术,在图像表示上,我们则借鉴元数据标准建 设中描述规范,描述语言和描述方法。 我们在本文中所做的工作如下: ( 1 ) 在图像颜色元数据特征提取方面 颜色直方图和h s i 颜色直方图; ( 2 ) 在图像纹理元数据特征提取方面 矩阵,并提出五个纹理特征量。 ( 3 ) 在图像形状元数据特征提取方面 基础上提取图像的七阶矩。 我们分别提取r g b 颜色直方图、h s v 我们首先构造四个方向上的灰度共生 我们对图像进行三次小波变换,在此 ( 4 ) 在图像特征描述方面:我们给出图像特征描述符和图像描述模型,使用 x m l 和r d f 语言对图像进行描述。 ( 5 ) 最后我们给出实验原型系统,对图像分别从颜色、纹理和形状三个方面 进行检索,并给出检索结果以及对检索结果的分析。 本文关于基于内容图像元数据检索的结论有: ( 1 ) 关于颜色空间 对于一般的直方图的使用,l a b 空间的检索和h s v 空间的检索结果没有什么 大的差异。 r g b 省去了空间转换的消耗,检索速度最快;但不符合人的视觉特征,检索 效果最差。在对颜色的感知、分析和鉴别中,h s v 色彩空间模型最好。 ( 2 ) 关于直方图 分块直方图统计,既发挥了颜色的空间索引技术,又对颜色进行了聚类,适 合色块比较分明且较集中的图像的检索,查全率和查准率都较高。 对于颜色较杂且分布均匀的图像,分块非主色与分块主色检索效率不相上 下,分块主色不占优势。 分块的大小对检索起着重要的作用,这需要用户在检索过程中根据需要不断 调整分块大小,以获得更高的检索效率。 ( 3 ) 关于纹理不同方向 对于简单图像( 例如方形s q u a r e ) 检索效果差异不大,查全率可高达1 0 0 , 查准率在5 0 :对于复杂图像则需要根据具体实验找出其适合方向。例如树叶在 0 度和9 0 度匹配最好,手掌在0 度和1 3 5 度匹配最好。 ( 4 ) 关于同一方向不同纹理 纹理越有规律,或纹理越简单,检索效果越好。整体匹配率在1 0 0 一3 3 之 间。 ( 5 ) 关于小波变换次数 对于简单图( 例如方形) ,一次小波变换效果最好;对于复杂图( 例如树叶) 三次小波要好于二次和一次小波变换:而对于含杂质比较多的图( 如手掌) ,二 次和三次小波变换在不同情况下各有好坏,但都比一次小波检索效果好。 ( 6 ) 关于滤波系数 , 不同图像对于滤波系数的选择应根据具体实验而定,没有找出明显规律。 总之,本文在基于内容图像资源建设方面做了一些新的研究与探索。 关键词:图像元数据,元数据标准,特征提取,教学资源检索 a b s t r a c t a sn e t w o r kr e s o u r c ei se x p a n d i n gt o d a y , t h er e q u i r e m e n to fr e s o u r c ea p p l i c a t i o n a n dm a n a g e m e n ti si m m i n e n t t od e a lw i t hd i f f e r e n ts t r u c t u r es y s t e ma n dv a r i o u st y p e o fr e s o u r c e ,t h ec o n s t r u c t i o no f m e t a d a t as t a n d a r di se m e r g i n ga st h et i m e sr e q u i r e i nt h ef i e l do fe d u c a t i o n ,w i t hr e g a r dt oc o n s t r u c t i o no fe d u c a t i o n a lr e s o u r c e , s e v e r a lt y p e so fm e t a d a t as t a n d a r dh a v eb e e ns e tu pt o o t h ei m a g ei sc r u c i a lp a r to f c o n s t r u c t i o no fe d u c a t i o n a lr e s o u r c e ,b u tu pt on o wt h ec o n s t r u c t i o no fi t sm e t a d a t a s t a n d a r di ss t i l ib a s e do nt e x tr e t r i e v a la ti t se x t e r i o r t h e r ei sn oi n t e r s e c t i o nb e t w e e nt h ei m a g ea p p l i c a t i o no fc o n t e n tb a s e da n dt h e m e t a d a t as t a n d a r dc o n s t r u c t i o n ,w h i c hc u r r e n t l yr e p r e s e n tt w od i f f e r e n tw a yo f d e v e l o p m e n t t h ep a p e rh e r e i ni st r y i n gt o f i n dt h ec o n n e c t i o np o i n tb e t w e e nt h e a f o r e s a i di n d e p e n d e n tm e t h o d s ,w ed e f i n ei ta si m a g em e t a d a t a t h ed e f i n i t i o no fm e t a d a t ai sr e f e r r e df r o mt h ec o n c e p to fm e t a d a t as t a n d a r d c o n s t r u c t i o n t h ec o n c e p to fi m a g ei sd i f f e r e n t i a t e df r o mm e a n i n go ft h et r a d i t i o n a l i m a g e ,w es p e c i a l l yc a l li tt h ei m a g eo fc o n t e n t b a s e d i nt h ea s p e c to fi m a g ef e a t u r e e x t r a c t e d ,t h et e c h n i q u eo fc o n t e n t b a s e dv i s u a li n f o r m a t i o nr e t r i e v a li su s u a l l y i m p l e m e n t e d ,i nt e r m so fi m a g ed e f i n e d ,i ti sr e f e r r e df r o md e s c r i p t i o ns p e c i f i c a t i o n , l a n g u a g ea n dm e t h o do fc o n s t r u c t i o no f m e t a d a t as t a n d a r d t h em a i np o i n t so f t h i sp a p e rm a n a g et os o l v ea r es u m m a r i z e da sf o l l o w s : 1 f o rm e t a d a t af e a t u r ee x t r a c t e do fi m a g ec o l o r , r g bc o l o rh i s t o g r a m ,h s vc o l o r h i s t o g r a ma n dh s ic o l o rh i s t o g r a ma r ee x t r a c t e dr e s p e c t i v e l y ; 2 f o rm e t a d a t af e a t u r ee x t r a c t e do fi m a g et e x t u r e ,w es e tu pf o u r - d i r e c t i o ng r a y s c a l ec o o c c u r r e n c em a t r i xa n dt h e ne x t r a c tf i v ef e a t u r ev e c t o r s ; 3 f o rm e t a d a t af e a t u r ee x t r a c t e do fi m a g es h a p e ,w ed e a lt h ei m a g ew i t hw a v e l e t s f o rt r i p l et i m e s a n dt h e ne x t r a c ts e v e n t ho r d e rm a t r i xo f i m a g e ; 4 f o ri m a g ef e a t u r ed e s c r i p t i o n ;f i r s t l yw es e t u pam o d e lo fi m a g ef e a t u r e s d e s c r i p t o r sa n di m a g ed e s c r i p t i o n u s i n gx m l & r d fl a n g u a g e st od e s c r i b et h e i m a g e ,a n dt h e nw es e tu pa t r i a lm o d e l i n gs y s t e ma n df i n a l l yt or e t r i e v a li m a g e b a s e do nc o l o r ,t e x t u r ea n ds h a p e 5 i nt h ee n d ,w eg i v ei m a g er e t r i e v a lr e s u l ta n da n a l y z ei t t h ec o n c l u s i o n st oc o n t e n t b a s e di m a g em e t a d a t ar e t r i e v a lo ft h ep a p e ra r ed e r i v e da s 4 f o l l o w s 1 c o l o rm o d e l f o ra p p l i c a t i o no fg e n e r a lh i s t o g r a m ,t h e r ei s n os i g n i f i c a n td i f f e r e n c eo f r e t r i e v a lr e s u l tb e t w e e nl a bm o d e la n dh s vm o d e l t h er g bi st h ef a s t e s tr e t r i e v a lm o d e lb e c a u s eo fn od e p l e t i o nd u r i n gt h em o d e l t r a n s f o r m e d b u ti t sn o ts u i tf o rh a m a nv i s i o n ,a sar e s u l ti t i si n e f f e c t i v ef o rr e t r i e v a l t h eb e s tm o d e lt os e n s et h ec o l o r , m a k ea n a l y s i sa n dd i s c r i m i n a t i o ni sh s v 2 h i s t o g r a m t h ed i v i d i n gs q u a r eh i s t o g r a ma n a l y s i s ,w h i c hn o to n l yd e v e l o p st h er e t r i e v a l t e c h n i q u eo f c o l o rm o d e lb u ta l s om a k e sc l u s t e rt ot h ec o l o r , i ss u i t a b l ef o rt h ei m a g e r e t r i e v a lo fv e r yd i s t i n c tc o l o rc o n c e n t r a t i o na n da b l et og e th i g h e ro fr e c a l la n d p r e c i s i o n f o rt h ei m a g ew i t hd i s o r d e r l ya n du n s y s t e m a t i cc o l o r , t h er e t r i e v a le f f e c t i v e n e s s i sn o to n es u p e r i o rt ot h eo t h e rb e t w e e nt h ed i v i d i n gs q u a r em a i nc o l o ra n dn o n m a i n c o l o r t h es i z eo fd i v i d i n gs q u a r et or e t r i e v a li sv e r yi m p o r t a n t ,s ot h a tt h eu s e rn e e dt o a d j u s ti t ss i z ed u r i n gr e t r i e v a lt oo b t a i nt h eh i g h e re f f i c i e n c y 3 t e x t u r ei nd i f i e r e n c ed i r e c t i o n s f o rt h es i m p l ei m a g e ( i e s q u a r e ) ,t h e r ei sn od i f f e r e n c ef o rr e t r i e v a li nf o u r d i r e c t i o n s ,i t sr e c a l lc a nb ea c h i e v e dt o1 0 0 ,a n dw i t h5 0 o fp r e c i s i o n ;f o r c o m p l e xi m a g e ,t h er i g h td i r e c t i o nh a st ob ef o u n db yt e s ti no r d e rt og e tb e t t e rm a c h r a t e ,f o ri n s t a n c et h eb e s ta n g l ef o rt r e el e a ft om a c hi s0d e g r e eo r9 0d e g r e ew h i l e p a l mi st h a to f od e g r e eo r1 3 5d e g r e e 4 o n ed i r e c t i o nw i t hv 撕e st e x t u r e t h em o r er e g u l a ro rs i m p l e rt e x t u r e ,t h eb e a e rr e t r i e v a le f f e c t t h em a r c hr a t e c a nb er e a c h e df r o m3 3 t o10 0 5 t i m e so f w a v e l e t st r a n s f o r m e d f o rt h es i m p l ei m a g e ( i e s q u a r e ) ,o n et i m eo fw a v e l e tt r a n s f o r m e dc a ng e tb e s t e f f e c t ;f o rt h ec o m p l e xi m a g e ( i e t r e el e a f ) ,t h r e et i m e so fw a v e l e tt r a n s f o r m e di s b e t t e rt h a nt h a to f o n eo rt w ot i m e s ;f o rd i s o r d e r l ya n du n s y s t e m a t i ci m a g e ( i e p a l m ) t w o t i m eo rt h r e e t i m eo fw a v e l e tt r a n s f o r m e de a c hh a si t ss t r o n gp o i n t ,b u tb o t ho f t h e ma r eb e t t e rt h a no n e t i m eo f t h a t 6 c o e f f i c i e n to f w a v ef i l t e r e d f r o mi m a g et oi m a g e ,t h ec o e f f i c i e n to fw a v ef i l t e r e dh a st ob eo b t a i n e db yt e s t , 5 t h e r ei sn oc e r t a i nr u l et of o l l o w i n g e n e r a l ,s o m en e ws t u d ya n dr e s e a r c h e s a r em a d ef o r i m a g er e s o u r c e c o n s t r u c t i o no fb a s e dc o n t e n ti nt h i sp a p e l k e y w o r d s :i m a g em e t a d a t a ,m e t a d a t as t a n d a r d ,f e a t u r ee x t r a c t i o n ,e d u c a t i o n a l r e s o u r c e sr e t r i e v a l 6 学位论文独创性声明 9 8 1 4 7 0 本人郑重声明: 1 、坚持以“求实、创新”的科学精神从事研究工作。 2 、本论文是我个人在导师指导下进行的研究工作和取得的研究 成果。 3 、本论文中除引文外,所有实验、数据和有关材料均是真实的。 4 、本沧文中除引文和致谢的内容外,不包含其他人或其它机构 已经发表或撰写过的研究成果。 5 、其他同志对奉研究所做的贡献均已在论文中作了声明并表示 了谢意。 作者签名: 日 期: 学位论文使用授权声明 丛皿易一 本人完全了解南京师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版;有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅;有权将学位论文的内容编入有关数据库进 行检索;有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定。 作者签名:纽 作者签名:础显 日期:趟! f 2 第一章教学图像元数据的由来:提出问题 本章首先按照历史发展逻辑对我国计算机辅助教学资源建没进行梳理,提 出两个观点,观点一:课件是单机时代的教学资源;观点二:学习对象是网络 时代的教学资源。进而得出结论:目前教学资源建设是元数据建设。这是本论 文立论的大背景。 在此基础上,提出图像是教学资源的重要组成部分,图像建设也是面临图 像元数据的建设。这是本文解决问题的目标。 在本章的结尾给出本论文研究内容、研究方法和研究工作的展开步骤。下 面具体说明。 引言 自1 9 5 8 年美国i b m 公司开发的计算机辅助教育系统1 以来,教学资源的建 设一直是计算机辅助教学的核心问题之一。从课件、积件到学习对象这些概念 的演变,从中我们不难看出资源建设的种种发展,进而提出面临现在的海量资 源我们该如何建设这个问题。要说明这个问题,我们首先界定单机时代和网络 时代计算机辅助教学的划分。 “美国在1 9 6 9 年开始互联网的研究,1 9 8 6 年出现t c p i p 协议,1 9 9 4 年全面 商业化。我国在1 9 9 4 年建成中国教育和科研网c e r n e t 。1 9 9 9 年中国与国际上 下一代互联网连接。”2 因此本文按1 9 9 9 年为界,将计算机辅助教育划分为单机 时代教育和网络时代教育。 单机时代计算机辅助教育:是指以单个计算机为主要媒介所进行的教育教 学活动。我们国家具体时间可定于1 9 9 9 年以前。此后,网络的大规模应用,网 络介入教育教学,则称之为网络时代的计算机辅助教育。在不同的阶段,教学 资源有不同的内涵,具体展述如下。 1 1 课件:单机时代的教学资源 1 1 1 课件定义 在单机时代计算机辅助教学的资源主要是课件。我们看当时对课件的一个 代表性定义,即: 何克抗,计算机辅助教育,北京:高等教育出版社1 9 9 7 ,p 5 。 2 中国下一代互联网正式开通,h t t p :w w w e d u c n 2 0 0 5 0 5 0 9 3 1 3 6 6 1 5 s h t m l “课件是在一定的学习理论指导下,根据教学目标的要求,由教学内容和 教学决策组成的计算机软件。”3 这个定义提出了以下观点: 课件就是一种教学软件; 课件呈现的是包含教学理论和教学决策的教学内容; 这种教学内容是为了完成一定的教学目标。 按照这样的分解,课件扮演的是现实中的老师,至少是老师的知识教学这一角 色。 i i 2 课件制作 课件的制作流程: 从开始计划总体设计框面设计编写脚本制作课件一 一运行修正评价结束,这期间需要若干次反复循环。涉及到的人 员有:程序设计者,学科老师,教学专家。 实例:国家“九五”重点科技攻关项目:“计算机辅助教学软件研制开发与应用”( 简 称9 6 7 5 0 项目) ,其子课题初中语文新诗赏析,由华南师范大学教育技术研究所主持。 其内容包括初中语文课本( 人民教育出版社) 第一册至第六册中的九首新诗和课外参考 书中两首有代表性的新诗,共十一首。 涉及到的开发研制工作人员有广东省肇庆中学、广州4 7 中、南海桂江中学、桃园中学、 汕头林百欣中学、聿怀中学等学校的部分教师和华南师范大学电化教育系9 5 级部分本科学 生。4 综上,课件制作者在课件制作时须考虑以下诸方面: ( 1 ) 学习者:包括分析学习需求、学习者的特点等; ( 2 ) 教学内容的总体安排:包括教学目标的确定,教学内容的选择,以及相 互之间的关系; ( 3 ) 教学中具体单元、知识的安排:包括教学中的重点、难点的表现方式及 相应的教学方法: ( 4 ) 教学媒体的选择:包括如何选择、安排并运用各种素材、媒体,以及各 种媒体的使用等。 3 萧树滋,庄为其,冯秀琪,电化教育概论,北京:北京师范大学出版社,1 9 8 8 ,p 3 1 6 。 4 谢幼如,柯清超初中语文新诗赏析,多媒体教学软件的研制与应用,电化教育研究, 1 9 9 9 年第2 期( 总第7 6 期) 。 ( 5 ) 各种教学理论,如斯金纳( s k i n n e r ) 的程序式教学法,布鲁纳( b r u n e i ) 的认知式学习方法,以及后来提出的各种建构主义理论等。 从上述分析,我们发现这一时期的教学资源建设基本就是生产课件,其设 计思想按照功能结构化设计,最终结果是有固定程序的、定型情节的、模式化 的、封闭的、整体型的内容。这种大而全的按功能结构的课件其前提假定是: 各种教学活动可以纳入统一模式,按照同一界面同一策略同一内容进行教学。 1 2 学习对象:网络时代的教学资源 1 2 1 积件产生背景 ( 1 ) 问题的提出 功能结构化的程序设计方法远远不能满足人们生产学习的需要。“本应是教 师在教学活动中的主观能动的创造天地,课件却在事先的教学设计中“确定” 了。课件设计者取代了教师的地位,教师变成了计算机软件的“用户”。”5 于是顺应产生了积件( i n t e g r a b l ew a r e ) 思想,其核心问题是:整体的课 件是否可以打碎? 课件是否可以象积木一样,按照教学需要自己组装? ( 2 ) 问题解决的基础 资源建设一直离不开科学技术的发展,尤其是计算机软件和硬件以及多媒 体网络等技术的发展。 多媒体和网络的兴起,给资源建设提供了物质基础。多媒体技术的不断发 展,音频视频图像文字的分割与融合,产生了多种媒体资源,在教学资源建设 上也相应产生了各种媒体资源库的建设。网络的建立,媒体压缩与提取技术的 提高,使得资源的获取与利用方便而快捷,人们对软件的建设提出更多更高的 要求。 与此同时,软件设计也由功能结构设计向面向对象设计等思想转变。面向 对象设计是一种从事物角度而不是从操作或功能角度来思考问题的运行策略。 运行系统是由一组彼此交互的对象组成,这些对象是独立的,可以被当作一个 独立的实体去理解或修改。在整个软件开发过程中始终贯穿面向对象的策略, 包括面向对象的分析,面向对象的设计,面向对象的语言编程等。 5 黎加厚,从课件到积件:我国学校课堂计算机辅助教学的新发展,电化教育研究,1 9 9 7 年第3 、4 期。 ( 3 ) 小结 因此面向对象设计思想的前提是:真实世界是由事物组成,事物可以分解 成对象,真实世界和计算机系统的对象存在着清晰的映射。这种软件设计思想 投射在教学资源建设上,就是积件思想的提出。程序设计者只要设计出具体的 一个一个像积木一样的对象,老师按照教学理论,教学策略和学习者特点,再 设计出自己的教学内容。但积件的提出仅仅是教学资源建设上的一个思想,也 可以说它是一个中间概念,它没有把思想落实到具体软件的设计上,我们要依 据怎样的方法,对对象进行操作? 积件在概念上似乎与软件设计理论上的组件 很类似,因此在其它领域并没有看到积件概念,同时在教学资源建设上它也被 学习对象概念所代替。 1 2 2 学习对象和学习对象元数据 面向对象软件设计思想在软件生产上是一次由功能向对象的巨大转变,但 从操作层面而言,对象的划分,对象粒度的控制则不是固定不居的。从便利和 效率角度出发,“重用”的特点在软件设计中尤为突出。软件应被视为一种可重 复利用的资源。在此基础上,软件建设提出组件设计。软件设计工程师m e y e r 给出组件五个抽象层次6 :功能的抽象;不规则的组合;数据的组合;聚集的组 合;系统的抽象。如果组件落实到数据层面,m e y e r 组件的五个抽象层次,从 数据层面可对应于元数据互操作的表现层、语义层、逻辑层、系统层等。与此 相关,在教学资源建设上,程序设计者设计出具体的像积木一样的单元( 积件) , 即被学习对象及学习对象元数据的研究所代替。我们首先给出学习对象的定义, 即限定我们研究对象的主体,在此基础上按照一定规则对学习对象进行划分, 包含哪些子对象( 元数据) ,该如何定义如何操作等( 元数据建设) 。这样我们 将面向对象思想和组件设计思想就可落实到具体操作层面,同样积件思想也就 落实到具体学习对象及学习对象元数据操作上。 ( 1 ) 学习对象 按照d a v i da w i l e y ”7 定义,学习对象( 1 e a r n i n go b j e c t ) 是“任何具有 重用特性并用来支持学习的数字化资源( a n yd i g i t a lr e s o u r c et h a tc a nb e 6 m e y e r ,b o nt oc o m p o n e n t s ,i e e ec o m p u t e r ,3 2 ( 1 ) ,1 9 9 9 ,p 1 3 9 1 4 0 ( c h 1 4 ) 7 d a v i da w i l e y ,u t a hs t a t eu n i v e r s i t y ,c o n n e c t i n gl e a r n i n go b j e c t st o i n s t r u c t i o n a ld e s i g nt h e o r y :ad e f i n i t i o n ,am e t a p h o r ,a n da t a x o n o m y , h t t p :w 哪r e u s a b i l i t y o r g r e a d c h a p t e r s w i l e yd o c r e u s e dt os u p p o r tl e a r n i n g ) 。 学习对象本质上仍是数字化学习资源,只是它尤其强调资源的可重用特性。 基于重用思想,我们在资源建设上,无论从设计、制作还是应用上,都有新的 特点。首先面对不同的应用对象,我们不可能设计一套能满足不同层次不同要 求的具有固定功能的教学软件,这种大而一功能全的软件只能被粒度很小的功 能相对专一的组件所代替。其次,网络的日益发展,每天生产的资源无数,面 对这庞大的资源,如何检索利用和管理,对资源建设落实到数据上,就产生了 元数据极其相关建设的研究。同样,对学习对象的建设其根本之一也就是学习 对象元数据的研究。 ( 2 ) 学习对象元数据 学习对象元数据( l e a r n i n go b j e c tm e t a d a t a ) 是关于学习对象数据的数据。 它通过描述学习对象的属性,使得用户能够获得学习对象的相关信息而不用直接 操作学习对象。基于这些属性,用户可以对学习对象进行描述( d e s c r i p t i o n ) 、 资源发现( r e s o u r c e sd i s c o v e r y ) 、认证( a u t h e n t i c a t i o n ) 、互操作 ( i n t e r o p e r a b i l i t y ) 、数据管理( d a t am a n a g e m e n t ) 、访问控制( r i g h t s m a n a g e m e n t ) 等。 ( 3 ) 小结 总之,网络时代下的教学资源建设,从积件的提出到学习对象的发展,再 到学习对象元数据的研究,是从观念上转变到具体数据建设的过程。积件和学 习对象所赋予教学资源的种种理想,如聚合、重用、互操作等,落实到资源建 设上,则是学习对象元数据的建设,学习对象元数据从数据层面使积件和学习 对象具体化,同时也是面向对象思想和软件组件设计思想在资源建设数据上的 映射,是网络环境下对学习发展的要求。 1 3 图像:教学资源的重要组成部分 1 3 1 图像资源建设背景 图像是信息的一种重要表现形式,是多媒体的重要组成,也是教学资源的 重要组成部分。 图像的本质为图像数字化。物理图像首先被划分为称作图像元素( 简称像 素) 的小区域,然后,在每个像素位置,图像的亮度被采样和量化,从而得到 图像对应点上表示其亮暗程度的一个整数值,即成为数字图像。数字图像处理 的信息大多是二维信息,处理信息量很大,如一幅2 5 6 2 5 6 低分辨率黑白图像, 要求约6 4 k b i t 的数据量,对高分辨率彩色5 1 2 5 1 2 图像,则要求7 6 8 k b i t 的 数据量;如果要处理3 0 帧秒的电视图像序列,则每秒要求5 0 0 k b i t 2 2 5 m b i t 数据量,因此图像对计算机的计算速度,存储容量等要求较高。图像本身特征 也与文本有很大的不同。首先对于一幅图像仁者见仁,图像内容包含多义性, 而文本语义比较明确。其次,图像的底层特征如颜色、纹理、形状等不包含语 义,人们对图像的理解比较主观,这从技术上对图像的操作要远难于对文本的 操作。 但随着通信技术、多媒体技术和网络技术的发展,w e b 上图像资源日益丰 富。根据9 2 0 0 4 年中国互联网络信息资源数量调查报告8 网页内容按照多媒 体形式分类情况,图像占9 8 9 1 ( 见表卜1 ) 。因此,互联网己成为巨大的数字 图像库,教学资源的建设也离不开对图像资源的建设。 图像 9 8 9 1 音频 0 7 5 视频 0 3 4 表1 - 1 网页内容按照多媒体形式分类情况 教学图像资源建设面对浩瀚的互联网,一个重要问题就是如何处理图像, 也即如何表示图像,如何运用图像等。单从网上图像文件格式而言,就有 g i f ( g r a p h i c si n t e r c h a n g ef o r m a t ) 文件,b m p ( b i t m a p ) 文件,t i f f ( t a gi m a g e f i l ef o r m a t ) 文件,t g a ( t a g g e dg r a p h i c s ) 文件,j p e g ( t h ej o i n tp h o t o g r a p h i c e x p e r t sg r o u p ) 文件,p n g ( p o r t a b l en e t w o r kg r a p h i c s ) 文件,w m f ( w i n d o w s m e t a f i l ef o r m a t ) 文件,e m f ( e n h a n c e dm e t a f i l e ) 文件,e p s ( e n c a p s u l a t e d p o s t s c r i p t ) 文,d x f ( a u t o d e s kd r a w i n ge x c h a n g ef o r m a t ) 文件和 s w f ( s h o c k w a v ef o r m a t ) 文件等。文件格式不同,图像编码方式,压缩方式,存 储方式及显示方式等都有区别。如果再涉及不同的系统,不同的硬件,则有更 加不同的组合。面对如此庞大的图像数据,对图像元数据的研究也就提到议事 日程h 。 6 1 3 2 图像元数据 对图像元数据的研究,也是一个逐步发展深入的过程。 ( 1 ) 基于文本的图像元数据研究 最初互联网上多媒体的信息,首先是文本信息,对图像数据的检索也是从文 本角度。就象上世纪六十年代起源九十年代发展的“信息检索( i r ,i n f o r m a t i o n r er r i e v a l ) ”9 现己成为文本信息检索的专用词汇,其研究任务己不仅仅限定于 索引和检索文档。而是包括检索模型、文档分类、系统架构、用户晃面、数据可 视化、过滤文档和自然语言分析等诸多方面。 同样,对图像元数据的研究首先也是基于文本。1 9 9 4 年都柏林核心元数据 ( d c m i ) 为网上数据的标识提出了1 5 个核心元素,包括对图像的标识。而这些 元元数据( m e t am e t ad a t a ) ,从资源内容、知识产权和外部属性三个方面对元 数据进行描述,即使对资源内容描述也只从题名、主题、描述、来源、语言、关 联和范围七个方面标识。 至于图像检索方式则是将图像按一定的规则分类,如按图像的来源、图像的 应用领域、图像的应用功能、图像的内容特点等分成不同的目录和子目录。每幅 图像归属一类或几类,用户按分类体系逐层逐级地分类浏览,查找自己感兴趣的 图像。如: 学科教学网“将教学资源首先按照学科分类,如语文,数学,化学,物理,历史,政治 英语,生物,地理,其它,再对学科如语文进行分类,分为语文课件,语文教案,语文试题 语文论文,视频资源。其中图像包括在视频资源中。 中国中小学教育圃k 1 2 ”则首先是按照素材和软件分类,在素材下将图像分为历史人物、 地理天体、海底生物、地图、国画、漫画、植物等2 1 个子类。 同样,即使专业图像网站如雅虎图片画廊“,也是按图片分类,共分为2 3 个予目录,在 子目录下再分下级子目录,如风景名胜子目录下再按地名分类,卡通漫画子目录下分欧美、 7 r i c a r d oby ,b e r t h i e rr ,m o d e mi n f o r m a t i o nr e t r i e v a l ,p e a r s o ne d u c a t i o n l i m it e d ,e n g l a n d ,1 9 9 9 。 h t t p :d u b l i n c o r eo r g d o c u m e n t s ,2 0 0 6 2 1 ”h t t p :w w w t o p c a i c o m h o m e d o w n i n d e xa s p 2 0 0 5 1 2 2 “h t t p :w w w k 1 2 c o mc n 2 0 0 5 1 2 2 “h t t p :i m a g e y a h o o c o m c n ,2 0 0 6 2 1 5 。 日韩和中国下一级子目录,等等。 国外的图像库g e t t ya a t “推出3 0 多个等级目录,从7 个方面描述图像的概念、 物理属性、类型和刊号,使用近1 3 3 ,0 0 0 个术语来描述艺术、艺术史、建筑以及其它文 化方面的对象。 小结 这种基于图像文本,按照一定规则对图像分类,然后对图像的名称、编号、 内容描述、图像大小、图像来源、作者、建档时间、存储地点等元元数据采用文 本或数据形式进行人工注释,建立图像索引数据库,再利用关键词进行检索管理, 在图像数据库不是很大的情况下是可行的,但对于w e b 6 p 海量的图像数据进行人 工分类是比较困难的。同时这种对图像的标识只是涉及图像的外部信息,对图像 本身的内容只是用图像描述来说明,这远不能反映图像本身的特征。其次,通过 关键词来描述图像,不易自动表达图像的语义信息。再次,人工注释标引速度慢, 文本标引结果也不能使用户对图像原始特征信息进行检索。 ( 2 ) 基于内容的图像元数据研究 限于基于文本图像研究的缺陷,基于图像内容的研究相应问世。图像的内容 包括什么? 哪些内容可用于研究? 目前尚没有统一的标准。 图像是平面上像素的集合,表示像素的数据是最基本的图像内容,但不能用 于检索,因为像素数据太多,而且与人的视觉感知没有直接的关系。图像的视觉 特征是在像素数据基础上提取的,与人的视觉感知相关,而且是人的视觉感知进 行高级抽象的基础,可用于基于图像直观形象的研究。图像的语义是图像表现的 内容含义,是在图像的视觉特征基础上结合人的先验知识推理得到的,而且随着 人的认识不同而有不同的含义。我们将图像的这些含义称作高层语义,可用于基 于图像概念和语义的研究。 基于内容的图像元数据研究具有如下特点:( 1 ) 对图像内容进行特征提取, 利用内容特征建立描述,进行匹配,进行检索;( 2 ) 基于内容的图像应用,是 一种近似匹配,如在图像检索中这种相似性判断是模糊的,而且通常情况下用户 的查询要求也是模糊的,并且检索结果容许有不相关的图像。同时,对内容的表 1 4 h t t p :v w g e t t y e d u r e s e a r c h c o n d u c t i n g _ r e s e a r c h b o c a b u l a r i e s a a t ,2 0 0 5 1 2 3 8 示不是一种精确描述,这种查询结果不断减少查询结果范围,直到定位要求目标。 ( 3 ) 基于内容图像应用系统具有很强的交互性,用户能够参与内容标注,表达 自己要求。( 4 ) 基于内容图像应用系统因为对内容自动标注,可以快速的处理 大型数据库。 总之,基于内容的图像研究,是指利用计算机对图像的内容进行自动分析, 获得必要的参数,建立元数据特征模型,著录规则,以及计算机应用时的语法规 定,标识图像,应用图像。至于基于内容的图像检索,是基于内容的图像研究的 一个方面,首先将图像的关键特征预先提取出来,建立图像特征索引数据库,然 后按用户提供的检索条件在图像特征索引数据库中查找匹配的图像记录,将查找 到的图像记录作为检索结果按一定的排序规则提供给用户,让用户浏览、选择, 通过超链接转到相应的网站或网页,做进一步地浏览或下载等。 1 4 图像元数据建设:提出问题 1 4 1 本文研究逻辑思路 都柏林核心元数据标准( d c m i ) 的建立,给资源建设提出一个范式,我们 可以按照这种范式对图像资源进行建设,但d c 元数据标准是建立在最普通的文 本描述基础上,给出1 5 个核心词汇远不能描述教学资源的复杂。于是,i e e e 提 出学习对象元数据( l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 七年级历史下册 第二单元 辽宋夏金元时期 民族关系发展和社会变化 第9课 宋代经济的发展教学设计 新人教版
- 早教报名协议书8篇
- 七年级语文上册 9从百草园到三味书屋第3课时教学设计 新人教版
- 电子商务发展动态
- 车辆安全隐患课件
- Unit6 Section A Grammar Focus3a-3d 教学设计 2024-2025学年人教版英语七年级上册
- 七年级体育与健康 基本体操2教学设计
- 直肠肛管疾病护理
- Unit 8 How are you (教学设计)-2023-2024学年译林版(三起)英语四年级下册
- 耳科手术一般护理
- 质量责任标识制度
- 《千姿百态的帽子》课件
- 学校食堂餐厨废弃物(泔水)处理记录
- 低压开关产品出厂检验报告
- 阀门检验计划(ITP)
- 实验室组织与管理 实验室认知
- 新版标准日本语课件-第一课
- 自来水管线漏水检测培训课件
- 星环大数据产品介绍
- 甘薯专项生产技术甘薯机械化生产
- 游戏点亮童年 自主创造快乐 论文
评论
0/150
提交评论