数字图书馆信息检索与存储技术_第1页
数字图书馆信息检索与存储技术_第2页
数字图书馆信息检索与存储技术_第3页
数字图书馆信息检索与存储技术_第4页
数字图书馆信息检索与存储技术_第5页
已阅读5页,还剩189页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章数字图书馆信息检索与存储技术第一节信息过滤技术第二节跨语言检索技术第三节基于内容的信息检索技术第四节数据压缩技术第五节数据的存储与备份提要第一节信息过滤技术

一、信息过滤的根本概念

网络信息过滤所谓信息过滤,将满足用户预先定义的过滤条件的文档过滤掉,不显示给用户,强调的是过滤,是取“非〞的过程。是文档与某种条件的相似度计算问题,通俗地讲就是匹配问题。信息检索与信息过滤区别示意图

信息检索与信息过滤的比较信息检索信息过滤目的找到需要的信息滤掉不要的信息对象静态文章集动态信息流持续性短期需求长期需求个性化非个性化个性化需求表达直接命令用户描述二、信息过滤系统的分类

按操作的主动性分

主动(Active)的IF系统

*主动搜集信息,并将相关信息发送给用户

*通常采用Push操作

*会造成信息过载问题,所以该系统要尽力建立精确的UserProfile。被动(Passive)的IF系统

*不负责为用户搜集信息

*通常用于邮件和新闻组信息过滤从过滤方法分

基于感知的过滤(Cognitivefiltering)基于社会的过滤(Sociologicalfiltering)基于感知的过滤也称为基于内容的过滤(Content-basedfiltering)是利用用户需求模板与信息的相似程度进行的过滤将文档内容和用户的Profile进行相似度计算基于社会的过滤也称为协同过滤(协作过滤,Collaborativefiltering〕是指分析用户兴趣,在用户群中找到与指定用户的兴趣相同或相似的用户,综合这些相同或相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。社会过滤常常使用用户建模(Usermodeling)及用户聚类(Userclustering)等技术。社会过滤一般不单独使用,常常和基于内容的过滤配合使用。按信息过滤的目分

推荐系统(recommendedsystem):是根据用户兴趣模型,自动搜集用户可能最感兴趣的信息,然后以用户指定的方式〔如电子邮件等〕将其传递至用户指定的地点。阻挡系统(blockingsystem):通过设置一定的条件限制用户获取某些信息,而其他信息可以利用。它主要用于过滤网络不良信息或者是不适合用户的信息。从获得用户兴趣的方法分

显式方法用户填写表格或用户提交关键词隐式方法记录用户的行为,包括:时间、次数、上下文、行为(保存、废弃、打印、浏览、点击)等。介于显式和隐式之间的方法文档空间方法:将用户标注过的文档作为正例,新来的文档和它们比较,选择相似度大的文档。显式和隐式相结合的方法开始定义一些默认的Profile,根据用户的过滤过程进行修改。按过滤操作的位置分

在信息源端过滤将用户的Profile发送给信息提供者,后者将和用户Profile匹配的信息回送给用户在过滤效劳器端过滤*信息提供者将信息发送给过滤效劳器*过滤效劳器根据用户的Profile将匹配信息发给用户在用户端过滤是一个局部过滤系统根据过滤的不同应用分类

专门过滤软件:又可以分为专用过滤软件和通用过滤软件两种。网络应用程序:有些网络应用程序如Web浏览器、搜索引擎、电子邮件、新闻组等附有过滤的功能,可以设置过滤不适宜的信息。其他过滤工具:如防火墙、代理效劳器等,可以通过对源地址、目标地址或端口号的限制,防止子网的不适宜的信息流出或子网外的不适宜的信息流入。三、信息过滤系统的组成

信息过滤系统的一般模型第二节跨语言检索第二节跨语言检索一跨语言信息检索相关技术数字图书馆的信息资源类型丰富、数量庞大,所使用的语言亦具多样性。信息资源语言的多样性和读者所掌握语言的有限性不可防止地给人们利用图书馆资源带来了语言障碍,人们对语言自动翻译的需求越发迫切。据统计,2002年10月在使用英文搜索引擎中提出语言翻译请求的几种主要语种有:西班牙文47.2%、法文17%、拉丁文7.8%、德文6.2%、日文4.7%、意大利文3.2%、俄文2.4%、中文2%。为了消除信息资源利用中的语言障碍,跨语言信息检索技术〔Cross-LanguageInformationRetrieval—CLIR〕已成为数字图书馆信息检索技术的重要组成局部。第二节跨语言检索一跨语言信息检索相关技术跨语言信息检索是指用户以一种语言提问,检索出另一种语言或多种语言描述的相关信息。目前研究最多的是跨语言文本信息检索和跨语言语音信息检索。在跨语言检索中,提问式所使用的语言通常称为源语言〔sourcelanguage〕,源语言一般是用户的母语;被检索文档所使用的语言称为目标语言〔targetlanguage〕,目标语言可以是用户不熟悉甚至完全陌生的语言。与跨语言检索相对应,提问式语言和文档语言相同的检索称为单语言检索〔monolingualretrieval〕。第二节跨语言检索一跨语言信息检索相关技术计算机信息检索技术检索系统利用自动标引技术对搜集的信息进行标引形成索引数据库,用户输入检索式后,计算机把检索式与数据库中标引项进行匹配,按检索式与标引项相关性大小降序输出检索结果。机器翻译技术机器翻译技术实质上是一种能够将一种语言的文本自动翻译成另一语言文本的计算机程序。机器翻译技术的核心是保持两种文本〔源语言文本和目标语言文本〕的语义对等(Google翻译)第二节跨语言检索二、跨语言信息检索的实现方法提问式翻译法基于词典的方法基于语料库的方法混合方法文献翻译法提问式-文献翻译法中间翻译法不翻译法提问词构造法专有名词音译法第二节跨语言检索二、跨语言信息检索的实现方法〔一〕提问式翻译法提问式翻译的过程是把源语言的提问式利用机器翻译技术翻译成目标语言提问式,再进行单语言检索。基于词典的方法制定了高度形式化的信息和规那么表示方法,并采用复杂特征集的方式来表示词汇的静态信息〔主词类、副词类、词汇本身的语义属性等〕和动态信息〔词汇对句中其他词汇的支配信息、词汇的上下文关联信息等〕。第二节跨语言检索二、跨语言信息检索的实现方法〔一〕提问式翻译法基于语料库的方法语料库〔corpus〕是将同一信息或同一主题的信息用两种或多种语言进行描述,并由人工或机器建立不同语言间的联系,在跨语言检索的翻译中可以参考这些联系信息进行提问或文档的翻译。语料库根据不同语言间对应层次的不同,可分为词汇对齐〔wordalignment〕、句子对齐〔sentencealignment〕、文献对齐〔documentalignment〕和非对齐〔noalignment〕几种。第二节跨语言检索二、跨语言信息检索的实现方法〔一〕提问式翻译法混合方法基于词典的方法对于不在词典中的词就无法翻译,通常是将该词不加翻译直接送入检索系统,此时这个词的检索功能就会很有限。另外,词汇的歧义性会参加不少错误的检索词。语料库方法中的语料库建设难度较大,规模通常也较有限、包含的主题不夠多,而且检索效果跟对齐的质量有密切的关系。第二节跨语言检索二、跨语言信息检索的实现方法〔二〕文献翻译法文献翻译方法不对提问式进行翻译,而是把数据库中用目标语言描述的文献翻译成与提问描述相一致的源语言形式,再通过提问式与信息库的匹配,完成检索过程。运用文献翻译方法进行跨语言检索,返回给用户的结果是用源语言描述的,用户能够方便地选择利用。提问层次的翻译与文献层次的翻译相比,其语境更加宽泛,进行歧义性分析所能利用的线索比较多,但是这种方法所使用的文本自动翻译技术的正确率目前还难以到达实用水平,而且将数据库中全部文献从目标语言翻译到源语言的工作量也是巨大的。第二节跨语言检索二、跨语言信息检索的实现方法〔三〕提问式-文献翻译法这一方法是将源语言提问式翻译成目标语言提问式,然后与目标语言描述的信息库进行匹配,检出相关信息,再把检索结果的全部或局部翻译成源语言描述的信息。检索结果的翻译一般选择局部翻译。第二节跨语言检索二、跨语言信息检索的实现方法〔四〕中间翻译法在跨语言检索中,解决语言障碍的根本方法是两种语言之间的翻译,然而所有的翻译方法都离不开机器翻译、双语词典、语料库等作为翻译的语言根底。但是,在跨语言检索中可能会碰到这样的情形:两种语言直接翻译的语言资源不存在。为此研究人员提出了一种利用中间语言或中枢语言进行翻译的方法:将源语言翻译成中间语言〔可以是一种或多种〕,然后再将中间语言翻译成目标语言〔利用多种中间语言时需要合并〕。第二节跨语言检索二、跨语言信息检索的实现方法〔五〕不翻译法潜在语义标引法〔LatentSemanticIndexing-LSI〕引入到跨语言检索中,如将英语词汇、法语词汇、英法双语文件映射到一个向量空间中,尽管这些术语是用不同语言描述的,但是可进行语义上的比较匹配,而无需翻译转换。第二节跨语言检索二、跨语言信息检索的实现方法〔六〕提问式构造法提问式构造法〔querystructuring〕主要有三种构造提问式的方法:基于同源词的构造法〔syn-basedstructuring〕、基于复合词的构造法〔compound-based〕、n元匹配法〔n-Grammatching〕。提问式构造方法的实质是利用同源词、复合词或n元匹配分析提问式中各个词的权重,只有一种或两种释义的词的权重最高,而有多种解释的词用同源词符、复合词符或n元匹配符连接以降低其权重。第二节跨语言检索二、跨语言信息检索的实现方法〔七〕专有名词音译法专有名词的翻译是难题。很多学者都相继提出机器音译〔machinetransliteration〕的方法来解决这个问题。音译方法根据处理的方向可以区分成正向音译〔forwardtransliteration〕与反向音译〔backwardtransliteration〕。当一个语言的专有名词因为沒有适当或是不容易以意译来表示时,可采用正向音译,将其音呈现出來。例如,意大利的城市Florence,中文就音译成“佛罗伦萨〞。反过来讲,当看到一个中文的音译人名“阿诺德•施瓦茨辛格〞,如果想要找出其原文ArnoldSchwarzenegger,就是反向音译。第二节跨语言检索三、跨语言信息检索的技术重点〔一〕翻译所需语言资源的研究在跨语言检索中,主要解决的问题是语言障碍,因此,两种或多种语言之间的翻译对于跨语言检索的性能有着重要的影响。而翻译必须以一定的语言资源作为根底,在跨语言检索中,常用的语言资源有手工编制双语词典〔manuallygeneratedbilingualdictionary〕、机器可读词典〔machine-readabledictionary〕、机器翻译〔machinetranslation〕、语料库〔corpus〕等。各种语言资源在跨语言检索中的使用不是孤立的,同时使用两种或多种语言资源会到达更好的效果。第二节跨语言检索三、跨语言信息检索的技术重点〔二〕翻译歧义性的消解在跨语言检索的翻译中最难解决的问题是翻译的歧义性〔ambigous〕,也就是说,对于一个单词,其译文可能有两种甚至是多种,出现二义性或多义性。如中文检索词“运动〞有如下的英文意义:sport、exercise、movement、motion、campaign、lobby等。而每一个英文词可能有一个以上的意义,例如“exercise〞有“aquestionorsetofquestionstobeansweredbyapupilforpractice〞,“theuseofpowerorright〞等意义。第二节跨语言检索三、跨语言信息检索的技术重点〔二〕翻译歧义性的消解解决语言歧义性的自动处理方法分为两大类:一类是在一定程度上模仿人类解决歧义性的方法,在处理过程中结合人工构造的语法学、词法学、句法学、语义学等方面的知识,力求给出文本非歧义的解析表达。如,利用一种词的共现技术〔Co-occurrence〕来消除词的多义性,以明确其含义。词的共现技术就是利用两个有一定关联的词共同出现在某一篇文献或者文献的某一个局部的这种关联来确定词义的技术。例如,country既有“国家〞含义,又有“乡村〞之义。如果country和music同时出现,那么它的含义很多情况下应该是“乡村〞之义;如果country和our同时出现的话,那么它的含义很多情况下应该是“国家〞之义。第二节跨语言检索三、跨语言信息检索的技术重点〔二〕翻译歧义性的消解在第二类方法中,重点主要放在词汇和短语等较低语言层次的歧义消解上,所依赖的工具主要是一些机读化的语言资源,如词典、主题词表、语料库等,而词典和语料库是目前消歧方法中应用较多的两种。应用语料库方法来消除固定搭配短语的歧义性。在翻译中固定搭配短语不能逐字翻译。第二节跨语言检索三、跨语言信息检索的技术重点〔三〕交互性系统在跨语言信息检索环境下,用户与检索系统的交互也是非常重要的。目前,有一些系统和搜索引擎提供了这种技术,如Keizai系统和Google。以Keizai系统为例,它所提供的交互手段主要是:在用户输入检索词之后,系统会显示一个翻译列表,这个列表上显示了该词所有可能的翻译形式,每种翻译形式的排列也是有规律的,即按照它的使用频率来排列。并且,每种翻译形式之后都用查询所用的语言作了解释,以便用户理解和选择。互联网的创始人TimBerners-Lee(贝纳斯-李)在2000年提出了语义Web的概念和体系结构。第六节基于内容的

多媒体信息检索技术一、概述基于文本的多媒体检索基于文本的多媒体信息检索方法〔TextBasedRetrieval,TBR)以关键词形式来反映多媒体物理特征和内容特征,并对抽取出的关键词进行著录或标引,建立类似于文本文献信息检索系统的索引数据库。基于文本的多媒体检索传统的图像检索方法通过图片的元数据或标引文字进行检索例:图像元数据宽度:210高度:172主题:玻璃瓶与草背景:淡灰内容:6个有草的玻璃瓶 3个瓶有红色液体 3个瓶有透明液体基于文本的多媒体检索的局限性标引文字主要靠人工输入。对大数据量的场合〔如Web资源、数字图书馆等〕应用困难标引文字无法精确完整的刻画多媒体内容生成或利用元数据的过程实质是在两种差异很大的媒体间的翻译过程,有很大的随意性和信息损失(两次).基于内容的检索(ContentBasedRetrieval—CBR)是对媒体对象的内容和上下文语义环境所进行的检索。也就是从媒体数据中提取特定的信息线索,如图象中的颜色、纹理、形状,视频中的镜头、场景、镜头的运动,声音中的音高、响度、音色等,然后根据这些线索从大量存储在数据库的媒体中进行查找,检索出具有相似特征的媒体数据。二、基于内容的多媒体信息检索的系统结构、特点〔一〕系统构成

系统由组织媒体输入的插入子系统、对媒体作特征提取的媒体处理子系统、储存插入时获得的特征和相应媒体数据的数据库、以及支持对该媒体的查询子系统等组成,同时需要相应的知识辅助支持特定领域的内容处理。媒体1数据库媒体n数据库查询格式化查询模块插入模块知识辅助模块媒体处理模块用户例如媒体新的媒体对象媒体特征媒体特征。。。。。。CBR系统体系结构CBR系统体系结构插入子系统

负责将媒体输入系统之中,同时根据需要为用户提供一种工具,以全自动或半自动〔即用户局部干预〕的方式对媒体进行分割或节段化,标识出需要的对象或内容关键点,以便有针对性的对目标进行特征提取。特征提取子系统

对用户或系统标明的媒体对象进行特征提取处理。在提取特征时,往往需要知识处理模块的辅助,由知识库提供有关的领域知识。数据库

媒体数据和插入时得到的特征数据分别存入媒体数据库和特征数据库。媒体库包含各种媒体数据,如图像、视频、音频、文本等。特征库包含这种媒体用户输入的特征和预处理自动提取的特征。查询子系统主要以例如查询的方式向用户提供检索接口。检索允许针对全局对象如整幅图像、视频镜头等,也允许针对其中的子对象以及任意组合形式来进行。检索返回的结果按相似程度进行排列,如有必要可以进一步的查询。〔二〕基于内容的检索过程基于内容的查询和检索过程是一个逐步求精的过程,其检索存在一个特征调整、重新匹配的循环过程。用户的查询说明例如一般性描述相似性匹配返回一组候选结果满意吗?结束修改查询说明从返回结果中选择相关例如NY图形〔三〕基于内容信息检索技术的特点:直接从内容中提取信息线索。特征提取和索引建立可由计算机自动实现,防止了人工描述的主观性,也大大减少了工作量。相似性检索。满足用户多层次的检索要求。大型数据库(集)的快速检索。例如查询(QuerybyExample)。人机交互式检索。三、图像信息检索基于内容的图像检索在20世纪70年代就开展了图像数据库的研究,方法是用人工输入图像的各种属性,建立图像的元数据库来支持查询。90年代初,国际上就开始了对基于内容的多媒体信息检索方面的研究。图象检索是对静止图象所进行的检索。基于内容的图象信息检索技术是把图象的可视特征如颜色、形状、纹理等作为图象的内容进行匹配、查找。

基于内容的检索通过与用户交互的方式,对查询结果逐步求精,检索经历了一个特征调整、重新匹配的循环过程。逐步筛选、求精特征调整生成查询要求输入图像返回结果图像相似性匹配返回初步结果基于内容的图像检索流程基于内容的图像检索系统的4种检索方式1〕利用图片样本检索〔QueryByExample〕可以由用户准备图片样本可以在图片库中浏览系统给出各类代表图像从系统中随机抽取2〕利用草图检索3〕利用图像特征模板检索如颜色特征模板,指定各种颜色的比率等。4〕以上方式结合先用草图或指定特征获取图片样本,再用图片样本检索。基于内容的图像检索系统的4种检索方式基于内容的图像检索

内容匹配的主要策略

数字图像是由像素组成的,但是像素不能直接表达图像的内容,因而需要从中提取颜色、纹理、形状等特征,作为视觉特征的表示,支持信息检索。内容匹配的主要策略:颜色特征匹配纹理特征匹配形状特征匹配基于内容的信息检索技术p.170-178图像信息检索颜色形状纹理形状平均颜色色彩组合纹理图像检索颜色特征匹配

颜色是一幅图像最直观、最明显的特征,因此,许多应用系统把颜色作为图像的检索特性。(如对应天空的蓝色和对应白云的白色)常用的用于检索的颜色特征有颜色直方图、颜色矩、颜色相干矢量等。颜色直方图〔ColorHistogram〕指用横轴表示颜色等级,用纵轴表示具有该颜色等级的像素在整幅图像中所占的比例。

颜色特征匹配

颜色直方图

nkhk=(k=0,1,……,L-1)N其中nk为图像中颜色取值为k的像素个数,N为像素总数,L为可能的颜色取值范围。颜色特征匹配

颜色相似度匹配算法1.直方图相交法2.欧式距离法……颜色特征匹配

直方图相交法

颜色特征匹配

欧式距离法纹理特征匹配类似于布纹、草地、砖墙等重复性结构的图像称为纹理图像。虽然图像的纹理特征在局部区域内可能没有规那么,但在整体上却往往呈现出一定的规律性。图片纹理特征匹配纹理表示有很多方法,如Tamura〔田村〕表示法、联合概率矩阵表示、小波表示、……。Tamura纹理特征是基于人对纹理的视觉感知的生理研究而设计的,该特征包括粗糙度、比照度、方向性等。纹理特征匹配

Tamura纹理表示法

粗糙度(contrast,粗细度〕测量纹理的间隔尺寸/粒度。纹理特征匹配

Tamura纹理表示法

比照度反映纹理的清晰度。纹理特征匹配

Tamura纹理表示法

方向反映实体是否有规那么的方向性。是一个全局的纹理特征,它描述纹理是如何沿某些方向散布或集中的。纹理特征匹配举例1:从1万张图片中检索的结果纹理特征匹配举例2:从1万张图片中检索的结果形状特征匹配

形状是刻划物体的本质特征之一,可以针对面积

(可用象素点的个数计算)、环形性

(即周长*周长/面积,周长也用象素点的个数表示)、主轴方向、偏心率、圆形率等形状特征进行匹配。形状特征匹配形状检索主要有两种方法1〕针对图像边缘轮廓线进行的检索2〕针对图形矢量特征进行的检索描述方法描述方法傅里叶描述子:利用傅里叶变换的边界作为形状特征不变矩描述子:利用基于区域的矩作为形状特征…………图片图片四、视频信息检索基于内容的视频检索〔Content-BasedVideoRetieval,CBVR〕〔一〕视频数据结构

由于人眼的视觉惰性作用,在亮度信号消失后,图像仍然可以保持1/30~1/20秒的时间,动态图像就是根据这个特性而产生的。从物理意义看,任何动态的图像都是多幅连续的图像序列构成的,它们在沿时间轴,每一幅图像保持一个时间,顺序地以1/30~1/24秒的间隔更换,连续播放,就形成了动态的图像。幕帧1,帧2,……帧k视频数据结构场景1场景2场景3场景n镜头1镜头2镜头n视频数据

结构

〔二〕视频运动

1、视频镜头的运动:在视频的拍摄过程中,摄像头可以按不同的方式运动,以到达特定的拍摄效果。由于摄像头操作而引起的镜头运动主要有以下几种形式:摇镜头:摄像头的位置不变,以云台为轴心,上下或左右转动拍摄方位。转镜头:以对象为中心,摄像头从不同的位置角度拍摄。移动镜头:摄像头的位置跟着拍摄对象移动,但不旋转角度。移动又可分为水平移动和垂直移动。推拉镜头:推镜头,即从远处开始逐渐推近到拍摄对象。拉镜头,即从近处开始逐渐拍成全景。视频运动

〔2〕视频对象的运动出现:一个对象出现于镜头。消失:一个对象从镜头中消失。进入:一个运动的对象出现于镜头。退出:一个运动的对象从镜头中离去。运动:一个原本静止的对象开始运动。停止:一个原本运动的对象停了下来。〔三〕基于内容的视频检索系统基于内容的视频索引和检索通常有两种方法:一种方法是把视频信息看作是独立的帧或图像的集合,利用图像索引和检索方法进行视频索引和检索。这种方法的缺点是忽略了视频帧之间的时间关系,而且需要处理大量的图像。另一种方法是把视频序列分成假设干组镜头,索引和检索是针对这些组镜头的有代表性的关键帧而进行的。该方法被称为基于镜头的视频索引和检索。视频流视频分割镜头关键帧提取关键帧集合视频检索/浏览聚类/索引运动特征视觉特征〔颜色、纹理、形状等〕特征提取特征提取基于内容的视频检索系统基于内容的视频检索系统

视频数据的处理过程

首先要进行视频结构分析,将视频流通过镜头边界检测分割为镜头,并在镜头内选择关键帧,这是实现一个高效的基于内容的视频检索系统的根底和关键。然后提取镜头的运动特征和关键帧中的视觉特征,作为一种检索机制存入视频数据库。最后根据用户提交的查询按照一定特征进行视频检索,将检索结果按相似性程度交给用户。〔四〕视频分割〔视频镜头边缘检测〕镜头的边缘检测是将原始连续视频流分割成长短不一的镜头单元,对后续视频分析处理提供根底。当视频情节内容发生变化时,会出现镜头切换。镜头的切换有两种:突变和渐变。突变是指前一个镜头的尾帧被下一个镜头的首帧快速代替;渐变是指前一个镜头的尾帧缓慢地被下一个镜头的首帧代替,其中包括淡入,淡出,隐现,滑入,溶合,擦洗等。视频镜头分割技术目前视频镜头分割技术主要根据镜头在发生切换时其视频数据所反映的变化来分割。一般而言,同一个镜头内的各帧之间差异较小,它们之间的特征差值总会限定在某个阈值内。而不同镜头的帧间差异较大。镜头分割方法很多,根本思想大体一致:从相邻帧分别提取适宜的特征,形成特征向量,然后比较这些特征之间的差异,假设特征之间的差值超过了事先设定的阈值,那么认为镜头之间出现了镜头转换,应该进行镜头切分。否那么,继续处理其他帧。视频镜头分割技术(1)模板匹配法模板匹配法以两帧对应像素差的绝对值之和作为帧间差,这种方法比较前后两帧对应像素之间的变化,如果变化超出一个预先定义的阈值,那么认为有镜头的切换。其主要缺点是对噪声和镜头或物体运动非常敏感,因为它严格地局限于像素的位置。噪声和物体运动都会使帧间差增大,从而导致错误的场景转换检测。视频镜头分割技术(2)直方图法直方图法是使用得最多的计算帧间差的方法,它不考虑像素的位置信息,而使用像素亮度和色彩的统计值,因而抗噪声能力要比模板匹配强。其缺点是两幅图像可能内容完全不同但直方图相似,也容易造成误识别。视频镜头分割技术(3)基于边缘的方法它的根本思想是“在发生镜头转换时,新出现的边缘应远离旧边缘的位置,同样旧边缘消失的位置应远离新边缘的位置〞。首先提取前后两帧视频图像的边缘图,计算两帧视频图像之间的差异。如果差异值大于某个预先设定的阈值,那么认为出现了镜头的切换。视频镜头分割技术(4)基于模型的方法基于模型的方法利用对镜头编辑的先验知识对各种镜头切换建立一定的数学模型,自顶向下地进行镜头切换的检测,因此基于模型的方法对镜头渐变的检测往往能取得好的效果。它的缺点是需要对每种切换类型建立模型,而且建模过程比较复杂。〔五〕关键帧选取

视频数据中的很多图像帧之间都存在时间和空间的冗余度。如果能从视频数据中找出一些有代表性的帧(即关键帧),使用这些少量的帧来代表冗长的视频数据流,既简洁,又方便视频检索。关键帧是用来描述一个镜头的关键图像,它反映镜头的主要内容。关键帧选取关键帧的选取一方面必须能够反映镜头中的主要事件,其描述应尽可能地准确、完全;另一方面数据量应尽量地小,同时计算不宜太复杂,以方便管理。选取关键帧的方法比较经典的是帧平均法和直方图平均法。帧平均法是从镜头中取所有帧在某个位置上像素值的平均值,然后将镜头中该点位置的像素值最接近平均值的帧作为关键帧。直方图平均法是将镜头中所有帧的统计直方图取平均,然后选择与该直方图最接近的帧作为关键帧。〔六〕特征提取视频分割成镜头后就要对各个镜头进行特征提取,得到一个尽可能充分反映镜头内容的特征空间,这个特征空间将作为视频聚类和检索的依据。特征提取视频数据的特征分为静态特征和动态特征。静态特征提取:主要针对关键帧而言,一般采用通常的静态图像特征提取方法,包括提取颜色、纹理和形状特征等。动态特征提取:视频的运动特征主要包括摄像机操作以及主体目标的运动。〔七〕视频索引/聚类

1、基于特征的索引:根据关键特征,建立索引。关键特征可以是颜色、纹理、运动对象等。2、基于对象的索引:就是从视频流中分割出所有对象,并利用每个对象的信息进行索引。3、元特征索引:元特征是指有关视频数据的一些根本特征,如视频的出品人或公司信息、导演、出品日期、视频文件长度、原始载体、版权认证号、类别(剧情类、非剧情类等)、压缩方式(如MPEG4等)、制式(PAL/NTSC等),甚至演员等。4、基于注释的索引:所谓视频注释,是指用一些描述性的信息(如文字、声音或图形)来表述所指向的视频段。〔八〕视频检索(1)基于关键帧检索视频被抽象为关键帧后,搜索就变成按照某种相似度来检索数据库中与查询描述相似的关键帧。通常使用的查询方法是通过目标特征说明(直接)的查询和通过可视实例(例如)的查询。如果检索到关键帧.用户就可以利用播放来观看它所代表的视频片断。(2)基于运动检索可以利用摄像机操作的表示来查询镜头,可以利用运动方向和幅度特征来检索运动的主体目标。五、音频信息检索音频检索和语音识别的区别

语音识别指从语音信号中识别出字、单词和短语等根本元素,然后对这些语言符号进行分析和理解,提取里面所蕴含的语义。音频检索是要对全部音频信号,既包括语音信号也包括非语音信号,进行处理、分析和理解以实现用户所需的内容检索。语音识别技术可以应用到音频检索中满足一局部语音相关的检索需求。仅仅对语音信号进行处理不能解决音频检索的所有问题。音频可以分为三种类型:

〔1〕波形声音。对模拟声音数字化而得到的数字音频信号。它可以代表语音、音乐、自然界和合成的声响。〔2〕语音。具有字词、语法等语素,是一种高度抽象的概念交流媒体。语音经过识别可以转换为文本,文本是语音的一种脚本形式。〔3〕音乐。具有节奏、旋律或和声等要素,是人声或/和乐器音响等配合所构成的一种声音。音乐可以用乐谱来表示。基于内容的音频检索方法

主观描述查询提交一个语义描述,然后把包含有这些语义标注音频例子或歌曲寻找出来,反响给用户。用户也可以通过描述音频的主观感,来说明其所要检索的音频的主观(感觉)特性。基于内容的音频检索方法

例如查询选择一个声音例子表达查询要求,查找出该声音在某些特征方面相似的所有声音。基于内容的音频检索方法

拟声查询指用户发出与要查找的声音相似的声音来表达检索要求。中科院声学所中科信利实验室的最新研究成果“音频检索系统〞:在国际音乐处理学术界最高赛事———国际音乐信息检索评测比赛(MIREX)中获哼唱检索评测第一名。基于内容的音频检索方法

表格查询〔直喻查询〕

用户选择一些音频的声学物理特征并且给出特征值的模糊范围来描述其检索要求。从音频信息类型上划分,应用最多的音频信息检索包括语音检索和音乐检索。语音检索1、利用大词汇语音识别技术进行检索

这种方法是利用自动语音识别(ASR)技术把语音转换为文本,从而可以采用文本检索方法进行检索.2、基于子词单元进行检索

当语音识别系统处理各方面无限制主题的大范围语音资料时,识别性能会变差,尤其是当一些专业的词汇(例如人名,地点)不在系统的词库里时。一种变通的方法是利用子词(sub-word)索引单元。在ETHZurich的一个研究小组选择音节形式的单元作为索引(即VCV,元音-辅音-元音子词单元)。例如,“information〞这个词的VCV特征是“info〞、“orma〞和“atio〞。当执行查询时,用户的查询首先被分解为子词单元,然后这些单元的特征与库中预先计算好的特征进行匹配。3、基于关键词发现进行检索在无约束的语音中自动检测词或短语通常称为关键词发现(Keywordspotting).利用该技术,识别或标记出长段语音录音或音轨中反映重要时间或用户感兴趣的事件,这些标记就可以用于检索.4、发音者识别发音者的识别或口音(voice)识别可设法找到发音者的身份或提取个人语音的有关信息。音乐检索

在检索系统中,音乐的类型可分为两种:结构化的音乐和基于样本的音乐。音乐的音高代表音符的上下。根本的音高符号在五线谱中用C、D、E、F、G、A、B七个字母命名,在简谱中对应的是1、2、3、4、5、6、7。从物理学角度来看,音高和声波的频率有着密切的关系,频率越高,那么音高越高。音长说明音符的长短。这是以全音符为根底划分的,其他各音符按与全音符的比值命名,如二分音符、四分音符就相当于全音符的二分之一、四分之一。音强是在听闻时感到的响度,也就是人们通常说的强弱或大、小、重、轻。它代表音符的强弱。比方在弹奏钢琴时,音强说明一个琴键按下的力度。1.结构化音乐的检索

结构化音乐和声音效果是由一系列指令或算法来表示的。最常见的结构化音乐是MIDI,它把音乐表示成大量的音符和控制指令。MIDI〔MusicInstrumentDigitalInterface,乐器数字接口〕文件格式是数字音乐/电子合成乐器的统一国际标准,它定义了计算机音乐程序、合成器及其他电子设备交换音乐信号的方式,还规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可用于为不同乐器创立数字声音的指令,可以模拟大提琴、小提琴、钢琴等常见乐器。在MIDI文件中,只包含产生某种声音的指令,这些指令包括使用什么MIDI设备的音色、声音的强弱、声音持续多长时间等,计算机将这些指令发送给声卡,声卡按照指令将声音合成出来,MIDI声音在重放时可以有不同的效果,这取决于音乐合成器的质量。2.基于样本的音乐检索基于特征集的音乐检索在这种音乐检索方法中,对每种声音(包括查询)抽取听觉特征集〔如强度、音高、亮度、带宽和谐音等〕,将其表示成一个矢量。通过计算查询音乐和每个存储音乐片段相应的特征矢量之间的近似度来计算它们的相似性。基于音高的音乐检索该方法的根本思想为:由于音乐的每个音符都是由它的音高表示的,因此一个音乐片段或局部可表示成一个序列或音高串。检索是以查询音乐和每个存储音乐片段相应的音高串之间的相似性为根底,音高跟踪和串相似测量是检索过程的关键。音高通常被定义为声音的根本频率。常用的查询请求形式是哼唱(humming)。第四节数据压缩技术第四节数据压缩技术

思考:1、数据为什么要压缩?2、数据为什么能压缩?3、数据压缩的方法有哪些?4、数据压缩的评价标准有哪些?5、平时使用的数据压缩软件有哪些?第四节数据压缩技术

一、概述所谓数据压缩,就是以最少的数码表示信源所发的信号,减少容纳给定消息集合或数据采集集合的信号空间。这里的信号空间即指被压缩对象,包括:〔1〕物理空间,如存储器、磁盘、磁带、光盘等数据存储介质;〔2〕时间区间,如传输给定消息集合所需要的时间;〔3〕电磁频谱区域,如为传输给定消息集合所需要的带宽。第四节数据压缩技术

一、概述数据压缩的目的,就是用尽可能少的数据来表达信息,从而节省传输和存储的开销。数据压缩的过程就是将输入数据流转变为另一种较小的数据流的过程。第四节数据压缩技术

一、概述衡量数据压缩技术好坏的指标主要有四个:〔1〕压缩比,即压缩前后所需的信息存储量之比;〔2〕恢复效果,对原始数据原貌的恢复程度;〔3〕速度,对数据进行压缩、解压缩的速度;〔4〕硬件开销,实现压缩所需的硬件条件。第四节数据压缩技术

二、数据为什么能够压缩

首先,数据中间常存在一些多余成分,既冗余度。Youarestudents.其次,数据中间尤其是相邻的数据之间,常存在着相关性。此外,人们在欣赏音像节目时,由于耳朵、眼睛对信号的时间变化和幅度变化的感受能力都有一定的极限。

第四节数据压缩技术三数据冗余的种类〔一〕信息熵冗余〔编码冗余〕〔二〕空间冗余〔三〕时间冗余〔四〕结构冗余〔五〕知识冗余〔六〕视觉冗余〔七〕其他冗余第四节数据压缩技术四数据压缩方法分类〔一〕无损压缩(文本、程序等)〔二〕有损压缩〔多媒体〕〔三〕混合压缩混合压缩是被广泛采用的方法,它吸收了各种无损压缩和有损压缩方法的长处,以求在压缩比、压缩效率及保真度之间取得最正确平衡。如静止图象压缩标准JPEG和活动图象压缩标准MPEG就是采用了混合编码的压缩方法。第四节数据压缩技术五数据压缩算法与相关标准〔一〕文本压缩技术霍夫曼〔Huffman〕编码算术编码字典压缩模型LZW编码游程编码霍夫曼编码霍夫曼〔Huffman〕编码是根据数据中各字符出现的相对频率进行编码,出现频率高的字符赋以较短的代码,而出现频率低的字符赋以较长的代码,从而保证了文件的大局部字符由较短的编码构成。霍夫曼编码构造范式Huffman编码大致可分为四步骤:统计每个要编码符号的频率;根据这些频率信息求出该符号在传统的Huffman编码树中的深度;分别统计出最大编码长度X到1的每个长度对应多少个符号,根据此信息从X个0开始以递增的顺序为每个符号进行编码;编码输出压缩信息,并保存按频率顺序排列的符号表,保存每组同样长度编码中的最前一个编码以及该组中的编码个数。算术编码算术编码是一种改进的霍夫曼编码,它不是为每个符号产生一个单独的代码,而是使整条信息公用一个代码,增加到信息上的每个符号都递增地修改代码,因而可进一步提高压缩比。算术编码是无损数据压缩效率最高的方法。词典编码词典编码主要利用数据本身包含许多重复的字符串的特性。例如:吃葡萄不吐葡萄皮,不吃葡萄倒吐葡萄皮。我们如果用一些简单的代号代替这些字符串,就可以实现压缩,实际上就是利用了信源符号之间的相关性。字符串与代号的对应表就是词典。实用的词典编码算法的核心就是如何动态地形成词典,以及如何选择输出格式以减小冗余。词典编码基于字典的压缩模型并不直接计算字符出现的概率,而是使用一本字典。其主要方法是将已经编码过的信息作为原字典,如果需要编码过的信息曾经出现过,就输出该字符串的出现位置及长度,否那么就输出一个新的字符串。字典算法可以在对数据统计特性一无所知的前提下,使压缩率接近统计特性时所能够到达的压缩率,并且运算快,易于实现。词典编码举例词典法的想法是企图查找正在压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串替代重复的局部,它的输出仅仅是指向早期出现过的字符串的“指针〞。LZW编码得名于Lempel–Ziv-Welch。是一种动态生成字典并编码的字典压缩模型。具有压缩效率高、实现简单的优点,是目前最常用的无损压缩方法之一。LZW编码使用字典库查找方案。它读入待压缩的数据,并与一个字典数据库中的字符串比照,如果有匹配的字符串,那么输出字符串在字典中的索引,否那么将字符串插入字典中。LZW编码传统LZW算法压缩的原理在于用字典中词条的编码代替被压缩数据中的字符串,因此字典中的词条越长越多,压缩率就越高。所以加大字典的容量可以提高压缩率。但字典的容量要受到计算机内存的限制,而且字典也存在被填满的可能,这样当字典不能再参加新词条后,过老的字典就不能保证高的压缩率。为了解决这个问题,在压缩时必须监视压缩率,当压缩率下降时,去除匹配概率较小的词条而保存匹配概率较大的词条。这样在重建字典的同时又可以提高压缩率。LZW编码LZW编码具有压缩效率高、实现简单的优点,是目前最常用的无损压缩方法之一。许多通用的文件压缩软件如ARJ,PKZIR,Z00,LHA等都采用了这种方法。另外,图形文件中的GIF和TIF格式文件也是按照这种方法压缩的。LZW编码算法流程初始化字典前缀S=空串C=从输入流中读一个字符把新串S+C加到字典中S=C输出S的编码输出结束标记是结尾标志吗?是S=S+CS+C在字典中吗?是输出S的编码游程编码〔RLE〕游程编码〔Run-LengthEncoding〕:它通过将信源中相同符号序列转换成一个计数字段再加上一个重复字符标志实现压缩。例如:RTTTTTTTTABBCDG被转换为:R#8TABBCDG,其中“#〞作为转义字符,说明其后所跟的字符表示长度。行程编码多用于黑白二值图像的压缩中。例如被转化为一系列黑串和白串长度的编码:81257。因为串长度并非等概率分布,所以一般要配合以统计编码〔Huffman编码〕。第四节数据压缩技术五数据压缩算法与相关标准〔一〕文本数据压缩一般来讲,无损压缩都可以用来对文本数据进行压缩。在文档处理方面,文件压缩有着重要的意义:1. 文件压缩存档实用程序2. 第二类是可执行文件压缩实用程序。3. 第三类是近几年才面世的系统级磁盘压缩管理软件。4. 软盘〔光盘〕压缩快递软件,.iso第四节数据压缩技术五数据压缩算法与相关标准〔二〕静止图像压缩1、CCITTG42、JBIG和JBIG23、JPEG和JPEG2000第四节数据压缩技术1、CCITTG4它是国际与电报咨询委员会〔CCITT〕提出的关于黑白二值图像的的压缩方法的一个标准,它是基于变长游程编码和改进的霍夫曼编码,主要用于与黑白图像相关的领域,属于无损压缩压缩编码。第四节数据压缩技术2、JBIG和JBIG2JBIG〔JointBinaryImageGroup〕是二值图像压缩标准,是和JPEG并行的国际标准,主要针对黑白和灰度图像,于1993年得到正式认可。它的技术特点是编码效率高,能够自适应图像特征,能够进行图像的有损和无损压缩,但是有损压缩质量急剧下降。JBIG2就解决了有损压缩质量下降问题。JBIG能够实现分层方式传送图像,图像在传送时,传送一幅比较概略性的图像,然后随传送数据的不断到来所得到的图像质量逐步提高。〔三〕静止图像压缩JPEG是一种典型的混合压缩标准,它将压缩算法分为两大类,即基于分差脉冲码调制无损压缩的根本局部和基于离散余弦变换的有损压缩的扩展局部。其无损压缩的压缩比保守估计为2:1。其有损压缩比在20-40倍时,人眼根本看不出失真。在数字图书馆应用中,主要采用JPEG有损压缩的扩展局部。但是传统的JPEG压缩技术已无法满足人们对多媒体图像资源的要求,因此更高压缩比以及更多新功能的静态图像压缩技术JPEG2000诞生,它的压缩率比JPEG高约30%,同时支持有损和无损压缩,并且能够实现渐进传送,并且支持“感选取区域〞特性,可以指定图像上任意你感兴趣区域的压缩质量。〔三〕静止图像压缩第一步,颜色空间的转换,即把图象中的色彩作为独立的局部进行处理,将数字化后的YUV(亮度和色度)颜色空间转换为适合计算机处理的RGB三基色图象数据。〔三〕静止图像压缩第二步,离散余弦变换。它对原始图象进行从左到右,从上到下的顺序扫描编码,将原始图象分割成一系列8×8的子块后逐块处理,在这8×8的图象块中,像素值变化一般较为平缓,因而适宜采用游程编码除去冗余局部。〔三〕静止图像压缩第三步,系数量化。量化的作用是在保证一定质量的前提下,丢弃图象中对视觉效果影响不大的亮度信息,将大局部系数的值变成连续一样的值(大局部是零),从而到达压缩目的。显然系数量化过程是不可逆的有损压缩,它是造成JPEG压缩信息损失的主要原因。〔三〕静止图像压缩第四步,编码。编码得首先对8×8像素块中直流分量采取分差编码,然后对各像素块其余的交流分量采取游程编码,最后将所得到的编码做基于统计特性的熵编码,如HUFFMAN编码。〔三〕静止图像压缩由上述算法可知,JPEG应用离散余弦变换、量化和熵编码获得帧内编码,在JPEG压缩下,一个YUV像素块通过离散余弦变换生成一个频率矩阵值,然后量化运算产生一个压缩频率值的矩阵,它被进行熵编码而得到最后的压缩比特流,编码比特可以数字存储或传输,然后通过相反的过程解压缩再生像素图象。第四节数据压缩技术〔四〕运动图像压缩1、面向通信的视频编码H系列标准为了解决各地、各国会议电视的互通问题2、活动图像专家组〔MPEG〕是几个国际标准化和工业组织的一个联合小组,该小组的主要目标是为全屏幕活动视频图像提供工业标准。MPEG压缩标准是针对运动图像而设计的,它包括MPEG视频、MPEG音频和MPEG系统〔视音频同步〕三个局部。第四节数据压缩技术〔四〕运动图像压缩

国际标准化组织的运动图像专家小组MPEG系列标准MPEG-1352X240,VCDMPEG-2720X480,DVDMPEG-4MPEG-7第四节数据压缩技术〔五〕音频动态压缩目前国际上制定的音频压缩标准属于两个方向,在一些应用环境下追求尽可能低的传输速率,在另一些应用环境下那么尽可能追求尽可能高的保真度。在这里,我们介绍一种音频动态压缩标准MP3。MP3的全称是MPEGAudioLayer-3。MPEG的数据流包含三种充分:图像流,伴音流和系统流。图像流仅仅包含画面信息,伴音流包含声音信息,系统流实现图像和伴音的同步。所有播放MPEG图像和伴音数据所需的时钟信息都包含在系统流中。MPEG伴音流又叫MPEG音频层第四节数据压缩技术〔五〕音频动态压缩MPEG音频压缩编码的主要特点是:它是一种有损的,非平衡编码。有损意味着为到达低比特率,采用了基于听觉和视觉心理的压缩模式,一些人眼和人耳最不敏感的图像和伴音信息将丧失;非平衡编码意味着其压缩编码过程比解码过程慢得多。第四节数据压缩技术〔五〕音频动态压缩MPEG音频层压缩比立体声信号数据量MP11:4384kbpsMP21:6~1:8192kbps~256kbpsMP31:10~1:12112kbps~128kbps第五节数据的存储与备份一、数字图书馆的存储设备〔一〕磁盘阵列

磁盘阵列又叫RAID〔RedundantArrayofInexpensiveDisks,廉价磁盘冗余阵列〕,廉价磁盘冗余阵列的概念是由美国加州大学伯克莱分校Patterson教授于1988首先提出的,是指将多个类型、容量、接口,甚至品牌一致的专用硬盘或普通硬盘连成一个阵列,使其能以快速、准确和平安的方式来读写磁盘数据,从而到达提高数据读取速度和平安性的一种技术手段。依据磁盘阵列数据不同的校验方式,RAID技术分为10个等级,即,但比较常用的是RAID0、RAID1、RAID5。RAID5是目前应用最广泛的RAID级别,它将各块独立硬盘进行条带化分割,相同的条带区进行奇偶校验〔异或运算),校验数据平均分布在每块硬盘上。以n块硬盘构建的RAID5阵列可以有n-1块硬盘的容量,存储空间利用率非常高。〔二〕磁带传统磁带存储器具有如下缺点:〔1〕磁带只能顺序读写,不适于随机数据的存取。〔2〕磁带的定位〔寻找读写数据的位置〕时间很长,可高达几分钟。〔3〕抗磨损性低,读写次数有限。一类是蛇型磁带技术一类是锯齿型磁带技术〔三〕光盘光盘存储器具有如下优点:〔1〕可以自由地装入光盘驱动器或自由地从光盘驱动器中卸出。〔2〕存储容量大。〔3〕价格廉价,大批量生产的本钱很低。与磁盘存储器相比,光盘存储器具有如下缺点:〔1〕驱动器的定位时间长,使得光盘存储器具有很长的延迟时间。〔2〕数据传输率低,每秒约150KB。〔3〕光盘的旋转速度较慢。光盘可以分为三类:第一类是只读光盘第二类是可读写光盘第三类是一次写屡次读光盘〔四〕机器手存储器库〔roboticstoragelibrary,简称为RSL〕机器手光盘库和机器手磁带库统称机器手存储器库。RSL主要由存储介质库、机器手和驱动器三局部组成。〔五〕光盘塔光盘塔是由多个SCSI〔SmallComputerSystemInterface〕接口的CD-ROM驱动器串联而成的,由几台或十几台CD-ROM驱动器并联构成,可通过软件来控制某台光驱的读写操作。光盘预先放置在CD-ROM驱动器中。〔六〕光盘镜像效劳器光盘镜像效劳器内置CPU和操作系统,采用大容量高速硬盘镜像光盘数据技术,将CD/VCD/DVD光盘的内容镜像到高速硬盘上,访问镜像到高速硬盘上的光盘,与直接访问光盘库、光盘塔中的光盘相比较,速度上要快好几倍,甚至几十倍。测试说明,访问镜像在高速硬盘上光盘的速度可以到达直接访问光盘驱动器中光盘的66倍。镜像到硬盘上的光盘镜像支持多用户访问,大大提高了光盘的使用率。二、存储技术和架构

〔一〕直接连接存储〔DAS〕直接连接存储〔DirectAttachedStorage—DAS〕,也可称之为效劳器连接存储〔Server-AttachedStorage—SAS〕。DAS被定义为直接连接在各种效劳器扩展接口下的数据存储架构。DAS存储架构DAS存储架构DAS存储架构的特点结构简单,本钱较低。带宽较低。扩展性差。数据共享困难,不能提供跨平台文件共享功能,各系统平台下文件需分别存储。管理较复杂,需要第三方软件支持。DAS存储架构的特点无独立的存储操作系统,需相应效劳器或客户端支持。分散式数据存储模式,网络管理员需要消耗大量时间奔波到不同效劳器下分别管理各自的数据,维护本钱增加。〔二〕网络连接存储〔NAS〕网络附加存储〔NetworkAttachedStorage—NAS〕或称为网络直联存储,是指将集成的存储系统如磁盘阵列和磁带设备,直接通过LAN接口连入信息通信网络的技术。NAS是直接连接到网络〔如某一局域网〕的一种存储器,它通过NFS〔NetworkFileSystem,即网络文件系统,用于Unix环境〕或者CIFS〔

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论