数字出版概论 课件 陈丹 第五章 数字出版流程和标准;第六章 数字内容加工、管理技术_第1页
数字出版概论 课件 陈丹 第五章 数字出版流程和标准;第六章 数字内容加工、管理技术_第2页
数字出版概论 课件 陈丹 第五章 数字出版流程和标准;第六章 数字内容加工、管理技术_第3页
数字出版概论 课件 陈丹 第五章 数字出版流程和标准;第六章 数字内容加工、管理技术_第4页
数字出版概论 课件 陈丹 第五章 数字出版流程和标准;第六章 数字内容加工、管理技术_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章数字出版流程和标准本章学习要点●了解数字出版流程与传统出版流程的异同;●掌握数字出版流程再造所需要解决的基本问题和数字出版流程的基本构成;●了解新技术环境下数字出版流程呈现的新特点;●掌握数字出版标准的定义与类型;●了解我国数字出版标准发展状况。第一节数字出版主要流程一、数字出版流程与传统出版流程的异同二、数字出版流程再造的基本问题与解决方案三、数字出版流程基本构成四、新技术环境下数字出版流程新特点五、全媒体流程再造——以烟台日报传媒集团为例一、数字出版流程与传统出版流程的异同(一)流程再造当出版单位采用了以数字内容为核心的管理系统以后,传统的编、印、发环节将被改变,这就是所谓的“流程再造”。(二)数字出版流程与传统出版流程的相同之处纸质图书的出版需要经历选题策划、约稿、审稿、编辑加工、发稿、排版、校对、质检、印刷、发行等主要环节。同样,数字出版产品的创作过程中有些环节是必不可少的,如都需进行选题策划、产品加工制作、校对、发行等,数字出版通过兼顾传统出版流程,进一步提高自身更新和迭代的能力。(三)数字出版流程与传统出版流程的不同之处数字出版不再仅仅是对传统出版物的数字化处理,还包括生成多形态的数字化产品,主要有电子书、有声书、网络视频、网络游戏、数字音乐、数字报纸等等,其内容资源的管理、资源加工与内容制作、产品发布都需要数字化技术做支撑。同时,随着产品形态的丰富,企业在数字出版生产过程中会更加注重考量产品的受众范围,通过利用自建平台和第三方平台进行用户数据收集,捕捉用户浏览习惯和喜好,形成用户画像,在产品制作与分发的过程中能够更具针对性,从而更好地满足不同用户的个性化需求,增强用户黏性。二、数字出版流程再造的基本问题与解决方案(一)数字出版流程再造的基本问题基于效率和效益原则,一方面要解决资源集聚整合的效率与成本问题,另一方面要解决产品谱系(矩阵)成本收益率最大化问题。同时还要解决企业内部资源聚合规划效益问题,产品谱系(矩阵)开放度问题,自有平台渠道和第三方平台渠道的适配问题,不同格式或开发序列的敏捷开发适配问题。(二)数字出版流程再造四要素数字出版流程再造包括四个要素:技术、人才、观念、制度。其中技术创新是图书数字化流程再造的核心,人才和观念创新是图书数字化流程再造的支撑,制度创新是图书数字化流程再造的保障。1技术互联网和人工智能技术的迅猛发展,一定程度上改变了人们的生产工具和生产方式。2人才数字出版流程再造离不开出版人才队伍建设。3观念编辑人员需要在短时间内转变传统的图书生产观念,革新理念来落实数字出版流程再造。4制度健全的管理制度和激励机制是出版单位开展数字化流程再造的重要保障。三、数字出版流程基本构成(一)前期策划前期策划是数字出版物开发的第一步,策划设计的内容是否全面、调研是否充分、对产品的思考和规划是否到位,与对应产品开发时的顺利程度、最终形成的产品质量息息相关。首先要确定产品的选题,确定其内容和整体风格。同时还需要对产品的受众范围进行考量,同时把握社会效益和经济效益。其次,市场调研是前期策划中不可缺少的重要部分。(二)素材采集文字材料是组成数字出版物的基本素材。图片材料既可以作为数字出版物的主要内容,也可以是文字内容的辅助素材,使内容的表达更为直观、生动。图片可通过相关的资源库获得,也能通过相机拍摄、照片扫描获得,还能通过制图软件进行自主创作。表格可以通过多种形态和色彩来表达含义。音视频素材也是数字出版物区别于传统出版物之处,通过音视频素材的插入能够带来更为精彩的视听体验。不同类型的数字出版物素材获取方式也不尽相同,可以根据产品的内容策划和框架构想,通过互联网检索、文献查询、音视频创作、采访调研等多种方式获得,之后对素材进行加工处理,调整格式和尺寸等。(三)产品制作与检测产品制作是整个数字出版流程的核心所在。在进行产品制作时,需要整合所获得的素材,根据产品的不同形态选用适配的创作工具,按照前期策划设想一步一步地进行产品创作。在进行产品制作时,既要保证质量和产品规范化,也要确保产品本身符合法律法规。为了保证产品的质量,在完成数字出版产品的制作后,还应该在正式发布前对产品进行系统测试。(四)分发在完成数字出版物制作并进行产品检测与调试后,便可对产品进行发布,使产品真正到达用户手中,为用户所用。数字出版可以打破时空限制,利用专业系统对口、联机数据库、网络等手段,在极短的时间内完成传统出版几周才能完成的出版物的布货、上架、推销等工作,从而实现全世界范围内的同步发行。根据不同数字出版产品的形态特征,选用相应的发布形式,能实现多渠道分发。四、新技术环境下数字出版流程新特点(一)产品形态更具开放性伴随着市场和用户需求的不断变化,数字出版产品形态也日益丰富,具有更强的开放性和包容性。目前,数字出版的产品形态大体上可以分为五个类别:一是以电子图书、电子期刊、有声读物为代表的数字出版物;二是以手机报、手机阅读为特色的手机出版物;三是针对手持阅读器、平板电脑等移动终端的数字出版产品;四是定制开发的数据库数字出版增值产品;五是多形态数字出版衍生的互动产品。(二)不同类型内容资源的汇编式和序列式开发近年来,很多出版单位在获得大众类型的纸质书的版权之后,对其进行数字化加工和专业化配音,推出各种电子书和有声书产品,凭借其新颖的形式和更好的体验获得了大量读者的青睐。从纸质书、电子书、有声书三者的版权签订和编辑加工等流程上可以看出,形成了一种数字出版产品的序列式开发方式,这也是专业类或知识类聚类型的数据库结构化重组的体现。(三)数字资源保值增值效率要求提升以基于XML的一体化数字出版流程为例,其能够形成各种可重复利用的结构化数据文件,为数据重复使用、实现多渠道的立体出版提供了基础,并为跨平台的数据读取和数据交换以及数据的重新组织和再利用创造了条件。以上种种都体现出在数字出版流程再造的过程中,数字资源的管理效率得到了不断提升。五、全媒体流程再造——以烟台日报传媒集团为例烟台日报传媒集团建立在烟台日报社基础上,成立于2005年9月,以报刊出版为主业,目前拥有《烟台日报》《烟台晚报》以及黄海数字出版社和水母网等十家媒体。烟台日报传媒集团原有的出版流程是:不同媒体机构前往新闻事件发生地采集素材,并分别回到各自所在的部门进行编辑加工,次日进行出版印刷后,将内容通过水母网进行网络发布产生电子报、手机报等。在新时代背景下,原有的出版流程无法适应新媒体传播的需要,烟台日报传媒集团尝试对原有的出版流程进行改造,向全媒体化的传媒集团转型。(一)构建数字资产管理平台(二)构建全媒体新闻中心(三)采用全媒体数字复合出版系统(四)实行全媒体数字出版复合流程烟台日报社水母网第二节数字出版相关标准一、数字出版标准概述二、我国数字出版标准化道路三、国外数字出版标准化一、数字出版标准概述(一)标准1定义标准是按照规定的程序经协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件。标准需要一个编制、发布、实施的过程,我们称之为标准化。2分类按照作用范围,可以将标准分为国际标准、区域标准、国家标准、行业标准(专业、协会和部门)、地方标准和企业标准。按照作用种类,标准可以分为基础标准、产品标准、方法标准、管理标准、卫生标准、安全标准、环境标准等。根据《中华人民共和国标准化法》的规定,我国标准分为国家标准、行业标准、地方标准和团体标准、企业标准。3作用标准的制定,有利于国家资源的合理利用,便于科学技术成果的推广,便于在各行各业形成良好运行秩序,保证产品质量,有利于产品的通用互换及标准的协调配套等,提高社会效益和经济效益,保障社会安全和人民安全。(二)数字出版标准1定义数字出版标准是在国家范围内或新闻出版行业内及相关企业内经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件。我国的数字出版标准体系主要包括标准整体架构、通用类标准、内容产品类标准、数据规格类标准、平台传播类标准、管理类标准、版权类标准七大方面。2我国新闻出版标准化管理体制目前新闻出版业的标准化技术委员会包括全国新闻出版标准化技术委员会、全国出版物发行标准化技术委员会、全国印刷标准化技术委员会和全国新闻出版信息标准化技术委员会等。(二)数字出版标准3我国数字出版标准发展情况2009年手机出版标准发布。2010年,制定了电子书相关基础标准。2011年,全国新闻出版标准化技术委员会在制定《MPR出版物》(多媒体印刷阅读出版物)系列国家标准的同时,积极与全国信息技术标准化技术委员会进行沟通。自2013年1月至2014年1月国家新闻出版广电总局就发布了37项数字出版标准,我国数字出版标准的体系搭建初见规模。4数字出版标准的类型(1)数字出版基础术语标准。(2)数字出版资源的分类标准。(3)数字出版资源的标识标准。(4)数字出版参与方的标识标准。(5)技术标准。(二)数字出版标准5我国数字出版相关标准汇总(1)国家标准。2017—2021年,我国数字出版相关的国家标准既涵盖了传统的数字出版产品(音像出版物、连续出版物)领域,也增加了知识服务等新兴领域的相关标准。(2)国标计划。截至2021年底,我国已下达、未批准发布的数字出版相关国标计划主要涉及出版物在线信息交换、声像数字出版物技术检测和印前数据交换等方面。(3)行业标准。2014—2021年,我国数字出版相关的行业标准涵盖音像出版物、电子图书、网络游戏、有声读物等产品种类,信息采集、资源加工、数据传输、数字阅读、数据统计等生产传播流程,以及物联网、AR等相关技术。二、我国数字出版标准化道路(一)政策层面的宏观标准设计2016年底,国家新闻出版广电总局发布了“首批新闻出版业科技与标准重点实验室名单”,里面有些是做标准建设的,诸如CNONIX国家标准、ISLI国家标准等。ISLI即国际标准关联标识符(InternationalStandardLinkIdentifier),这是由我国主导制定的,于2015年5月被国际标准化组织全票通过,成为信息与文献领域发布的第11项国际标准。2016年8月,ISLI中国国家标准正式发布。ISLI标志码及图标的申领应用示意图(二)企业层面的自主参与(1)咪咕数媒牵头发布移动阅读电子书格式标准。(2)梦想人科技助力《出版物AR技术应用规范》的制定。新闻出版行业标准《出版物AR技术应用规范》于2019年正式发布,苏州梦想人软件科技有限公司全程主导参与了标准的论证、起草与制定,中国大地出版社有限公司、中地数媒(北京)科技文化有限责任公司、中国新闻出版研究院等单位参与标准的起草制定。(3)校企联手牵头起草《出版物VR技术应用要求》。三、国外数字出版标准化国际标准和国外先进标准很多是依据不同需求来制定的,例如数字出版领域的元数据标准就已被发达国家覆盖,且各自支持不同的技术方案,存在着相互交叉、重复制定的现象,这也反映出标准化领域的竞争局面。我国的数字出版标准也需要走国际化道路,在符合有关法律法规和考虑我国实际情况的前提之下,大力采用国际标准,对我国的相关工作起到促进作用,提高效率,降低成本。同时,还要认真研究国际数字出版相关标准的变化与发展,积极参与国际标准的讨论和制定,并争取把我国的标准发展成国际标准。本章通过分析数字出版流程与传统出版流程的异同,梳理了数字出版流程再造需要解决的基本问题、数字出版流程的基本构成,分析了新技术环境下数字出版流程呈现的新特点。并且,阐明了数字出版标准的定义、分类,介绍了我国数字出版标准的发展情况。本章小结1.简述数字出版流程与传统出版流程的不同之处。2.简述新技术环境下数字出版流程的新特点。3.查找传统出版单位成功进行数字化转型升级的典型案例,并分析其对原有出版流程进行了哪些改造。4.举例说明数字出版标准的类型。5.查找2020年至今我国发布的数字出版相关标准并简要分析。6.简述ISLI的内涵及应用。7.思考我国目前的数字出版相关标准还存在哪些不足。思考题第六章数字内容加工、管理技术本章学习要点●掌握数字内容加工与管理工作内容;●了解数字内容加工技术及其应用状况;●了解数字内容管理技术及其应用状况。第一节数字内容加工与管理概述数字内容加工与管理是数字出版的基础工作。数字内容加工即按照一定规范,将数字内容进行统一生产、制作、修改、拆分、整合,以满足用户的使用目的或达到行业常用标准水平的过程。数字内容管理即将数字内容按照一定的逻辑组织方式,进行收集、整理、存贮、利用的过程。数字内容加工一般要通过系列软件加以实现,如OCR软件、格式转换软件等;数字内容管理一般依托一个大型的资源管理系统,如知识库、数据库系统等。第二节数字内容加工技术数字内容加工技术包含三种类型:版面理解技术、编辑工具集和XML编辑工具集。而在一些数字出版实践中,经常根据复杂程度将数字内容加工技术分为初加工深加工两种类型。国家数字复合出版系统工程的相关技术可以看作一种理论性技术,而初加工与深加工技术可以看作一种操作技术。一、国家数字复合出版系统工程的内容加工技术二、数字出版实践中常用的相关技术三、数字内容加工技术的作用一、国家数字复合出版系统工程的内容加工技术国家数字复合出版系统工程可以理解为一种理论性、通用性的技术。首先,版面理解技术,主要指文档资产结构化整理工作;其次,编辑工具集,主要为作者和编辑提供一组专业化的内容编辑工具;最后,XML编辑工具集,主要用于图书、期刊和新闻文稿的XML格式转换和编辑处理过程,包括Word或Excel文件转换为XML文件之前的整理工作、XML转换工作、转换后的XML整理工作和XML编辑工作。在实际应用中,内容加工技术也可以分为以下八种类型:一是文档编辑工具类二是辅助翻译工具类三是文件格式转换工具类四是缺字补字管理工具类五是特征抽取与检查工具类六是水印处理工具类七是版面理解技术类八是自动标引工具类二、数字出版实践中常用的相关技术(一)OCR技术OCR技术主要利用光学技术和计算机技术,通过检测印刷体字符每个像素的亮、暗模式,将其转换成一个黑白图像的文件,然后再使用识别手段将黑白图像文件转换成计算机可以识别的文字。其工业化流程主要包括六个方面:1文件扫描和图像处理(一)OCR技术1文件扫描和图像处理首先是扫描前的文件整理环节。对纸质文件逐页检查并把影响扫描的污损、粘连等问题页处理好。如果文件可以拆分扫描则要将文件拆分好,并在扫描结束后重新装订。接着是文件扫描环节。目前的快速扫描技术可以每秒钟完成50页A4纸的扫描工作。扫描后的图片一般会按照设定格式存在规定存储设备中,图片的像素要求一般在300dpi以上。文件扫描常用的图像格式有TIF、JPEG、PNG等,目前较为通用的是无损压缩的TIF格式。扫描完成后是图像处理环节。这一环节的主要工作是对扫描后的图像去脏、纠偏,调整版心,使图像更适合阅读和识别。图像处理环节可以使用通用图像处理软件(Photoshop、InDesign、AI等)或专门工具软件。(一)OCR技术2版面分析图像处理后的数据在进行OCR识别前需要进行版面分析。版面分析就是标记各类内容区域并确定其属性的过程。例如,横排文本区、竖排文本区、公式区、表格区和图像区等。OCR识别引擎会根据区域的属性识别需要识别的区域,而公式、分子式等不易识别区域就会以图片的方式存储并应用。版面分析使用专门软件工具处理,可以自动处理,也可以手动处理。(一)OCR技术3

OCR识别OCR识别是指把图像中的文字、符号等转化为计算机编码的过程。现代OCR识别技术已经可以处理多语种混排、多字体混排、简繁体混排和表格等复杂的文本类型,同时识别率可达到95%以上。在纸质图书加工系统中,一般都会采用多个识别技术方案同时识别,再对识别结果进行智能比较,以提高识别率。OCR识别过程是全自动批量处理的。OCR识别后的文本还会有较多的编码错误和格式错误,需要人工校对和修改。校对分为横向校对和纵向校对。(一)OCR技术4纵向校对纵向校对是将文件中的每个字符逐个切分成小图形,并将程序认为相同的图形逐一排列。当我们打开这一工序的界面时,屏幕显示的都是同样的字符。但在其中会含有一些相似的字符,如汉字中的“土”和“士”,英文中的“X”与“x”等。这就要求操作人员对照原图形文件。如果是程序转换错误,要根据图像加以改正,从而保持与原文一致。由于同一屏幕出现的是同一个字符,因此,如有不同,操作人员极易发现并加以改正。经过这道工序,可基本完成错字符的校对修改。(一)OCR技术5横向校对横向校对采用类似传统的人工校对方法,即通过人工逐字逐句地将识别结果与原始图像进行比对,找到错误的地方并修改。基于前道工序(纵向校对)的工作,横向校对工作是将转换后的文本文件对照原文件,在版式上加以修正。要求操作时,现有文件尽量保持原版式。操作界面分为上下两个部分:上半部分是已经转换完成、需要校对的文本文件,下半部分则是用来对照的原文件的扫描图像。在上半部分我们同时可以看到一行底色略深的文字,它与下面紧挨的一行内容相同。这是在程序设计时,将当前校对一行的图像剪切提取,摆放在正在校对一行的上面,便于操作员比照校对,相当于纸件校对的折校。(一)OCR技术6文审与校验最后要对数字化的文件进行文审校验,根据质检标准调整数据的格式,改正之前未能发现的错误,差错率一般要求控制在万分之三以内。OCR技术能够提供基础的TXT文件,然后再根据客户要求,进行深加工,形成最终数据文件。OCR技术对应国家数字复合出版系统工程中的版面理解技术,是对版面理解技术的深化。多核心(多重)OCR技术则进一步提高了识别效率。多核心OCR技术即利用多个不同OCR系统进行文字识别处理,然后将多个系统的文字识别结果进行比对。通常,经三个系统识别一致的文件,文字差错率不超过十万分之一,因此不需要进行人工校对。这样,多核心的比对过滤掉了大量有错误的文字,大大提高了识别和校对效率。(二)XML技术1

XML概念XML(ExtensibleMarkupLanguage),即可扩展标记语言。标记指计算机所能理解的信息符号,可以用来标记数据和定义数据类型。通过此种标记,计算机可以处理包含各种信息的文本等。(二)XML技术2

XML发展XML是从标准通用标记语言(SGML)演化而来的。SGML是一种在Web出现之前就早已存在的用标记来描述文档资料的通用语言。由于SGML比较复杂,人们推出了HTML。随着Web应用的不断深入,HTML也难以适应技术发展需要。于是Web标准化组织W3C建议使用一种精简的SGML版本——XML。XML与SGML一样,是一个用来定义其他语言的元语言。与SGML相比,XML开放性强,简单易懂,是一门既无标签集也无语法的新一代标记语言。(二)XML技术3

XML功能(1)XML可以从HTML中分离数据,即能够在HTML文件之外将数据存储在XML文档中,这样可以使开发者集中精力使用HTML做好数据的显示和布局工作,并确保数据改动时不会导致HTML文件也需要改动,从而方便维护页面。(2)XML可用于数据共享。(3)XML可应用于B2B商业模式中,例如在网络中交换金融信息。(4)XML可以充分利用数据。(5)XML可以用于创建新的语言。比如,WAP和WML语言都由XML发展而来。(二)XML技术4XML编辑加工的流程对XML的编辑加工即内容结构化加工。首先,根据不同类型图书的知识体系特点,通过自动分析和人机交互两种方式对图书资源进行元数据标引。然后,按照图书目录拆分章节内容,包括章节下的文本段落、图片、表格、公式等内容。最后,将标引和拆分完后生成的数据导出为XML、PDF、EPUB、Word等文档格式。图书的XML加工流程如下:(1)安装编辑加工软件;(2)分析文件;(3)制作;(4)设置目录级别;(5)元数据提取;(6)导出XML;(7)使用XML编辑器检查文件;(8)使用DTD/Schema校验XML结构规范。(二)XML技术5

XML数字出版标准按照2014年国家新闻出版广电总局数字出版司发布的《图书数字资源内容标引规则》,结合图书的结构建立DTD/Schema。DTD(DocumentTypeDefinition)是一种定义标记语言的语言,它可以定义XML文件使用的标记、属性和实体以及它们之间的嵌套关系。DTD相当于XML的法律性文件,如果不满足DTD文件的约束,就不能称为一个有效的XML文件。(二)XML技术6

XML数据转换一个基于XML的内容深加工系统,包含了内容预处理、格式转换、内容校验等环节。内容前期处理以兼容多种源文件格式的内容预处理系统为核心。该系统采用转换模板配置的方式,以满足不同项目对各类排版文件前期预处理的转换要求。数据成品转换以兼容多项目标准的多格式数字内容制作系统为核心。该系统采用输出标准模板配置的方式来满足各项目多格式产品输出标准。纸质资源利用扫描识别系统实现高效转换,电子资源利用排版文件反解技术实现高效转换。质检管理以兼容多项目标准的加工数据内容校验系统为核心。该系统可针对XML、HTML、EPUB等格式电子书、图片、封面等,分别按照各项目标准配置质检指标,实现批量数据一次处理,保障数据质检效果。基于XML的内容加工界面三、数字内容加工技术的作用数字内容加工的目标是实现数字内容产品更好地传播和利用。目前产业环境中,相关技术能够实现以下目标。(一)高效实现数据格式转换(二)精准实现内容结构标引(一)高效实现数据格式转换数字出版中的经常性数据转换是将方正书版文件、飞翔文件、WPS文件、InDesign文件和Word文件等排版文件转换输出为PDF格式的文件。在实际工作中,会经常出现的问题有文字乱码、内容缺失、版面错页(跑版)、英文单词间空格丢失等。数字内容加工工具有效地解决了这些问题。格式转换后的PDF文件按其中图片的质量可分为浏览级PDF和印刷级PDF,浏览级可作为成品数据应用到电子图书产品中。数字内容也包括图像及音视频内容,如图像处理技术涉及图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等,音视频处理技术涉及音视频的编码、压缩、转换、还原等,这些也属于广义的数据格式转换范畴。(二)精准实现内容结构标引传统出版物的内容标引受限于载体,所以多数侧重于内容的外部特征,例如标题、关键词、作者、作品分类、载体以及出版者等。而数字内容拓展到了用户生成内容、专业生成内容、职业生成内容(Occupationally

GeneratedContent,OGC)以及设备驱动内容(DeviceGeneratedContent,DGC)等多种内容生成模式。同时,数字内容既有文字、图像、音频、视频以及AR/VR等不同形式,也有融这些交付形式于一体的综合形式。借助于当前的标引工具,可以精准地对这些内容进行有序化处理,并利用一定的规则、技术和方法,通过对内容的深度挖掘,精确表达内容之间的逻辑关系。第三节数字内容管理技术一、信息资源管理系统二、出版ERP一、信息资源管理系统(一)信息资源管理系统概述信息资源管理系统是对加工后的数字内容进行全面管理的系统,它对数字内容进行采集、分类、存储、发布等流程化管理。信息资源管理系统的目标是为数字出版单位提供一整套统一编目、统一存储、统一管理的平台,将数字化的图书、期刊、图像、音频、视频等多种资源建立关联关系,实现数字资源快速、便捷、高效地调用和产品重组,为出版单位的数字资源长期保存、检索、加工、发布、服务提供数据支撑。信息资源管理系统一般由底层数据库及平台页面、应用软件等部分组装在一起形成完整的平台。(二)信息资源管理系统运行1数字内容的采集在信息资源管理系统进行数字内容采集时,需要内容使用权所有者运用模板采集、标准采集或直接上传等方式上传内容。模板采集指上传者从系统下载符合XML要求的Excel表单,填写数字内容的元数据信息和资源路径,然后上传数字内容。标准采集指在选定资源类型后,指定文件路径,系统将数字内容元数据信息、源文件和成品文件同时采集入库。除了内容上传之外,还有数据转储与网络爬虫采集等数字内容采集方式。(二)信息资源管理系统运行2数字内容的存储经过分类或者主题标引的数字内容采集完成后,就进入了存储环节。数字内容存储对象包括数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。这些内容以某种格式记录在计算机内部或外部存储介质上,如磁盘和磁带都属于存储介质。数字内容存储组织方式因存储介质而异。数字内容存储过程中,经常会涉及数据迁移和云存储两种存储模式。数据迁移,又称分级存储管理(HerarchicalStorageManagement),是一种将离线存储与在线存储融合的技术。云存储是一种网上在线存储的模式,即把数字内容存放在第三方托管的多台虚拟服务器(非专属的服务器)上。(二)信息资源管理系统运行3数字内容的管理信息资源管理系统采用源文档库、中间文档库、产品文档库的三级库结构对数字内容资源实施管理。源文档库将存储所有电子文档和其他数字资源,以方便后续数字内容产品的编辑工作;中间文档库将根据开发需求,构建各类素材库,将加工完成的素材分别存储于相应素材库中,以供数字内容产品研发使用;产品文档存储于用于分发的第三级文档库,如基于电子书的EP

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论