(安全技术及工程专业论文)工作面安全分析智能化电子文档技术研究.pdf_第1页
(安全技术及工程专业论文)工作面安全分析智能化电子文档技术研究.pdf_第2页
(安全技术及工程专业论文)工作面安全分析智能化电子文档技术研究.pdf_第3页
(安全技术及工程专业论文)工作面安全分析智能化电子文档技术研究.pdf_第4页
(安全技术及工程专业论文)工作面安全分析智能化电子文档技术研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(安全技术及工程专业论文)工作面安全分析智能化电子文档技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

s u b j e c t :r e s e a r c ho nt e c h n o l o g yo fi n t e l l i g e n c ee l e c t r o n i cd o c u m e n t so f s a f e t ya n a l y s i so nw o r k i n gf a c e s p e c i a l t y :s a f e t yt e c h n o l o g ya n de n g i n e e r i n g n a m e :d e n gz h i l u i n s t r u c t o r :z h a n gj i a n r a n g a bs t r a c t ( s i g n a t u n ) 幽型! 丝 ( s i g n a t ur e ) w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e rt e c h n o l o g y , i td e m a n dh i g h e rr e q u i r e m e n t st o m i n em a n a g e m e n to fi n f o r m a t i o na n dt e c h n o l o g y i ti s i m p o r t a n tt ot h em i n es a f e t yt o i m p r o v et h ei n f o r m a t i o nm a n a g e m e n to fm i n ep r o d u c t i o n i nt h i sp a p e r , b a s e do nt h ep r o j e c t t h a td a t at r a c k i n ga n da n a l y s i sa b o u tv e n t i l a t i o ns a f e t yo f4 16w o r k i n gf a c eo fc h e n j i a s h a n m i n e ,i ts t u d yh o wt om a n a g ei n f o r m a t i o no fp r o j e c te f f i c i e n t l y i nt h es t u d yo ft h ep r o j e c t al a r g en u m b e ro fi n f o r m a t i o nr e l a t e d 、) l ,i t i lw o r k i n gf a c ew a s c o l l e c t e d ,i n c l u d i n gal a r g en u m b e ro fd a t a , t e x t s ,s t a t i s t i c a lt a b l e s i no r d e rt op r e v e n tt h e a c c u m u l a t i o no fs u c hi n f o r m a t i o ni n t oac h a o t i cc a s e ,i t sn e c e s s a r yt od o c u m e n tm a n a g e m e n t f o rt h e s ed a t a t h a ti sc o m p i l e dt h ec h a r t s ,d a t a , t e x t si n t or e p o r t s ,t h e nr e a s o n a b l es t o r a g ea n d f o r m e dr e p o r t sb a s e p r o v i d ev a l u a b l ei n f o r m a t i o nf o rm i n em a n a g e r sa n dp o l i c y m a k e r s ,a n d p l a y e dap o s i t i v er o l eo ns a f e t ya n a l y s i so fw o r k i n gf a c e t h i sp a p e r , r e s e a r c ho nh o wt oa p p l yt h et e c h n o l o g yo fi n t e l l i g e n td o c u m e n t sb a s e do n p d ff o r m a tt od o c u m e n tm a n a g e m e n to ns a f e t ya n a l y s i so fc o a lw o r k i n gf a c e f i r s t ,i t a n a l y z et h es a f e t yo ft h ew o r k i n gf a c ea c c o r d i n gt ot h ep r o j e c t , c l a s s i f yt h ei n f o r m a t i o n c o l l e c t e d ,e s t a b l i s ht h ed a t ac e n t e ro fs a f e t ya n a l y s i s t h en e x t ,a c c o r d i n gt oa p p l i c a t i o n r e q u i r e m e n t so ft h ep r o j e c t ,u s i n ga c r o b a t8 0p r o d u c ea 、) l ,i d ev a r i e t yo fp d fr e p o r ts t e n c i l f i n a l l y , t h ep r o c e s s i n gs y s t e m so fi n t e l l i g e n tm a n a g e m e n td o c u m e n to ns a f e t ya n a l y s i so f w o r k i n gf a c ew a sa n a l y z e da n dd e s i g n e d t h es y s t e mi s d i v i d e di n t ot w om o d u l e s :r e p o r t g e n e r a t i o nm o d u l ea n dm a n a g e m e n tm o d u l e f o rg e n e r a t i o nm o d u l e ,i ts a v et h es o u r c ed a t a o fd a t ac e n t r eo fs a f e t ya n a l y s i so nw o r k i n gf a c ei n t ox m lf i l eo fc o r r e s p o n d i n gr e p o r t t e m p l a t e ,a n di n s e r tt h er e l a t e dp i c t u r e si n t ot h ec o r r e s p o n d i n gp l a c eo ft e m p l a t e sb y c o m b i n i n gw i t ha c r o b a ti a c f o rm a n a g e m e n tm o d u l e i tm a i n l yr e a l i z et h eq u e r ya n d m a r k i n go ft h er e p o r t ,b e s i d e s ,t h er e p o r tc a nc o m b i n ef r e e l y k e yw o r d s :s a f e t ya n a l y s i so nw o r k i n gf a c e i n t e l l i g e n c ee l e c t r o n i cd o c u m e n t s p d f x m l t h e s i s :a p p l i c a t i o nr e s e a r c h 压要料技大学 学位论文独创性说明 本人郑重声明:所呈交的学位论文是我个人在导师指导下进行的研究工作及 其取得研究成果。尽我所知,除了文中加以标注和致谢的地方外,论文中不包含 其他人或集体已经公开发表或撰写过的研究成果,也不包含为获得西安科技大学 或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中做了明确的说明并表示了谢意。 学位论文作者签名:砰志糠日期:2 口叮备鲡;6 日 学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻读学位期间 论文工作的知识产权单位属于西安科技大学。学校有权保留并向国家有关部门或 机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。学校可以将本学 位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存和汇编本学位论文。同时本人保证,毕业后结合学位论文研究课 题再撰写的文章一律注明作者单位为西安科技大学。 保密论文待解密后适h 本声明。 学位论文作者签名:绅舌。穰 指导教师签名: j 粝1 每z j 一岁 年j 月亏。日 1 绪论 1 绪论 1 1 问题的提出 煤炭是我国的基础能源和重要原料,在国民经济中占有重要的战略地位。未来几十 年内,煤炭依然是我国的主要能源,以煤炭为主的能源结构将难以改变。近两年来,国 务院及国家有关部门对煤炭产业采取了一系列重大举措,煤炭工业的重要性进一步得到 社会上的认可【1 2 1 。 但是,煤矿安全问题始终是煤炭企业所面临的严峻挑战。表1 1 为我国1 9 9 1 - - - 2 0 0 8 年间煤矿事故死亡人数统计。我国煤矿事故死亡人数虽然逐年下降,但煤矿的安全现状 仍不容乐观,特别是煤矿重特大事故频发。煤矿安全问题成为构建社会主义和谐社会的 极大障碍。 表1 11 9 9 1 - - 2 0 0 8 年间煤矿事故死亡人数统计 如何提高煤矿作业的安全度,最大程度减少国家财产损失和人员伤亡成为亟待解决 的问题,煤矿安全成为全社会关注的焦点问题【3 。5 】。随着计算机技术的快速发展,对煤 矿信息化建设提出了更高的要求。改进煤矿生产信息管理现状,对煤矿安全生产尤为重 要。 1 2 论文研究的目的与意义 从系统工程的观点出发,煤矿是个大系统,而采煤是这个大系统的重要子系统。 采煤是煤矿生产中的主要生产环节,煤矿主要的人力、物力都集中在采煤工作面【6 j 。采 煤工作面是井下瓦斯爆炸主要发生地点之一。因此,采煤工作面的安全生产非常重要。 为了保证工作面的安全生产,往往要进行工作面安全分析。而工作面安全分析是在对该 西安科技大学硕士学位论文 工作面各种生产、安全状况参数采集汇总,进行以通风瓦斯、煤层自燃为主的数据分析, 在数据跟踪分析的基础上研究和评价工作面安全生产状况。工作面安全数据是安全分析 的基础,在现场收集数据过程中,数据库罩面的数据表,涵盖了从工作面巷道布置、生 产、通风系统、瓦斯抽放、采空区火灾以及洒水防尘等6 个方面的内容。这些数据对于 分析工作面生产过程中一些安全问题,提供了重要的基础性信息。如何有效地处理和利 用这些数据呢? 目前,煤矿安全管理部门主要以e x c e l 形式的报表存储这些数据,这样 的报表往往过于单一,不利于查询、审阅、存储及管理,不能形成高效的文档【刀。 本论文研究的目的就是为煤矿安全管理部门设计一种智能化的电子文档,以提供更 灵活、更高效的文档管理形式。该文档对各种安全和生产数据进行分类管理和汇总,能 够方面进行查询、审阅、存储及管理。 矿井工作面每天产生大量的数据,经过时间的积累,形成海量数据。对这些数据进 行跟踪与分析,提取有价值的信息,用于指导生产、预防事故很有必要。智能化电子文 档的实现可以很好的管理这些数据,给矿井管理者、决策者提供有价值的信息,对煤矿 生产管理、灾害预测起到积极的作用。 1 3 煤矿生产信息管理研究现状 煤矿生产信息的管理经历了由手工记录到计算机管理的过程 8 】,如图1 1 所示。 网络管理 单机管理 手工记录 当前时期时间( t ) 图1 1 煤矿生产信息管理发展历程 ( 1 ) 煤矿生产信息管理的手工记录阶段 在计算机引入煤矿安全生产信息管理之前,煤矿生产信息主要以文字、表格、图形 等形式采取手工记录、绘制和存放,使得资料的保护和信息的利用存在着效率低下、共 2 1 绪论 享性差、检索速度慢、信息处理不及时等诸多缺点。 ( 2 ) 煤矿生产信息管理的计算机管理阶段 随着计算机技术的不断发展,各单位逐步开发专门的煤矿安全生产管理信息系统, 对煤矿安全生产信息进行计算机管理。煤矿安全生产信息的计算机管理经历了单机管理 和网络管理两个阶段。 在单机管理阶段中,煤矿安全生产属性信息通常存储在e x c e l 或a c c e s s 中,以电子表 格的形式存在,图形信息一般使用a u t o c a d 绘制,或直接以扫描图件的形式存储在电脑 里。尽管有部分煤矿建立了自己的安全生产数据库,但系统功能简单,信息更新不够及 时,存储效率低,严重影响了煤矿安全生产信息在煤矿实际生产工作中的应用【9 】。 在网络管理的初始阶段,安全生产管理信息系统主要对安全生产部门的表格数据、 文本文件和静态图形进行管理【l0 1 。目前,随着w e b g i s 技术的发展,网络版的安全生产 管理信息系统不仅可以对表格数据、文本文件和静态图形进行管理,还能对动态的矢量 图形进行管理和操作【1 1 1 。 煤矿安全生产管理信息系统有着非常重要的作用和广阔的应用前景,一些单位已将 其应用在煤炭生产中,并取得了成效。目前,我国对煤矿安全生产管理信息系统的开发, 主要集中在高校、科研院所和部分软件公司,这些单位的研究和开发已经取得了一定的 成果,开发出了自己的产品。如北京龙软科技发展有限公司的煤矿安全生产信息管理系 统,采用w e b g i s 和w - e bs e r v i c e s 技术相结合的方法,基于n e t 框架进行开发;西安交 大博通资讯股份有限公司的交大博通煤矿企业综合管理信息系统,该系统基于框架的构 件化软件技术开发,是b s 结构。中国矿业大学、煤炭科学研究总院、中国煤田地质总 局、中国安全生产科学研究院、部分矿业集团等单位结合科研和自身工作需要,相继开 发了一些小型和内部的煤矿安全生产管理信息系统,但是还没走向产业化。由于我国煤 矿软件开发单位少,而煤矿需求大,同时由于煤矿信息的复杂性和差异性,使我国各单 位对于煤矿安全生产管理信息系统的开发仍处于分散、独立的状态。国外最具代表性的 矿业软件是澳大利亚s u r p a c 大型数字化矿业软件。澳大利亚s u r p a c 成立于1 9 8 1 年, 从创建之始,s u r p a c 就致力于为矿产资源业开发采矿规划及管理软件系统,并且逐步 将业务领域从澳大利亚拓展到全球1 1 2 。1 4 j 。 目前煤矿安全生产管理信息化的研究及应用方面,主要存在如下问题【l 孓1 6 】: ( 1 ) 存储效率低,没有真正实现信息网络共享。由于没能充分利用现代网络技术, 很多重复的信息经常需要重复记录,影响工作效率。而且许多煤矿安全生产信息只限于 各个生产部门内部甚至个人掌握使用,生产信息共享和管理的广泛化程度和水平较低。 在没有对生产信息进行科学管理的基础上,各个生产部门的信息不能被其他部门使用, 生产信息缺乏共享性,也就不能交互使用。 ( 2 ) 没有形成完善的信息统计功能。由于信息的共享性差,对生产信息不能及时有 3 西安科技大学硕士学位论文 效的进行统计。不利于对煤炭生产进行科学的决策分析。同时,也严重阻碍了生产信息在 煤矿生产中的组织、协调、催办落实作用,对煤矿的安全生产有着严重的影响。 ( 3 ) 无法动态生成和查看各种生产台帐和报表。生产台帐、报表在生产过程中起着 统计、组织、协调的作用。通过采煤工作面循环进度表、掘进工作面生产记录、值班情 况表、生产日报、月报等可以很直观的对生产进行科学的决策。虽然很多系统都已经实 现了对一些基础数据的管理,但是根据基础数据及其数据关系实时生成报表和台帐的功 能却没有得到体现。 1 4 智能化电子文档发展研究现状 1 4 1 智能化电子文档的发展研究现状 传统档案是人们用传统工具( 笔、刀、印刷器械、光学仪器等) 将信息记录于传统 载体上;而电子文件档案是数字化信息技术的产物,其信息形态是数字化的。电子文件 在载体或计算机之间的转移、传输,实质上都是在计算机内进行数字信号的处理。智能 文档不同于传统电子文档只是作为静态的信息、图片和图形等的载体,它除了具备纸张 所有的特性外,还包含有高度结构化的x m l 信息、程序以及可执行的动作【1 7 】。智能文 档具有传统的电子文档所无法比拟的优越性,无论在文档的创建、检索、流转,还是在 信息共享、存储等方面都具有很大的优势。智能文档最重要的特性就是“数据 与“格 式 分离,这一特性无疑对文档信息的共享、查阅、输以及对文档进行智能化操作等方 面起到了根基性的作用。为了使智能文档做到“数据 与“格式 分离,可以采用x m l 定义文档中的数据;采用c o m 技术对文档提供智能化操作,它能够把对文档提供智能 化操作的代码片断有效、方便地进行封装,并使之与文档进行关联,从而实现真正意义 上的智能文档l l w 。 国内许多专家学者,基于不同的技术架构,开发实现了不同的智能文档。例如,王 瑾利用v s t o 工具将客户端应用程序集成到o f f i c e 2 0 0 3 业务解决方案中【2 ,为实现文档 的智能化提供了一条有效的途径;薛锋等初步探讨了地震系统智能化电子文件档案的管 理模式【2 2 】;张晓勇等基于n e t 平台和p d f 智能文档开发设计了一个开放式项目文档管 理系统等等】。 总之,智能文档具有传统的电子文档所无法比拟的优越特性,可以实现对结构化和 非结构化数据的有效整合,可以有效地实现信息的共享、流转。智能文档是新型的信息 处理技术,其发展和普及还处于起始阶段,因此还有许多方面有得深入研究。 1 4 2 基于p d f 格式的智能化电子文档发展研究现状 p d f 最早是由a d o b e 公司于2 0 世纪9 0 年代初在“页面描述语言 ( 即p o s t s c r i p t 语 4 1 绪论 言) 基础上建立的。a d o b e 公司打着“跨文字、跨语言、跨平台、跨媒体、跨软件、跨世 纪的电子文档交换格式 以及“这就是未来 的口号,让它能够确保文字、图像文档不 受计算机软件环境的限制,成为一种易于交流的文档格式,并被广泛应用于印刷出版、 电子出版和网络出版、使它带有跨媒体出版的特点。它可以将原文档内的字体、影像、 向量图形转换成适合多种用途的文档格式。也就是说,同一文档可被应用于不同的输出方 式,例如数码打印、拼版、胶片输出、数码印刷、网上传送、浏览及电子书等。p d f 文 档是种开放式电子文档格式,它的主要目的是要在各种不同的计算机平台创造出一个 共通的文档格式,就是希望不管在哪种电脑上制作的文档,只要能转成p d f 格式, 拿到另一种电脑上就能毫无困难地打开阅读,更能维持当时制作的格式与版面,看起来 跟原来的格式一模一样。p d f 格式的出现,使一个文档在不同平台上畅行无阻,而且看 到的样子都一样,再也不用花力气把文档格式转来转去了【2 4 。2 6 】。p d f 智能文档技术是 a d o b e 公司推出的“文档交互事实上的工业标准 。同时,它能够较好地支持x m l 与 w e bs e b s e r v i c e 。p d f 智能文档技术的核心是p d f 表单技术。 p d f 现已成为在i n t e m e t 上进行电子文档发行和数字化信息传播的常用文档格式, 在国际上已被政府机关、业务部门、档案馆、图书馆和其他机构广泛用作电子文件长期 保存的格式,如美国国家档案馆专门制定了接收p d f 格式电子文件进馆的规定;荷兰 国家档案馆目前支持电子档案采用p d f 和x m l 格式;澳大利亚的维多利亚州的电子文 件管理标准也采用p d f 格式;英国公共文件部也将p d f 作为移交档案馆的文件格式之 一【2 7 2 9 】o 从发展来看,随着p d f 国际标准的颁布,采用p d f 格式作为电子文件长期保存格 式的国家和部门将会越来越普及,速度将会越来快,力度将会越来越大。 在国内,上海市政府把各种p d f 格式的应用表单放到政府网站上,公众足不出户 就能完成相关的表单申请,在政府与社会公众之间构建了一种新的信息通道,使公众能 够充分享受政府提供的优质、方便和可靠的服务;上海科委提供了大量地动态p d f 表 单,可直接在p d f 文档中填入文字内容,进一步提高p d f 表单的应用质型圳。 中国香港特区政府1 9 9 9 年就在国内率先使用a c r o b a t 来管理每日数以千计的政府公 文以及档案,在将所有文件转换成a d o b ep d f 文件后通过内部电子邮件系统( 如l o t u s n o t e s ) 或i n t e m e t ,以附件形式传送至港府各政策局及部门,全面实现了无纸化办公, 既保护了环境,又提高了工作效率,为政府和企业树立了榜样。香港公务员事务局的发 言人表示:“加速文件的发送以及简化接收程序十分重要,自从采用了a c r o b m 后,我们 能够比以往更快速地将资料传送到各部门,并且确保这些文件仍保持原有格式【3 1 1 。 山东省政府大力提倡在政府内部网中应用p d f 格式传送文件,在运用了p d f 标准 后,政府的办公效率得以迅速提高,并减少了开支p 2 j 。 相对于政府部门及其他行业,煤炭行业的文档管理技术还相对落后。据调研,国内 5 西安科技大学硕士学位论文 煤炭行业目前很少使用p d f 格式的电子文档技术。 目前,动态生成p d f 文档的技术研究可分为两类,第一类是在p d f 模板上进行包 装,典型代表是采用a d o b e 公司提供的f d fa p i ;第二类是直接生成p d f 文档,典型 代表是采用i t e x t 的j a v aa p i 。利用a d o b e 公司提供的f d f 开发工具来动态生成p d f 文档,不用分析f d f 文件的结构。f d f 开发工具是用来编写服务端应用程序的开发接 口( a p i ) ,产生或分析由a c r o b a t 工具创建的表单中的f d f 数据。i t e x t 是一个免费的 类库,用来创建只读的,与平台无关的,可含有文本、列表、表格、图像的文档。与 f d f 的j a v a 开发工具比较,i t e x t 类不涉及到f d f 的内容,直接生成p d f 文档,生成 的文档可以直接输出到安装了a c r o b a tr e a d e r 插件的浏览器中阅读【3 3 1 。本课题的研究采 用的是第一类。 1 5 本论文主要研究内容 1 5 1 论文研究的课题背景 本论文研究的课题背景是陈家山煤矿4 1 6 t 作面通风安全数据跟踪与分析,该课题 针对4 1 6 综放工作面的生产情况,通过对该工作面各种生产、安全状况参数的采集汇总, 在数据跟踪分析的基础上研究和评价工作面安全生产状况。 项目研究的具体目标是: ( 1 ) 进一步明确4 1 6 工作面数据综合管理,提高工作面及采空区安全管理水平。 ( 2 ) 系统化保存通风安全数据和相关资料,为工作面安全回采技术分析奠定基础。 ( 3 ) 提高对4 1 6 工作面瓦斯、顶板及自燃灾害规律的认识。 ( 4 ) 通过全面跟踪、有效利用和综合分析4 1 6 工作面通风安全数据,建立有效预警, 不断提高工作面安全管理水平。 在项目研究的过程中,我们收集了工作面大量的通风安全相关资料,包括数据信息、 文字信息、统计图表。为了不让这些资料堆成积案杂乱无章,需要对这些资料进行文档 化管理,把资料中的图、数据、文字编制成报告,然后进行合理存储,形成报告库。 1 5 2 本论文的主要研究内容和研究目标 本论文主要研究内容是p d f 格式的智能化电子文档技术在陈家山煤矿工作面通风 安全数据跟踪分析课题的应用模式,将文字、数据及插图自动填入预制的模版中形成报 告,对报告进行有序存储和管理。研究技术路线如图1 2 所示。 6 1 绪论 开始 上 l 由工作面安全分析收集源数据和相关资料 j r - l用a c r o b a t 软件制作各类报告模版 1 l i 把所需源数据写入x m l 格式的数据文件,准备插图 上 l 把数据及插图自动填入报告模板,另存为所需要的p d f 报告 1 l l 设计和完成执行操作的程序及工作界面 j r 结束 图1 2 研究技术路线图 本论文研究的目标: ( 1 ) p d f 格式的图、数据、文字信息的打包长期保存调用; ( 2 ) a d o b er e a d e r 支持下基于图、数据、文字的报告编制。 ( 3 ) a d o b er e a d e r 支持下的图、数据、文字的综合查询。 7 西安科技大学硕士学位论文 2 1p d f 文档格式 2 1 1 概述 2 智能化电子文档相关技术 p d f 全称p o r t a b l ed o c u m e n tf o r m a t ,中文直译为“可移植文件格式”,是一种结构 化的文档格式。p d f 由美国著名排版与图像处理软件公司a d o b e 公司于1 9 9 3 年首次发 布,它对应的浏览软件是a d o b ea c r o b a t 【3 4 。这种文件格式与操作系统平台无关,也就 是说,p d f 文件不管是在w i n d o w s ,u n i x 还是在苹果公司的m a co s 操作系统中都是通 用的。这一特点使它成为在i n t e m e t 上进行电子文档发行和数字化信息传播的理想文档 格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件开始使用p d f 格式文件。a d o b e 公司打着“跨文字、跨语言、跨平台、跨媒体、跨软件、跨世纪的电 子文档交换格式以及“这就是未来”的口号,让它能够确保文字、图像文档不受计算 机软件环境的限制,成为一种易于交流的文档格式,并被广泛应用于印刷出版、电子出 版和网络出版,使它带有跨媒体出版的特点。它可以将原文档内的字体、影像、向量图 形转换成适合多种用途的文档格式,即同一文档可被应用于不同的输出方式,例如数码 打印、拼版、胶片输出、数码印刷、网上传送、浏览及电子书等。p d f 文档是一种开放 式电子文档格式,它的主要目的是要在各种不同的计算机平台创造出一个共通的文档格 式,就是希望不管在哪一种电脑上制作的文档,只要能转成p d f 格式,拿到另一种电 脑上就能毫无困难地打开阅读,更能维持当时制作的格式与版面,看起来跟原来的格式 一模一样。p d f 格式的出现,使一个文档在不同平台上畅行无阻,而且看到的样子都一 样,再也不用花力气把文档格式转来转去了 3 5 - 3 。 a d o b e 公司设计p d f 文件格式的目的是为了支持跨平台上的多媒体集成的信息出 版和发布,尤其是提供对网络信息发布的支持。为了达到此目的,p d f 具有许多其它电 子文档格式无法相比的优点。p d f 文件格式可以将文字、字型、格式、颜色及独立于设 备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音 和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。p d f 格式文件目 前己成为数字化信息事实上的一个工业标准1 3 w 9 1 。 p d f 文件使用了工业标准的压缩算法,通常比p o s t s c r i p t 文件小,易于传输与储存。 它还是页独立的,一个p d f 文件包含一个或多个“页 ,可以单独处理各页,特别适合 多处理器系统的工作。此外,一个p d f 文件还包含文件中所使用的p d f 格式版本,以 及文件中一些重要结构的定位信息。正是由于p d f 文件的种种优点,它在出版业中占 8 2 智能化电子文档相关技术 有重要的位置。 对普通读者而言,用p d f 制作的电子书具有纸版书的质感和阅读效果,可以“逼 真地 展现原书的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式。由 于p d f 文件可以不依赖操作系统的语言和字体及显示设备,阅读起来很方便。这些优 点使读者能很快适应电子阅读与网上阅读,无疑有利于计算机与网络在日常生活中的普 及。a d o b e 公司以p d f 文件技术为核心,提供了一整套电子和网络出版解决方案,其中 包括用于生成和阅读p d f 文件的商业软件a c r o b a t 和用于编辑制作p d f 文件的i i i u s t r a t o r 等。a d o b e 还提供了用于阅读和打印亚洲文字,即中日韩文字所需的字型包 4 0 1 。 p d f 的优点在于这种格式的电子读物美观、便于浏览、安全性很高。而且它支持由 x m l 动态生成p d f 格式文件,所以在网络上的应用范围越来越广。 p d f 可以用a d o b e 公司的a r c o b a tr e a d e r 软件( 该软件免费) 阅读。现在很多厂家的 产品也能够浏览p d f ,比如w i n d o w s 平台下的a p a b ir e a d e r 、f o x i tr e a d e r , l i n u x 平台下 的k p d f 等。 2 1 2p d f 的基本特点 ( 1 ) 可传递性。p d f 文件支持7 位a s c i i 码和二进制两种编码方式,可以正确地在 各种网络环境下传输。 ( 2 ) 平台无关性。p d f 文件具有软、硬件平台独立性。用户在不同的环境下( 如不同 语言的操作系统,不同的硬件平台) 看到的p d f 文件的版式和内容都与作者创作完成时 的情况完全一致。这个特点非常适合于信息交换。 ( 3 ) 字体无关性。p d f 文件中可以自带字体或字体描述信息,在用户的系统中缺乏 所需字体的情况下,仍然能正确显示。 ( 4 ) 支持多种压缩、编码方式,文件更紧凑。 ( 5 ) 支持交互操作。可包含交互表单和超链接。 ( 6 ) 支持声音和动画。 ( 7 ) 支持对页面的随机存取。 ( 8 ) 支持不断追加的修改方式,便于少量修改、提高效率。 ( 9 ) 安全性控制。支持各种不同级别的安全性,如只能阅读,不能打印和选择文字, 可阅读、可打印,但不能修改;可阅读、可打印、可修改等。这种安全性控制对保护电 子出版物的版权非常重要h 。 2 1 3p d f 中的坐标系统 坐标系统定义了一块在p d f 文档中绘制的区域。页面中的文字、图像和图形的方 向,位置和尺寸都由坐标系统决定。p d f 中常用的坐标系统如下: 9 西安科技大学硕士学位论文 ( 1 ) 设备空间( d e v i c es p a c e ) 在设备上的坐标系统就是所谓的设备空间。这种坐标系统具有与设备紧密相关的特 性,因为不同的设备不仅是尺寸上有一定的比例,而且在诸如方向等都不一样。所以 p d f 没有使用这种设备相关的坐标系。 ( 2 ) 用户空间( u s e rs p a c e ) 这是一种与分辨率无关的坐标系统。这种坐标系统在文档的每一页创建时就初始 化。通常,用户空间坐标7 2 单位英寸,大致与印刷上的测量单位( 点) 相当。y 轴的正 方向向上,x 轴的正方向向右。坐标的原点在左下脚。每一页的打印或浏览的区域的坐 标系统可以不相同。 ( 3 ) 文本空间( t e x ts p a c e ) 文本所在的区域称为文本空间。从文本空间到用户空间的变换通过文本矩阵实现。 ( 4 ) 字符空间( c h a r a c t e rs p a c e ) 在某种字体中的字符被定义在字符空间中。字符空间到文本空间的变换可以通过定 义的矩阵实现。对大多数的字体而言,除了总体比例因子( 当用户选择的字体大小变化 时,这个因子就发生变化) 外,这个矩阵的其它参数都是预定的。 ( 5 ) 图像空间( i m a g es p a c e ) 所有图像所在的空间就为图像空间。图像空间到用户空间的变换是预定义的,并且 不能改变。所有的图像在用户空间中都是l 1 单位的,而不管图像的采样数目是多少。 ( 6 ) 表单空间( f o r ms p a c e ) p d f 提供一个表单对象。从表单空间到用户空间的转换可以通过包含在表单对象中 的矩阵实现。 ( 7 ) 图案空间( p a t t e r ns p a c e ) p d f 定义了一类颜色叫做图案( p a t t e r n ) 。和表单一样,图案可以包含一序列的标记 操作符;这些操作符与p o s t s c r i p t 语言中的图案一样。图案所定义的空间就是图案空间。 从图案空间到用户空间的变换通过包含在图案中的矩阵来实现。 1 0 2 智能化电子文档相关技术 图2 1p d f 中的坐标系统关系 图2 1 给出这些坐标系统的关系,图中的每一条线都是一个坐标系统到另一个坐标 系统的变换。因为p d f 中的坐标系统彼此相关,因此任何一个变换都能引起几个其它 坐标系统中的对象的外观发生变化。比如从用户空间到设备空间的变换( c ) 将影响 用户空间的“逆流一f o 咖、t e x t 、i m a g e 和p a t t e r n 空间发生变化。 2 1 4p d f 的文件结构与页面描述 规范的p d f 文件由文档头,文档体,交叉参考表和文档尾四个部分组成,如图2 2 所示。 ( 1 ) 文件头( h e a d e r ) ,指明了该文件所遵从的p d f 规范的版 本号,它出现在p d f 文件的第一行。 ( 2 ) 文件体( b o d y ) ,p d f 文件的主要部分,由一系列对象组 成。 ( 3 ) 交叉引用表( c r o s s r e f e r e n c et a b l e ) ,为了能对间接对象 进行随机存取而设立的一个间接对象的地址索引表。 ( 4 ) 文件尾( t r a i l e r ) ,声明了交叉引用表的地址,即指明了 文件体的根对象( c a t a l o g ) ,从而能够找到p d f 文件中各个对象 体的位置,达到随机访问。另外还保存了p d f 文件的加密等安 全信息。 酌 、 h e a d e r b o d y c r o s s r e f e r e n c e t a b l e t r a i l e r , 图2 2p d f 文件的基本组成 西安科技大学硕士学位论文 p d f 文件的定义为: := p d f 页面描述就是一系列的图形对象,这些对象在当前页上绘制其具体形状。p d f 提供了五种图形对象: ( 1 ) p a t ho b j e c t :由直线、矩形和曲线组成的任意形状。 ( 2 ) t e x to b j e c t :由一个或多个能在页面任何位置,以任何方向放置的字符串组成。 ( 3 ) i m a g eo b j e c t :由一幅用特定色彩空间模式采样的图像组成。 ( 4 ) e x t e r n a lo b j e c t ( x o b j e c t ) :定义在s t r e a m 之外的对象。 ( 5 ) s h a d i n go b j e c t :在页面的一个色彩渐变的区域。 2 2x m l 数据文件 2 2 1 概述 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 源于s g m l 和h t m l 。s g m l 和h t m l 都 是非常成功的标记语言,但都存在缺点。s g m l 为语法标记提供了异常强大的手 段,同时具有很好的扩展性,在分类和索引数据中非常有用。但是,s g m l 十分 庞大复杂,仅规范说明就有5 0 0 多页,而且价格昂贵,几个主要的浏览器厂商都 明确拒绝支持s g m l 。这都成为s g m l 普及的障碍。 相反,h t m l 免费、简单,在世界范围内得到了很大程度的推广。然而,网 络发展至今,仅仅靠h t m l 单一文件类型来处理千变万化的文档和数据已经力不 从心,而且h t m l 本身语法十分不严密,严重影响到网络信息的传送和共享。 当w e b 设计者不满意于h t m l 的时候,希望出现一种功能更为强大的标记语 言。h t m l 只提供构造文档的很有限的元素集合,使用起来相当容易。当然,设 计者可以尝试使用浏览器专用支持的那些元素,但这样做会降低用户使用别种浏 览器的可能性。所以,大多数设计者认识到,如果想做更高级的东西,则不能使 用h t m l ,必须使用单独的脚本语言,或者一些通用网关接口脚本语言。但是, 使用这些工具并不能完全控制文档的真实结构,更不用说控制数据的结构了。 为打破这种进退两难的局面,x m l 出现了。x m l 是s g m l 的一个精简子集, 使用s g m l 以实现在i n t e r n e t 或i n t r a n e t 上传输信息之类的特殊功能,即继承了 s g m l 的强大功能和可扩展性。同时,x m l 也具有h t m l 的简单特性,因此x m l 文档能够很容易地在w e b 上使用,尤其在n e t s c a p e 和m i c r o s o f t 最新版本的浏览 1 2 2 智能化电子文档相关技术 器中添加了对x m l 的大量支持之后【4 2 4 5 】。 2 2 2x m l 的名称含义 x m l 名称的含义是掌握其来龙去脉的关键。x m l 扩展性标识语言,其中“扩 展性”、“标记 、“语言 每一个词都明确的点明了x m l 的重要特点。x m l 的第一个词是“扩展性,这正是x m l 具有强大的功能和弹性的原因。在h t m l 里,有许多固定的标记,人们必须记住然后使用它们;而在x m l 中,人们能建立 任何需要的标记,给文档起一些好记的标记名称。扩展性给了人们更多的选择, 但同时也产生一个问题就是人们必须学会规划。人们必须知道文档由哪几部分组 成,相互之间的关系以及如何识别这些部分。这就涉及到x m l 中的模式定义文件。 x m l 的第二个词“标记表明了x m l 的目的是标记文档中的元素。标记的 本质在于方便理解。如果没有标识,无论是h t m l 文档还是x m l 文档,在计算 机看来只是一个很长的字符串,每个字符都一样,没有重点之分。通过标识,文 档才便于阅读和理解。在x m l 中,人们可利用其扩展性为文档建立更合适的标识。 “语言”是x m l 中的第三个词。这表明,作为一门语言,x m l 必须遵循特 定的语法和语义规范。尽管x m l 的扩展性允许新标识的创建,但仍然必须遵循基 本的语法规范。人们把遵循x m l 语法规范的x m l 文档称为结构良好的 x m l ( w e l l f o r m e dx m l ) ;把既遵循x m l 语法规范,又满足语义要求的x m l 文档 称为有效的x m l 文档j ( v a l i dx m l ) 。由于本文的工作从p d f 文档导出的x m l 格式数据文件结构良好且满足语义要求,所以本章关注的是v a l i dx m l 文档。v a l i d x m l 文档中最重要的成分是模式定义文件【4 5 卅。 2 2 3x m l 的结构 图2 3 是一个简单x m l 文档,以此为例说明x m l 文档的结构特征。 结构良好的x m l 文档的定义形式是一个树型结构。该树型结构有且只有一个 根节点,称为文档根( d o c u m e n tr o o t ) 。这个节点总是包含子元素树,而且可能包 含注释。子元素树的根称为根元素( r o o te l e m e n t ) 。根元素是这个树中其它所有 元素的父元素。值得注意的是,文档根和文档的根元素不能等同,在图中的文档 的根元素是f i e l d s ,它和x m l 声明都是文档根的子节点【5 0 巧2 1 。 x m l 树和其中的父子关系是x m l 的一个非常重要的特征。x m l 树中大致可 以分成4 种不同的节点:元素节点( 如“f i e l d n a m e ) 、文本节点( x m l 元素标 记之间的字符数据,如“a s p o s e c o m ) 、注释语句以及处理指令。 从图2 3 中可以看出,x m l 文档的大部分内容都是元素和文本节点。文本节 点是x m l 文档的数据部分,元素节点是结构部分。一般来说,应用程序主要对元 1 3 西安科技大学硕士学位论文 置i 暑i i 暑昌宣昌宣宣;i i i i i i i 暑i i i i i i i i 宣i i 暑宣萱i i 宣i 宣i 宣i 宣i 宣昌宣宣iiif ii i i i j i 暑宣昌宣i 宣暑宣言;i i 置暑宣宣 素节点和文本节点进行处理。 2 3x f d f 数据文件 图2 3x m l 文档示例 p d f 文档包含交互的表单。这些交互表单有许多表单域,如c o m b o 、t e x tb o x 、 和r a d i ob u t t o n 等。可以将这些表单域的值存储在单独的文件中,这种文件就是 f d f ( f o r m sd a t af o r m a t ) 文件,它以k e y p a i r 的方式存储数据。目前,f d f 文件仍 然在使用,但是a d o b e 也提供了一种x m l 编码的形式的f d f ,即x f d f 。x f d f 文件使用x m l 标签以层次结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论