【毕业学位论文】(Word原稿)自主版式科研论文共享交流平台研究研究与实现专门针对科研人员需求的在线科技论文编辑排版和共享平台_第1页
【毕业学位论文】(Word原稿)自主版式科研论文共享交流平台研究研究与实现专门针对科研人员需求的在线科技论文编辑排版和共享平台_第2页
【毕业学位论文】(Word原稿)自主版式科研论文共享交流平台研究研究与实现专门针对科研人员需求的在线科技论文编辑排版和共享平台_第3页
【毕业学位论文】(Word原稿)自主版式科研论文共享交流平台研究研究与实现专门针对科研人员需求的在线科技论文编辑排版和共享平台_第4页
【毕业学位论文】(Word原稿)自主版式科研论文共享交流平台研究研究与实现专门针对科研人员需求的在线科技论文编辑排版和共享平台_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第一章 绪论 究背景 当今社会,科学技术 已经成为社会发展的核心力量和社会发展强有力的思想武器和创造手段 , 科技实力将直接影响国家的综合国力水平 。因此,世界各国特别是经济和军事大国都逐步加大了在科学研究方面的投入 1我国正处于经济水平不断提高、社会不断发展的阶段,更是需要继续坚持把科学技术作为最先进的生产力提升到国家发展战略的高 度 ; 同时 在发展科学技术和促进科 学研究 成果转化方面 也 加大投入,十二五规划纲要在发展目标上也突出强调了科技教育。 科学研究是指为了增进知识 ( 包括关于人类文化和社会的知识 ),以及利用现有知识而 去发明新的技术而进行的系统的创造性工作。现代科学技术的进步甚至人类社会的发展都跟科学研究密不可分。 科技论文是创新性科学技术研究工作的科学论述,是对科学研究成果的记录和总结,同时也是科研工作者 学术成果发表的原始媒体 和进行学术交流的重要 手段 ,因此,撰写具有高可读性和美观的科研论文十分必要。科研论文 可以作为科技部门进行科技决策, 以及科研人员考核的参考和依据。 文档排版就是对文档进行格式的设置,包括对页面、文字、多媒体等元素进行格式化,使其美观和便于阅读。对于科研工作者来说,为了更好的进行学术探讨和交流,对科技论文的编排 和管理也成为了一项必要地工作。而熟练使用科技论文撰写和管理的工具是高效进行科研论文撰写和编排的必备技能 。 目前,最为流行的科研论文撰写工具为 列软件,如 山 以及基于 统发展而来的 档排版系统 , 各出版机构或国际会议征稿都会提供 式的模板和 式的模板。在应用方面,他们在易用性和专业性上 突出了各自所具备的特点 。 同时 都作为 单机的桌面应用程序 ,也大体上决定了各自的应用 范围 。 近年来,随着虚拟化技术的发展 以及云计算的推广 , 在线电子文档编辑环境也逐步推广开来 ,例如微软的在线 办公软件 在线文档 编排与共享系统 百会 在线和移动办公以及 易度 云办公 及文档管理平台 ,这些都是提供网络存储和在线文档管理的编排平台。在相当长的时期里,这些在线文档编排平台给用户提供了相当多的方便;同时作为通用在线电子文档编排 环境的先驱和代表,对后来在线文档编排环境的研究与开发具有重要的指导意义 。 2 究现状 到目前为止,对于 在线文档编排 ,国内外都有一些相关的研究,以及一些产品的雏形。大多数都是理论研究或者方法的提出,有的是针对特定系统做的部分研究,还没有一个完整的通用的平台的实现,科研在线以及 只是部分功能的实现。 现有的绝大多数相关研究都是针对单一平台,单一格式论文排版的研究。有针对数字图书馆文档系统的排版设计,以及针对高校毕业论文排版系统的设计,这些研究都在单方面为解决相关问题做出了相应的贡献,但不是针对通用 论文排版而设计的,对于不同的排版模板,这些系统就显得捉襟见肘。 以下是 在线论文排版相关的系统实现,这两个最具代表性: 科研在线是面向科研团队需要的协同工作和知识分享平台,提供协同编辑、信息发布、文件文档上传和整理、文献共享、知识积累、沟通交流等在线服务。科研在线拥有简洁而实用的内容发布、组织和分享工具,强大的协同编辑和沟通机制; “ 云端 ” 服务方式使用户可以随时随地查找资料、参与协作,同时也免去了维护系统的麻烦。 该系统 可以通过科研在线官方地址 :2013当前版本 如 图 1示 , 目前,科研在线服务平台共包括了科研主页、文档库、会议服务平台、实验室信息系统四个产品 :( 1)科研主页,旨在为科学家和科研机构提供个性化的主页服务,包括学术主页(面向个人)和机构主页(面向团体)两大功能。( 2)文档库,是面向团队的文档协作与管理工具,帮助团队随时随地协同分享与交流。( 3)会议服务平台,是会务信息化管理云平台,帮助用户轻松办会。( 4)实验室信息系统,帮助用户快速搭建网站形式的团队协同工作平台。 图 1研在线当前版本门户 3 一个在线的创建、分享和编译 档的平台,平台支持如下特性: a) 协同:与其他人分享文档和协同工作; b) 版本控制:随时查看文档的所有变化; c) 离线支持:支持离线工作和网络同步; d) 译器:编译 文件生成 件供查看或下载; e) 富媒 体:包含图片,参考文献和自定义样式文件; f) 文档存储:在线存储和访问; 用户可以上传本地的 档到网络空间,具体的空间大小分为三个版本,如下表: 版本 费用 项目数 每个项目协同 用户数 存储空间 免费版 0 3 1 50本版 $月 10 5 600级版 $月 无限制 无限制 1有的版本都包含 译环境,文件存储,文件更改历史, 本控制。 该系统的访问地址为: 2013如 图 1示 ,实现了在线 辑和编译以及简单的协同编辑功能 。 图 1能图 4 究目的和意义 科学技术是推动社会发展和变革的重要因素。目前,世界各国都提出要大力发展科学技术,科学研究已经被提升到了一个 战略的高度。科技论文作为科学研究成果的总结和记录媒体,对科研工作者进行学术交流起着重要的作用。而规范美观的科研论文排版,是有效进行科学交流的必要条件。现有的文档排版工具主要有 列软件和 列文档排版系统,他们都有各自的特点: 从排版的方式来看,现有的文档编排工具主要分为所见即所得的方式和宏命令方式,流行的主要有 列软件和 源系列排版系统。前一种编辑方式的特点在于编辑视图中显示的文档样式跟 文档最终呈现的视图结构是 完全一致的 ,同时允许作者在该视图上直观的编辑文档中的对象的样式和 值;而宏命令的方式则不太一样,编辑视图中的文档需要经过处理后才能展现出最终的文档样式,对文档编排的专业性要求较高。 利用 容易生成高质量的 件, 并能够很好的打印输出 。 由于 处理复杂的数学公式 排版相当在行 , 它在学术界 特别是 在自然科学领域 很受欢迎 。 列软件是常用的桌面必备工具,而 列排版系统在科学排版和出版行业拥有较大的市场占有率。前者 对文档的编辑提供直观的视觉反馈, 在易用性和实用性方面占优势, 因此被广泛应用在通用文档的编辑中;而后者在专业方面有着突出的 特点,以 其强大的排版能力和数学公式处理能力被学术 界和出版界所认可,但因使用 专业性要求较高 ,加之不能 直观校对 编辑 的文档排版样式 , 难以在通用文档编辑方面推广 。 从编辑的环境来看 ,分为 单机 桌面应用程序、 用程序 和 智能移动终端应用 这三种方式。分别以 列软件 、 微软的在线 统上的 to 及 的代表。 从传统的字处理软件演化 过来的桌面通用文档编辑器,文档排版方便快捷,符合大量用户的使用习惯。 但 在使用前必须安装桌面应用套件,比如微软的 件,这里面可能会面临版权和收费的问题。同时依赖本地存储,不能网络共享,无法随时随地工作 。 基于移动终端的应用目前也日趋成熟, 旨在为作者提供无所不在的编辑 环境,但由于智能终端有限的处理能力、存储 空间 和显示操作区域,该方式在文档 编辑性能和文档查阅等反面 则显得有些力不从心。 从文档 的管理来看 ,分为 操作系统 的文件 管理和 在线 文档管理两种。 对于桌面应用来说,使用操作系统的图形化文件管理功能相当适宜, 但是文档很难直接在网络上访问。同时 文档管理不具备生命周期管理,版本管理等功能 。 而后者 像网络硬盘以及 样的企业文档管理服务更多的是 专注文档的 高效存储和5 访问、文档的权限控制、文档的安全控制、文档的分类管理以及文档的版本管理等 ,但是却不提供 在线的 文档 编辑和排版 功能 , 只满足了文档的网络访问的需求 。 从文档 的 共享来看,目前的 科技 论文共享 平台 多为各大 科技 文献数据库系统,这些系统虽提供了 文档的 局部共享, 但是并没有直接和科研论文的编排联系在一起, 一个具有单一 共享检索 功能的独立数据仓库。 当前市场上的主流通用文档编 辑的软件或应用,各自特色鲜明、应用广泛,但都不是专门针对科研工作者设计的,都在不同方面存在着各自的局限性。 本 论文 旨在研究与 实现 专门针对科研人员 需求 的在线科技论文 编辑排版和共享 平台 。搭建 科技论文的云 端 存储 平台 , 提供多种灵活的科技论文在线编辑排版方式, 建立科技论文在线共享与交换机制, 实现 科技 文档内容的 版本控制 、 协同编辑与管理, 同时提供科技论文相关研究领域的投稿推荐参考方案 。 通过本 文 项目的 实施 ,首先 ,实现论文的排版模板系统,可以为科研工作者论文排版提供方便 ,把科研人员从繁重的 排版 整理工作中解放出来,从而有效提高科研人员论文 撰稿效率 ; 其次,实现科研论文的在线 存储和管理, 达到用户可以 随时随地进行科研论文 的管理与访问 ;第三, 实现在线文档 协同编辑 功能 ,解决不同地域研究人 员同时编写科研论文的难题,能够有效提高科研成果的交流和合作。 第四,实现单文档的版本控制,用户可以随时将现有文档存为新的版本,以备在必要的时候将文档恢复到当时的状态。 第 五 ,设计了科研论文的投稿推荐方案,为科研工作者提供 近期 相关研究领域 征稿机构的参考。 究内容 结合现代科研论文撰写的特点和需求,本文针对当前通用文档编辑软件的的局限性,研究支持自主版式的科研 论文编排与共享平台: 第一,实现在线科研论文 编辑和 自动排版功能。对于科研人员来说 , 科学研究是其工作的重要内容,而作为科学研究成果的承载媒体 和学术交流的手段,科研论文的撰写也是科学研究工作的必要环节 。 科技工作者 一方面 需要 以 论文 的形式详细阐述科研成果的具体内容 , 另一方面还要花费一定时间按照指定的编排方式对学术成果论文进行排版 。当前,几乎所有的 出版机构都有自己的排版格式,使得论文排版在科技论文的投稿发表中占用了较多的时间 , 对于一篇论文多次投稿的情况来说,编辑排版 在一定程度上 加 重了科研工作者的 工作 负担。同时,科技论 文与一般的电子文档的编辑排版不太一样,尤其是对于自然科学工作者来说 ,其 论文中包含大量的数学符号和公式 ,这样就更加加大了论文排版的工作量 。6 因此迫切需要 具有论文自动排版功能的编辑系统,使科研人员 能够从 重复 排版 的工作中解脱出来。 第二 , 实现 科研论文版本 存储 和 版本 管理功能。 撰写科研论文是一个使文档内容不断变更的过程,很可能是对于文档内容的大幅度删改的情况 。 如果在多次变更后还想查看最初的文稿的内容,在一般情况下很难实现,现有的做法是在不同时间将文档进行备份,这就导致了文档的冗余及版本繁杂。 而版本控制系统版在空间上可以 实现集中统一管理,解决一致性和冗余问题,在时间上全程跟踪记录工具将会自动记录开发过程中的每个更改细节 和不同时期的不同版本。这在一定程度上可以解决冗余、事务性处理并发性问题。 因此,提供版本控制功能的论文编辑系统,可以使用户随时将当前文档内容提交为新的版本,以便在任何时候回退到历史版本的状态。 第三, 实现科研论文协同编辑的功能 。 现代社会各行各业都需要合作与交流 ,而科学研究 对社会发展 起着 巨大的促进作用,自然少不了进行协同和沟通。 随着科学研究的深入和科学技术的发展,人类科学研究的领域也不断的扩展,科学研究也逐步呈现 出多学科交叉的特点。 同一个科研任务可能需要多领域 的专家学者合作研究,而作为科研成果记录的科技论文,同样需要多人协作进行撰写和修改。 第四 , 实现科研论文的 高效 存储和检索 。 随着网络技术和移动计算的发展和推广,人们随时对地对网络和数据的访问也变得越来越普遍。 对于科研论文来说也是一样,科学工作者也需要随时随地能访问自己的科研数据和资料 ,并对其进行高效的管理 。 对于在线编辑排版系统来说,网络存储是其必不可少的功能 ,而对于科研人员来说,希望能便捷的找到自己想要的资料,因此,高效的内容检索方案能提高系统对用户的服务质量。同 时根据文档和数据的关联性 而对 文档进行的分类管理 , 以及如何保障文档的安全性 也是我们需要重点关注的问题。 第五,实现科研论文的投稿推荐功能。 当前,搜索科研论文征稿机构的平台主要是类似于百度和 样的全文搜索引擎,然而,对于同样的事物,使用同样的搜索引擎,不同的人搜索出的结果不一定完全一样。而对于科研论文的征稿机构来说,我们需要从海量的数据中去筛选我们想要的几条或者几十条数据,这对于科研工作者来说, 是一项繁琐的工作,我们希望能在通过搜索引擎的相关信息和时间过滤后的有效结果集中,查找我们感兴趣的数据,比如 说论文投稿。 第六 , 实现论文编排平台对移动终端的支持 。近年来随着普适计算技术的发展, 以及移动通信技术的推广,现有的移动设备的处理能力也越来越强劲。同时随着网络通信技术的发展和广泛应用,我们几乎可以随时随地进行网络和数据的访问。 7 文结构组织 本论文共分为五个部分,每部分的 的主要内容 概括 如下: 第一部分 阐述了 相关 研究 背景 、 国内外研究现状,以及搭建台的 目的及意义,引出本文的具体研究内容。 第二部分 介绍了本文相关的学科理论以及相关的实现技术 ,为后文介绍台架构以及相关模型和算法打下基础 。 第三部分 介绍了 台的整体架构, 也是本论文主要工作内容 的依托 ,详细介绍了整个平台相关功能的 设计 。 第四部分 是 详细描述了本论文在理论研究上的算法和模型 ,也是作者在台设计的基础上作的进一步深入研究 。 第五 部分 是对本文工作的总结,以及对下一步工作的展望 , 是 对现有工作的优势和不足进行分析,同时提出下一步的工作计划 。 8 第二章 相关 技术 在上个世纪六十年代的时候, 研究人员得出了必须采用一种遵守特定规则的通用文档格式才能 提高系统的移植性的结论。这个结论成了构建这种文档描述语言 指导思想,初衷是为了解决不同系统中文档格式不同的问题。 一种文档格式化的宏描述语言,用于对文档部件和文档部件之间的关系进行描述。就像现在的 的文档格式一样, 不同的文档标题级别来区分章、节、小节、段落等文档部件 。 下: : 标题一 第一章 绪论 : 标题二 究背景 : 段落 本文的研究背景介绍 : 无序列表 背景一介绍 : 无序列表 背景二介 绍 出现, 最直接的好处是为文档操作人员提供了方便,他们不再为每一个需要打印的文档进行格式化,而只需要为异构的设备比如说打印机,显示屏等提供相应的文档格式配置文件,文档就可以针对不同设备进行格式化。 在 文档移植性的基础上,在 1986 年, 展成为了一个国际通用的文档描述标准 后的文档标记语言的构建大多基于标准通用的标记语言。 最常见的是 在 1989 年有欧洲粒子物理研究中心的研究 人员开发的基于 成了 许多优点,比如结构化,实现独立和可描述等特性 ,用来表示网页文档中的文字、声音、图形、动画等页面元素 。 档示例如下: 示例文档 标题一 9 段落文字 随着互联网的发展, 的 数据日益增多, 身的固定的有限的标记以及对内容显示的侧重的特点,在文档表现上变得越来越不灵活。 从 1996 年开始 始设计一种可扩展的标记语言,使他能够将 灵活、可扩展性和已经广泛应用的 合起来。 可扩展标记语言) 从此诞生 5, 参见 方网站 2013在后来的发展当中, 步发展成为一个强大的家族,它包含了文档的模式、样式、查询、解析等多种技术。 以下是 一个简单的 关于本论文的 档实例 钌 1988线科技论文编辑和自动排版平台研究 由上可以看出, 一个结构化的可扩展的纯文本文件。 具体特点可归纳如下: 1) 可扩展性 ; 继承 用性的标记语言 , 他允许用户自定义自己的标签 (例如 的 ) ,同时自己解析所定义的标签的含义,而不是像 样固定有限的 标签集。 重于描述 面的显示结构,而 更加强调所描述文档的内容。 2) 自描述性; 在一个 档中,通常会包含本文档类型的一个声明,这样不但人工能够容易的识别出 档类型,同时计算机也能很方便地进行数据的提取、分析和处理,数据的可操作性强 。 3) 结构化 ; 对于一个完整的 档描述,一般包含几个方面的内容,一方面是文档类型定义,他描述了文档的结构,数据的类型等;另一方面是 按照定义的结构描述的数据;另外就是文档的表现形式,这个有 完成。 这样 述的数据不但结构清晰,而且类型严 谨,表现与数据分离,数据的可重用性高 10 4) 简明性; 它继承了 功能, 同时与简明应用广泛的 但功能强大,数据描述性高,而且结构简单,并且可读性好,易于处理。 5) 通用性 ; 仅可以支持几乎世界上所有的语言,同时由于其本身是单纯的文本文件,它可以在不同的平台之间通用;同时由于 文档的显示交给 处理,这样大大提高了 可重用性。它是一个独立于应用系统和平台的通用数据交换和传输格式。 着 计算机和网络技术的发展,互联网成为了人们信息发布管理和交流的重要平台, 当时在网页上面直接显示一个数学表达式还是一件不可能的事情,因为计的初衷是能够显示网页内容,并没有针对数学表达式定义特殊的描述方式。一个通用的做法就是将数学表达式转换成图片,然后将图片嵌入到网页中,来实现在网页上显示数学公式,然而一个图像表示的的数学表达式传输数据的大小,往往是一个文本表示的相同的数学表达式的数据大小的十倍甚至上百倍。对于现在来说,可能在页面访问体验上没有多大的差别;然而,在早期网络带宽相对较小的情况下,这样的网络传输的延迟是无法忍受的。 正因为以上这些需求,促使了文本数学表达式描述语 言的到来。 在 1999 年 7 月,万维网组织发布了基于 数学表达式描述语言 言规范 目的是为了解决数学表达式在网络中表示、传输和在不同应用和平台上进行数学表达式数据交换的问题 2013在 2001 年 2 月, 本发布,对 行了符号集的扩展以及技术集成 ,在信息发 布、科研和出版等领域起着重要的作用 。在 规范中,包含了对 档对象模型 的 处理。在今后的近十年的时间里, 不断地完善和改进,在 2010年 10 月, 言规范的 本发布。随着 不断发展,相应的各种针对 编辑和转换器也不断产生 ,各种厂商的浏览器支持也不断实现。 供两种描述数学公式的标记: 记和 记。记和 记都可以完整地描述任何一个数 学公式,但二者的侧重点不同: 记主要是用来描述抽象数学符号的二维结构,相当于一个数学符号构建器,把数学符号的语法结构表现出来,侧重于数学11 符号的显示。 记主要是用来描述用于计算和处理的数学信息,侧重于数学符号或数学表达式的内在数学含义。 是两种单独的语言,可以将它们混合在一起。每个 达式针对一个给定的 现程序,都有一个默认的表示,您可以自由地在 使用 目。只使用纯文本(通常是单个字符)作为 号元素 内容是很常见的做法。实际上,可以使用任意的 达式,可以是由多个标识符组合而成的。 图 2元二次方程根式 所示的数学表达式,其 示代码见下方, 其表示方式是将根式转换成具有语义的含有两个元素的集合来表示。其 示代码见下方,其表示方式是将根式的所有元素原样表示出来。 根式的 记代码 x b 12 b 2 4 a c 2 a b b 13 2 4 a c 2 a 根式的 记代码 x = &#b &#b 2 14  &#a &#c 2 &#a 由上可以看出, 示 是能够将一个数学表达式的数学含义表述在代码当中,如 都是数学四则运算的操作符。 而 示是通过行列的方式来表达一个数据块的在二维空间上大的位置,以此来表示一个数学公式的直观显示,如 。 一大目标是在 面中以文本的表达方式显示数学表达式 。 目前对于主流的浏览器来说, 不支持 表示的数学公式,使用 话,需要安装 供的免费浏览器插件 2013,而使用 则需要安装相应的字体,参见2013 及其他没有显式 持的浏览器 可以通过添加 方式来实现 。 由 式开发的一种通过原型实现继承的基于对象和事件驱动的具有安全性能的广泛应用于客 户端 发的脚本语言。它是一种动15 态、弱类型、基于原型的语言。 6。如今广泛应用于响应客户端操作和网页特效、表单验证以及动态网页的制作等。 以下是 一个简单的 来做表单验证的 实例 ; if(= 输入不能为空 ”); !( /w+$/) 只能输入数字字母和下划线及其组合 ”); 信息输入 : 在互联网出现的早期,网络带宽是极其珍贵的资源,传输速率非常低,在这样的情况下,如果在客户端填写的表单在提交后由服务器端来进行验证的话,这样可能会出现很多次无效的数据的网络传 输,一方面占用了网络带宽加重了网络负载,另一方面对数据的有效性验证及用户体验上面也有着相对严重的缺陷。 这也是催生 一大。在这样的背景下产生的 有如下几方面的特点: 16 1) 解释执行; 像其他编译型语言一样,需要经过编译过程之后才能执行,他是在程序运行的过程中, 有浏览器 分段逐行解释执行的 ,所需的 平台 只有支持 浏览器,不需要额外的运行环境 ,现在几乎所有的浏览器都支持 2) 基于对象; 是一种完全面向对象的 语言,在 ,对象更加强调的是一种复合的数据结构, 而不是新类型的一个实例,在没有类的概念,也不能创建新的类型,而只能创建基于现有类型的复合对象,而以这样的对象为模板,创建新的对象实例。 置对象的属性和调用对象的方法。 3) 数据安全 ; 被允许 访问本地的硬盘, 同时 不能将数据存入到服务器上, 也不能对网络上的文档进行更改和删除,只能实现客户端临时数据的操作,比如动态信息的展现,异步数据的加载等。 4) 动态语言; 初被设计来处理客户端的表单验证,在网络带宽非常有限的条件下解决有效数据的验证和传输的问题。 它可以 在不经过务器的情况下 直接对客户 端以事件驱动的方式 做出响应 。 5) 浏览器相关; 依赖于具体的操作系统平台,与底层架构无关 ,与操作环境无关, 浏览器才是解释和执行 码的关键器具 ,只要能运行浏览器 支持 浏览器 , 码 就可正确执行 。 随着互联网的发展和网络技术的推广, 用程序也变得越来越流行,原生的 越来越不能满足高效开发的需要,于是出现了各式各样的发框架和类库, 是其中之一。 架的作用就是将传统原生 行封装, 达到简化代码,提高开发效率的目的。举一个简单 的 例 子 , 对 于 使 用 原 生 的 行 个方法,在 只需要引入在引入 库之后执行 $(“#就可以实现同样的效果。自然使用开发框架的好处不是简单地减少输入代码的字符数,更多 的是对一些常用功能进行封装,比如对于异步请求的封装,在原生的 中创建一个 象也需要近十行代码,而在引入了 之后可以直接使用 $方法向服务端提交异步数据请求。 同时 架也对 作,浏览器兼容等各方面进行了封装,从 17 上个世纪七八十年代,美国著名的计算机科学家高德纳教授在出版他的计算机巨著计算机程序设计艺术(英文版为 rt ,对当时的印刷排版质量不满意,在当时还没有一个更好的排版系统的情况下,高德纳教授决定自己编写一个适合于出版的排版系统。在那以后的十来年中,高德纳教授不断地改进和完善这个系统,直到 1989 年,这个后来被称为 系统才停止了更新和修改。 一个极其稳定和完善的系统,在后来的几十年当中也很少发现系统的漏洞。 利用 统,很容易生成高质量的打印输出文件,而且对于数学表达式的排版非常精准 。因此,在 布后,在学术界和出版界非常流行,被普遍认为是一个顶好的排版工具,尤其是在科学文献的排版中优点突出。 在 后来的发展过程中,出现了一系列的基于 排版系统,他们大多数是对 行的封装和重用, 一种由美国计算机学家莱斯利 兰伯特( 开发的 基于 排版系统 ,参考 2013 使用 户可以在短时间内生成高质量的出版文档,而且对于科学表达式的和表格的排版尤为突出 7, 8。正式由于以上的原因, 排版精准上和易用性上都有着突出的特点,这使 为当今学术和出版界最流行和应用最广泛的排版系统。 以下是一个简单的带目录的分章节的文档排版宏代码: 1% 钌 版示例 % of 一章 公式示例 一节 行间公式 18 行间公式举例: %.(.) .$ $a2 + b2 = c2$, $(x) + (x) = 1$ 二节 行内公式 行内公式举例: %. . .$.$ $,2 = b b2 - 4 2a $ $ + c = 0$ 二章 其他示例 一节 其他示例 其他示例内容 上面文档经过 统编译以后生成的文档排版如下所示: 19 作为一个全球流行的优秀的排版系统, 版的特点可以总结如下: 1) 国际学术机构权威的排版格式,当前绝大多数的期刊、杂志、国际会议都会提供相应的 版模板,方便投稿者使用。 被认定为标准的科技论文编排格式。 2) 设计来处理复杂的科学排 版,在自然科学文献的排版中有着天然的优势,可以利用极少的宏命令处理及其复杂的数学表达式。 3) 版时可以很方便的转换成通用的 式的文档或者是 成的 档。同时 循 以排版质量为木匾的排版规则, 生成比其他排版软件的排版结果更加清晰美观。 4) 基于原生 统的宏命令排版系统, 统在应用的几十年中极少出现漏洞和错误,系统运行稳定。 对 命令编程的一种封装,可以用很少的命令来完成及其复杂的工作。也可以对 令进行封装和重新定义,便于用户使用。 5) 文件是文本文件,可以使用任何文本编辑器编辑,占用存储空间少,而且独立与平台,在不改变源文件的情况下, 可以在任何平台上进行操作和使用 ,得到的结果一样。 6) 免费开源的排版软件,你可以根据自己的需要在互联网上下载你想要的任何 发行版本。 一个开源的分布式系统基础架构,由 金会开发,使得用户可以在不了解分布式底层细节的情况下,开发分布式应用程序,充分利用集群的威力实现高速运算和存储 ,参考 2013其适合大数据的分析与挖掘,最为常见的应用就是 据分析 9。 是适合于部署和运行在低廉通用硬件上的高容错和高可靠的分布式文件系统, 其思想来源于 程师提出的 10。 有如下的特点: 1) 在线扩容 ; 用 构 ,其存储由一个 多个 成, 责所有 其相关数据块的分配和管理, 责数据的存储和访问。正因为如此, 需要进行系统容量扩展时,只需要增加可用的 数量,并进行简单的配置即可 ,系统自动进行在线动态扩容,无需任何人工干 预 。 20 2) 高度容错 ; 设计为允许系统故障,同时从多个方面来保证数据的可靠性,数据在 被存储为多个副本,默认为 3 个,而且副本在同一机架和不同机架都存有相同数据的副本,在数据读写过程过程中自动检测数据源以及数据的有效性,如果发现数据错误或者系统故障,自动选择新的可靠地数据源进行数据读写,同时在后台自动检测和维护数据的一致性,并将数据副本 数量 与 配置文件指定 的 一致 。 同时在设计中允许了系统硬件故障,在另一方面增强了系统的容错能力。 3) 大数据集 ; 针对一次写入多次读取的大文件而设计的 , 文件在完成数据写入之后就不允许再做数据更改了,这样就简化了并发访问时数据同步的问题,这样在很大程度上降低了系统的复杂性,保证了数据的一致性。因此, 适合高吞吐量的系统;同时流式的数据访问设计,使 美的支持大文件 数据的存取 。 4) 移动计算 而不是数据 ; 计算和数据在同一个地方是进行数据计算的理想状况 , 特别是在大数据集大计算量的情况下 。 这样既避免了网络拥塞,同时也 提高了系统的整体 数据 吞吐 率 。这个假定就是将计算离数据更近比将文件移动到程序运行的位置更好。 供了将计算移动到数据进行计算的接口。 5) 数 据正确性 ; 户端从数据节点上读取文件块数据时可能出现读取失败的情况,有可能是网络状况不好,或者是设备停止工作等原因 。 件内容校验,当从数据节点读取到的数据不符合校验码的验证的时候,客户端会重新从具有该数据块的副本的数据节点读取数据,知道读取到完整正确的数据。 21 第三章 台 设计 台架构 用如 图 3示的 B/S 架构,通过浏览器访问远端应用程序服务器的功能。系统功能结构 如 图 3示。主要包括几 个方面的内容, 科研论文的在线编辑,自动排版,版本控制,海量存储,协同编辑,文档检索和在线分享 以及移动终端的访问 。 因 特 网因 特 网应 用 服 务 器应 用 服 务 器数 据 存 储 服 务 器数 据 存 储 服 务 器图 3系统网络架构图 安 全 访 问 控 制W e b 访 问 门 户在 线 编 排版 本 控 制 与 管 理L a t e x 编 译 系 统海 量 数 据 存 储上下文感知检索用户系统日志系统过程管理与审核协 同 控 制图 3系统总体架构 22 用户的使用流程如 图 3示,用户通过注册、登陆、创建自己的文档,然后 可以对文档进行编辑,并对文档内容进行版本控制。也可以邀请其他人注册本平台,并且分享你的文档,使其他人可以跟你一起协作编辑和讨论你的文档。同时可以将你的文档分享在平台上,或者检索平台上其他用户共享的文档。 新 用 户注 册增 加 组 成 员登 录创 建 项 目新 用 户注 册登 录共 享 项 目E m a i 版 本 控 制编 辑实 时 协 同 异 步 协 作编 译实 时 协 同编 译编 译P D F 文 件 P D F 文 件P D F 文 件共 享共 享检 索检 索 管 理管 理图 3用户使用流程 统门户 系统门户为用户 科技论文 编排 、 管理 、共享等 提供一整套解决方案,如 图 3 W e b 访 问 门 户在 线 编 排用 户 系 统存 储 管 理版 本 控 制日 志 系 统文 档 检 索过 程 管 理编 排 协 作命令式向导式所见所得版本管理在 线 编 辑 器注 册登 录命 令 加 密 解 密 分 组文 件 管 理文 件 检 索文 件 存 取版 本 更 新版 本 提 交版 本 描 述描 述 修 改日 志 记 录日 志 输 出按 时 间按 作 者按 文 件 名分 类 检 索全 文 检 索修 改创 建权 限 管 理审 核定 稿归 档销 毁消 息 加 密 解 密文 档 权 限 控 制用 户 权 限 管 理即 时 消 息异 步 协 作实 时 协 同语 法 高 亮模 板 向 导向 导 应 用富 文 本 编 排在 线 科 学 公 式编辑转换版 本 树后 台 编 译结 果 预 览常用编辑工具权 限图 3系统门户功能图 23 户系统 主要提供用户的注册、登陆、及用户分组管理。 册 提供新用户 自助 注册本系统的功能。 陆 提供系统访问的登陆验证的功能。 组 对用户进行分组管理,不同分组用户的权限不同,系统提供的功能和访问接口也不同。 限 对不同分组的用户进行权限控制和管理。 志系统 为不同的用户提供不同级别的日志:为普通用户提供用户级日志,方便用户对自己操作历史的查看;为系统管理员提供系统级日志,便于管理和查看系统运行状态。 本项目采用类 实现系统和用户的 日志。如 图 3示 , 后的又一日志系统,虽然出自于同一作者,但 一些关键执行路径上性能比 升了 10 倍以上,而且初始加载内存也减少了。 日 志 系 统日 志 记 录日 志 输 出数 据 库文 件控 制 台客 户 端图 3日志系统框架 24 统日志 对于系统管理员提供的日志,记录所 有用户的登入、登出,以及各个用户对文件的新建、删除、重命名、版本提交、版本更新、版本管理、文档检索等操作的信息 ,以及系统运行的状态信息 。 户日志 对于普通用户提供的日志,记录用户自己登入、登出,以及用户对自己文件的新建、删除、重命名、版本提交、版本更新、版本管理、文档检索等操作的信息。 线编排 随着国家对科学研究的重视 1, 2, 4, 于高校毕业论文和学位论文的应用也逐渐广泛 12现有的高校学位论文排版已经有了基于 模板相关研究 15这些研究都是利用 解决电子文档的排版格式的问题,很好的发挥了 排版上的优势 8,却增加了排版作者的工作复杂度,对于高校毕业生,都需要学习 能更好更规范的 2完成学位论文,这可能会让撰稿者更少地关注论文本身的内容,而把一部分注意力转移到了 法以及相关环境的设置上面;同时相关的这些系统的设计 7, 18, 19都是局限于一种固定格式的论文文档格式,用户需要自己编辑 代码对齐进行修改,这样的情况,对于大部分高校毕业生来说,提出了需要更多学习和熟悉的要求。根据以上问题,我们提供三种不同的编辑方式:命令式,向导式和所见即所得式。命令式主要面向熟悉 法的专业人士;向导式作为本系统独创的编辑方式,主要针对不太关注排版细节的而注重文档内容的用户;所见即所得的编辑方式是为了兼容主流的文档编辑器的编辑方式。命令式编辑方式是通过在线代码编辑器,实现在线的 码的编辑同时,实现 码语法关键字高亮 20。所见即所得式,是通过在线文本编辑器实现文档内容的直观可视化编辑,特别是对于数学表达式的编辑,系统通过内嵌 1编辑器实现,作者在这个项目中工作一年半,对齐内部实现比较了解。向导式的编辑方式,是本文提出的一种针对格式化文档的全新的编辑方式,比如说论文,相应的排版模式比较类同,可以通过向导的方式来实现,同时既避免了 列软件编辑排版中的随意和偶然性,同时也能很好的利用 排版精准的特点,可视化的模板设计以及内容填充。 25 本系统 提供三种电子文件编辑方式:命令式、所见即所得式以及首创的向导式,以满足不同人群对于文档编辑功能的需求。不同的编辑方式通过异步请求与服务器端交互,如 图 3示,用户可以直接提交新的版本,也可以直接编译得到想要的文档排版。 自 主 版 式 在 线 编 排L a t e x 宏 命 令 式 向 导 式 所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论