计算机本科毕业论文-文档共享转换服务器的设计与实现_第1页
计算机本科毕业论文-文档共享转换服务器的设计与实现_第2页
计算机本科毕业论文-文档共享转换服务器的设计与实现_第3页
计算机本科毕业论文-文档共享转换服务器的设计与实现_第4页
计算机本科毕业论文-文档共享转换服务器的设计与实现_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要伴随着科技的进步和互联网技术的快速发展,人们对文档阅读已经由传统的纸质媒介向电子化信息进行了转变,文档阅读的形式也由以前的个人或群体在固定地点共同阅读向不受时空限制的互联网共享服务转换。不受时空限制的不同人在进行文档共享时,每个人或者每个群体都必须首先具备互联网终端硬件设备,然而由于在不同地点的人们所使用的计算机终端系统在系统版本、硬件更新、程序适用等方面会有所差别,就会造成同一个文档在不同的场景出现诸如打开错误、乱码等问题的出现。所以需要在不同群体参与的同一场视频会议、文件阅读等场景中提供一个完善的文档转换系统,以解决文档共享中出现的问题。文档共享转换服务器的设计与实现,能够让参与同一场视频或电视会议的不同终端共享一份或多份格式统一、内容完整、数据准确的文档,文档的格式可以是Word、Excel,也可以是PPT或者Txt等。通过对文档的准确共享,能够提供互联网文档阅读的准确性和时效性,也为现代化会议的正常进行提供了技术支撑。关键词:文档共享;转换服务器;设计

绪论研究目的伴随着科技的进步和互联网技术的快速发展,人们对文档阅读已经由传统的纸质媒介向电子化信息进行了转变,文档阅读的形式也由以前的个人或群体在固定地点共同阅读向不受时空限制的互联网共享服务转换。不受时空限制的不同人在进行文档共享时,每个人或者每个群体都必须首先具备互联网终端硬件设备,然而由于在不同地点的人们所使用的计算机终端系统在系统版本、硬件更新、程序适用等方面会有所差别,就会造成同一个文档在不同的场景出现诸如打开错误、乱码等问题的出现。所以需要在不同群体参与的同一场视频会议、文件阅读等场景中提供一个完善的文档转换系统,以解决文档共享中出现的问题。文档共享转换服务器的设计与实现,能够让参与同一场视频或电视会议的不同终端共享一份或多份格式统一、内容完整、数据准确的文档,文档的格式可以是Word、Excel,也可以是PPT或者Txt等。通过对文档的准确共享,能够提供互联网文档阅读的准确性和时效性,也为现代化会议的正常进行提供了技术支撑。研究内容(1)通过对文档共享服务的国内外研究,分析文档共享转换服务的主要需求。(2)MVC、OpenOffice等技术分析。(3)文档转换的任务流程。(4)服务器总体设计。文档共享转换系统的技术支持DOM和XPATH路径语言由于国内目前大部分互联网终端设备使用的是Windows系统,所以本文的文档共享转换技术需要基于Windows系统进行综合分析。DOM结构在终端设备中以树形结构呈现,其对数据随机储存和处理比较流程,但是其占用内存较多。所以,只能够对XML文件进行DOM分析,另外需要XPATH路径对分类文档进行分析,而后在使用DOM来对文档进行归类和解析,这样的操作流程较为恰当。I/O模型远程会议的互联网技术中所能够用到的I/O模型主要有两类:SELECT和IOCP。多为Windows操作系统中较为常见的模型,I/O模型的主要功能是通过对相关元素的函数操作实现的,因其具有选择功能,所以叫做Select。在远程终端设备中,因为多数操作需要在窗口进行,所以在此处使用IOCP模型较为恰当,该模型可通过信息的循环机制对多个窗口的多类信息同时进行处理,其模型图如图3.1所示。图3.1IOCP模型图示断点续传技术远程会议对文档的实时性和不间断性要求较高,所以在进行远程会议时,断点续传技术是必不可少的关键技术之一。由于互联网在运行过程中会受到环境、认为等因素影响,文档在传输和共享、转换过程中可出现网络中断、文件传输错误、失败等现象。断点续传的主要功能就是解决这些问题。断点续传的运行思维就是在网络运行的起始端自动的分为多个分区,而后对各个分区进行相应的顺序和信息标注,最终将此类标注文件模块向末端输送。末端在收到输送文档并对文档进行处理后。此类文档就会以Stream流的模式进行再传输。其具体操作流程如图3.2所示。图3.2断点续传起始端工作流程图示当末端接收到起始端传输的数据后,首先会对其长度进行记录,而后将相关数据写入缓冲区域,最后对数据模块发送传输指令,并最终将缓冲区域的数据转换为一个完成的文件格式。如果在数据传输过程中出现问题,需要对互联网进行重新连接,而后数据处理系统就会从最新收到的数据包开始进行数据的续传,并最终完成数据拼接。当这一操作完成后,再从数据流中对丢失文件进行恢复,然后将文件存入存储器中。其具体操作流程如图3.3所示。图3.3接收端工作流程图示文档共享转换服务器总体设计设计目标作为文档共享、转换和存储的服务平台,文档共享转换服务器能够为远程会议提供格式统一、内容准确、阅读实时的文档。(1)为远程会议提供文档转换服务。(2)为其他第三方应用提供转换接口。(3)规避不同类型终端设备对文档进行重复开发转换所带来的风险。(4)提升文档共享转换服务的质量和效率。系统架构基于互联网平台的文档共享转换服务器以分层模型为基础进行搭建,该系统主要分为以下四层,其具体功能如下图4.1所示。数据显示层:主要是对不同类型的文档进行分类管理,能够提供文档的在线转换和下载。业务处理层:主要功能在于对具体业务进行实时的处理,对出现的各种问题进行实时解决。数据访问层:该层是数据显示层与存储层之间的纽带,其主要功能在于文档的查询、用户的登录信息和转换进度等。数据储存层:顾名思义,存储的主要功能在于实现文档信息的存储、用户资料的存储等。图4.1文档共享转换服务器分层架构及功能图示文档共享转换服务器的设计与实现根据文档共享转换服务器的架构及各分层的功能,可将文档共享转换服务器划分为三个子系统模块。(1)文档处理子系统模块:主要包含有文档资料的上传和下载。(2)文档转换子系统模块:主要是文档的转换,包括格式、转码、翻译等。(3)文档共享子系统模块:主要是文档的共享,包括时效性、准确性等。文档处理子系统模块文档处理子系统模块的主要功能是文档的上传和下载、用户权限设置等。数据应用表格设计文档处理子系统模块的数据应用表格主要有使用者的数据信息表格和文档本身的数据信息表格。使用者数据信息表格:主要用来存储使用者的账号、密码、设置权限等信息,具体呈现如下表5.1所示。表5.1使用者数据信息表格文档数据信息表格:主要用于文档的存储、查重等操作,具体呈现如下表5.2所示。表5.2文档数据信息表格类设计理论在文档管理系统中,类设计理论主要涉及到文件的管理类和上传类,下图所示的5.1是其结构代码图。图5.1文档管理类设计结构代码图文档数据管理类: 。。。。主要作用:a、依据文档文件的命名、文档所属的类型、属性以及传输的时间等对其信息进行查询。b、对文档进行重命名,对文档能够共享以及保存的时效性等权限进行设置。c、根据需求程度对文档进行归类和删除。文档数据管理类的主要工作流程如下表5.3所示。表5.3文档数据管理类工作流程文档数据上传类: 。主要作用:a、对正在上传或已经上传的文档大小、类型等是否满足系统需求等进行检查。b、参考使用者账号等数据信息,对文档所在文件夹的根目录进行设置以便于后续文档的下载和转换。其具体工作原理如下表5.4所示。表5.4文档数据上传类工作原理文档转换子系统模块文档转换子系统模块是实现远程会议过程中文档在线转换的核心模块,更是整个文档共享转换服务器的核心功能模块,基于Windows操作系统的文档转换有多种模式,比如将PPT幻灯片或者word文档等转变为pdf格式文档,也能够将pdf文档转换为PPT幻灯片和word文档,还可以实现文档与图片之间的相互转换。其具体工作原理如下图5.2所示。图5.2文档转换工作原理图数据应用表格设计基于Windows操作系统的文档转换子系统模块中的数据应用表格设计主要涉及到的是:文档转换的记录表格和文档转换的任务表格。文档转换记录表格:主要是对文档转换的相关操作数据信息进行登记管理,具体操作的字段信息如下表5.5所示。表5.5文档转换字段记录表格文档转换任务表格:主要是对文档文件转换的时间信息进行登记保留,涉及到的信息主要是账号信息、命名信息等字段,具体字段如下表5.6所示。表5.6文档转换任务信息字段表格类设计理论在文档转换子系统中,类设计理论主要涉及到系统服务器原始信息类、在线文档转换类、文档在线上传进度实时查询类、可编辑类文档转换为PDF格式类、文档与图片相互转换类等5个方面,下图5.3是其结构代码图。图5.3文档转换系统结构代码图系统服务器原始信息类: 。主要作用:在启用文档转换功能后,Windows服务器就会自动参考互联网设备的相关配置对OpenOffice服务线程进行初始化操作,并对相应的文件储存路径进行设置。具体操作如下表5.7所示。表5.7系统服务器原始信息类在线文档转换类:。。 主要作用:根据用户需求和多媒体终端的配置等信息对文档进行在线转换,文档的在Windows操作环境中,文档转换主要是word文档转换为PDF格式和PDF文档转换为图片格式等。具体操作如下表5.8所示。表5.8在线文档转换类文档在线上传进度实时查询类: 主要作用:实时对文档在线上传的进度进行监控,准确的判断出文档上传是否成功并完成转换。具体操作如下表5.9所示。表5.9文档在线上传进度实时查询类可编辑类文档转换为PDF格式类: 。主要作用:将可编辑类的文档如word、txt、ppt等格式转换为pdf格式,此类操作主要依靠OpenOffice进行。具体操作如下表5.10所示。表5.10可编辑类文档转换为PDF格式类文档与图片相互转换类: 主要作用:将文档格式转换为图片格式,此类操作主要依靠ICE系统组件进行。具体操作如下表5.11所示。表5.11文档与图片相互转换类系统服务器的初始化和启用基于Windows模式下的文档在线转换主要依靠 当做应用服务器进行设置,对启用后,该应用就会自动读取存储中的属性文件。的主要存储内容包括:总服务器在初始端口的口令指数对进行初始化操作所需进程数基于Windows系统的安装目录在正常情况下,基于基于Windows模式的在线文档转换服务器会同时启用9个服务线程,每一个单独线程的初始端口号都不尽相同,计数指令从8200到8229不等,共有29个,全部储存于指令池中,当需要对文档进行在线转换时,服务器装置就会从指令池当中抽取暂时闲置的服务线程,在文档转换成功后还会把放回到原来的位置,当已经使用过的总线程数量达到指令池中的80%以上时,系统就会自动匹配加一个倍数量的服务线程,以避免因线程数不够而导致的系统瘫痪风险;与此同时,当已经使用过的总线程数量未达到指令池中的15%时,系统就会自动收回多余的线程并终止相关操作,以保证资源不会浪费。下图5.4是系统服务器的初始化和启用流程图。图5.4系统服务器的初始化和启用流程图文档检测系统服务器的末端在对远程上传的文档进行转换时,首先需要对系统存储中的所有文档进行检测,以查看正在转换的文档是否已经存在,如果存在就不需再次转换,如果没有就需要正常继续转换。这样的操作是为了避免文档上传重复,文档过多会对系统服务器带来巨大负担,可能会造成系统服务器的卡滞或瘫痪。下图5.5是文档检测的相关流程。图5.5文档检测流程文档操作的进度查询远程服务器中对在线文档的操作,主要涉及到文档的上传、下载、在线转换等。在系统初始端对文档进行上传操作后,远程服务器并不会立即对文档进行转换操作,而是不间断的向系统总服务器发出进行文档转换进度查询的相关请求指令,以确保刚上传的文档正在进行转换,一旦收到多于5次的相同进度反馈,系统就会默认此次文档转换失败;反之就是成功。文档的上传和下载的流程与此类似。下图5.6是文档操作的进度查询图示。图5.6文档操作的进度查询软件服务此处的软件主要是指包含word、ppt、Excel等的办公软件,因为在线文档主要就是这几类。当服务器接收到系统末端的请求指令时,对文档进行在线转换的服务器就会从办公软件指令池中寻找到单独的相对闲置的软件服务线程,以达成对文档的在线编辑和转换。系统初始化类设计:,系统服务器在这个类设计中对软件进行重新启用,同时依据系统配置等构建服务线程,此处线程的量主要依据还是服务器系统的配置和性能。远程文档在线转换主要是通过办公软件服务线程,把诸如word、ppt、pdf等不同格式、类型的文档之间进行相互转换。a、word转pdf,如图5.7.b、Excel转pdf,如图5.8.c、ppt转pdf,如图5.9.图5.7word转pdf格式例图5.8Excel转pdf例图5.9ppt转pdf例文档转图片文档转为图片主要涉及到pdf格式的文档转换为图片功能的实现,由于pdf格式文档和图片文件所占用空间和内存相对较大,所以在进行文档转换时,为了提升缩短转换的时间,减少用户等待时长,文档转换时需要对pdf文档进行拆解,单个转换,这样不仅减少了用户等待的时长,还会减少系统的内存压力,具体操作流程如下图5.10所示。图5.10文档转换图片流程文档的共享和查询远程会议的初始端管理人员或者其他与会人员,可以将需要让其他人阅读的文档上传至文档共享服务系统,同时可以对共享的权限进行设置,上传成功后,文档在线转换功能就会自动启用,检查文档的格式是否符合所有观看者的系统配置,而后根据不同需求对文档进行一次或多次转换,以供所有拥有阅读权限的人员进行观看。当远程会议中有人需要对文档进行下载时,系统就会自动匹配文档的MCU信息并发送给有需求人员,有下载需求的人员这时就会被请求提供欲下载文档的编号、名称等信息,提供后系统就会在存储器中找到该文档并将URL地址发送至有下载需求的人员。在服务器终端算,用户可根据URL地址将有需求的文档下载到用户电脑进行查阅,具体流程如下图5.11所示。图5.11文档共享查询流程文档转换图片的分页查询基于Windows系统的文档转换图片操作,主要依靠ICDpdf模块得以实现。在进行pdf转图片时,服务器会根据会议需要,将需要以图片格式呈现的诸如word、Excel等格式的文档统一转换为pdf格式文档,然后再将pdf格式文档转换为图片格式,并通过ICDpdf模块进行保存,由于远程会议进行事项可能较多,所需的文档内存较大,页数较多,所以转换后的图片数量也会比较多,数量较大的图片不会一次性的全部呈现,为了观看的需要和考虑系统的承载能力,图片会议单张连续播放的模式进行展示。具体流程如下图5.12所示。图5.12文档转换图片的分页查询流程文档共享子系统模块设计数据应用表格文件共享表格:主要用于对共享的文档文件信息进行登记存储,如下表5.12所示。表5.12共享文档字段表类设计理论基于Windows模式下的文档共享类设计理论具体操作如下图5.13所示。图5.13文档共享子系统结构代码系统服务器原始信息类: 。主要作用:在启用文档转换功能后,Windows服务器就会自动参考互联网设备的相关配置对OpenOffice服务线程进行初始化操作,并对相应的文件储存路径进行设置。具体操作如下表5.13所示。表5.13系统服务器原始信息类文档共享检测类:。 主要作用:根据用户需求和多媒体终端的配置等信息对文档进行在线转换,文档的在Windows操作环境中,文档转换主要是word文档转换为PDF格式和PDF文档转换为图片格式等。具体操作如下表5.14。表5.14文档共享检测类文档在线上传进度实时查询类: 主要作用:实时对文档在线上传的进度进行监控,准确的判断出文档上传是否成功并完成转换。具体操作如下表5.15。表5.15在线上传进度实时查询类系统内文档的分页浏览在文档共享系统内,有专门对文档进行浏览阅读的软件,此类软件可以通过对将要浏览的文档进行放大、缩放、缩约图生成等功能便于用户阅读使用。系统内部在每页页面都设置有播放相关的操作功能图标和按键,用户进行相应的操作就可以对文档进行相应的阅读和浏览设置。在页面上,用户可以将自己喜欢或关注的文档进行分享,分享前用户需要先进行登陆,输入用户名和密码即可。此外,用户也可以通过手机登陆或者APP进行相应操作,具体操作规程如下图5.14所示。图5.14系统内文档的分页浏览操作规程文档共享子系统后台管理文档共享子系统后台的操作主要是为管理人员对文档进行相应的管理和对用户进行相应的权限设置所用,在后台,系统管理员能够对所有用户的信息和文档信息进行查询和修改,并且能够针对不同的用户设置有区别的使用和阅读权限。在后台系统的用户管理区域,主要内容有新用户的增加、无效用户的删除、用户信息的修改和屏蔽等管理权限;在后台管理系统的文档管理区域,主要内容有文档的新增、无用文档的删除、文档的筛选等。此外,在后台管理系统中还有一个专门的索引区,该区域的主要作用在于对文档进行分类和快速查找,以及对长时间无人使用的文档进行定期的清理等。互联网http接口的引入由于远程会议所使用的终端设备较多,配置情况也不尽相同,有的还会配备有第三方应用。所以为了更好的能够为会议提供高质量的服务,文档共享转换系统除了提供各种子系统模块以外,还会提供额外的http接口以供引入,有了http接口以后,大部分的第三方应用就能够直接的对有用的文档进行调用和转换,这样就避免了先登录系统平台再转码下载的麻烦,以下是几个关键的接口说明。用户登录客户端http接口在用户进行系统登录时,客户端会向文档共享转换平台发出请求指令,用户登录的主要信息有用户名和密码,在获得文档共享转换平台同意令牌后,用户就可以正常登陆并进行权限内的相应操作,如果用户在同意令牌收到的半个小时内未进行登陆操作或登录失败,系统会默认超时,返回初始页面。具体流程如下:文档检测http接口由于远程会用所用文档数量较多,为了避免重复,也为了减轻服务器的承载压力,文档在上传、转换时会进行相应的检测。检测时,系统会自动向文档共享转换平台发送文档检测的相应指令,此时,文档共享转换平台就会对平台内的所有文档进行检测,如果检测到有重复,就会反馈“平台已存在同一文档”,如果文档不存在重复,平台会反馈结果“平台不存在同一文档”,查询结束。具体的流程如下。文档上传http接口服务器末端会向文档共享转换平台发出http指令,需要将急需转换或共享的文档上传至平台,所提交的信息主要有用户个人信息和token令牌信息以及文档信息等。如果服务器提交的信息不完整或者不准确,平台会反馈结果“参数出现错误,请核对后重新上传”;如果token令牌不合法,就会反馈结果“令牌不合规,请查证后在进行相应操作”;如果文档本身占用内存过大造成上传失败,就会反馈结果“上传文档超出系统承载量,请对文档进行相应调整后重新上传”。具体操作如下。文档转换http接口服务器末端会向文档共享转换平台发出http指令,需要将急需转换或共享的文档上传至平台,所提交的信息主要有用户个人信息和token令牌信息以及文档信息等。如果服务器提交的信息不完整或者不准确,平台会反馈结果“参数出现错误,请核对后重新上传”;如果token令牌不合法,就会反馈结果“令牌不合规,请查证后在进行相应操作”;如果文档本身占用内存过大造成上传失败,就会反馈结果“上传文档超出系统承载量,请对文档进行相应调整后重新上传”。具体操作如下。文档下载http接口服务器末端会向文档共享转换平台发出http指令,需要对有需求的文档进行下载操作,所提交的信息主要有用户个人信息和token令牌信息以及文档信息等。如果服务器提交的信息不完整或者不准确,平台会反馈结果“参数出现错误,请核对后重新上传”;如果token令牌不合法,就会反馈结果“令牌不合规,请查证后在进行相应操作”;如果文档页数过多,就会反馈结果“下载文档超出系统承载量,请对文档进行相应调整后重新上传”。具体操作如下。系统测试分析文档共享转换服务器的系统测试分析主要是针对设计后的成果进行实验论证。远程会议中文档资料具有数量多但占用空间小等特点,所以在测试时可重点对传输转换的准确性进行,而传输转换的速度可以小范围进行。系统测试环境要求系统测试的环境主要是指待测试软件系统和硬件设备的运行环境。环境稳定、运用程序适当能够为测试提供良好的环境支持,较少不必要的花费和时间,并且能够提升测试的科学性和准确性。本次文档共享转换服务器测试环境如下。硬件设备:a、终端电脑设备两台要求:CPU(电脑处理器):AMDRyzenThreadRipper3970X,RAM(运行内存):8G,硬盘:320G。b、初始端电脑设备两台要求:AMDRyzenThreadRipper3980X,RAM(运行内存):16G,硬盘:640G。c、显示器4台软件系统:终端:Windows10操作系统、NFS文件共享转换系统、2019开发环境。初始端:Windows10操作系统、NFS文件共享转换系统、2019开发环境。系统测试方案分析文档共享转换服务器的系统测试主要涉及到两个方面:系统功能测试和系统的性能测试。该测试主要通过案例试验、数据分析等予以实现。行业内当前经常使用的测试方案主要有系统支持测试、管控测试、错误反馈测试等。测试需要严格按照相应的操作规程进行,而后对系统功能的用途和逻辑进行分析研判,并最终检验系统的功能能否满足远程会议的需求。系统功能测试分析具体测试步骤如下:a、远程会议的组织者将会以所用相关文档上传至总服务器;b、远程会议的组织者在系统内部设置与会人员的相应权限。c、不同场地的与会人员通过终端设备进入远程会以,查阅共享文件信息;d、与会人员在自己权限内对共享文档进行阅读、下载;e、远程会议的组织者查阅文档接收进度。文档传输信息如下所示(以某研发部门季度会议为例)图6.1文档传输信息图示文档的传输过程中有文档的上传、转换和下载。以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论