通关无纸化电子随附单据数据存储方案_第1页
通关无纸化电子随附单据数据存储方案_第2页
通关无纸化电子随附单据数据存储方案_第3页
通关无纸化电子随附单据数据存储方案_第4页
通关无纸化电子随附单据数据存储方案_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

通关无纸化电子随附单据数据存储方案目 录第一章 前言 4第二章 现状与问题分析 42.1. 现状分析 42.1.1. 信息中心 42.1.2. 数据中心 72.2. 试运行情况 102.2.1. 信息中心 10 存储 10 网络 102.2.2. 数据中心 11 存储 11 网络 112.3. 问题分析 122.3.1. 信息中心面临的问题 122.3.2. 数据中心面临的问题 132.3.3. 直属海关面临的问题 13第三章 需求分析 143.1. 业务需求 143.1.1. 数据存留 143.1.2. 存储容量 143.1.3. 读写I/O分析 153.1.4. 磁盘并发数分析 153.2. 开发需求 153.2.1. 接口需求 153.2.2. 迁移改造需求 153.3. 运维需求 163.3.1. 管理工具 163.3.2. 生命周期管理 163.3.3. 监控工具集成 163.3.4. 设备扩展性 163.3.5. 业务连续性 173.3.6. 复制迁移 173.3.7. 数据备份 173.3.8. 数据质量 173.3.9. 数据平安 173.3.10. 机房环境需求 173.3.11. 技能需求 173.3.12. 升级支持 173.3.13. 售后效劳支持水平 183.4. 设备平安需求 183.5. 数据平安需求 183.6. 网络需求 183.6.1. 网络背景流量 183.6.2. 无纸化报关传输流量 193.6.3. 无纸化调阅流量 213.6.4. 高清无纸化报关传输流量 223.7. 其它需求 233.7.1. 本钱 233.7.2. 产品成熟度 23第四章 规划总体结构 234.1. 方案一:集中存放模式 234.1.1. 总体结构图 234.1.2. 优点 254.1.3. 缺点 264.1.4. 网络估算 264.1.5. 工作量估算 314.2. 方案二:分布存放模式 324.2.1. 总体结构图 324.2.2. 优点 344.2.3. 缺点 344.2.4. 网络估算 354.2.5. 工作量估算 364.3. 方案三:集中+分布存放模式 374.3.1. 模式1:准实时下发模式 374.3.2. 模式2:分时下发模式 434.3.3. 模式3:非下发模式 464.4. 倾向性建议 504.5. 运维管理 514.5.1. 备份管理 514.5.2. 数据同步 524.5.3. 容灾切换 524.6. 数据管理 52第五章 可行性存储方案及分析 535.1. 方案一:可横向扩展的集群式NAS系统 535.1.1. 简介 535.1.2. 方案架构图 535.1.3. 特性 545.1.4. 方案分析-IBMSONAS 555.1.5. 方案分析-EMCIsilon 565.2. 方案二:成熟型内容管理路线 575.2.1. 简介 575.2.2. 方案架构图 575.2.3. 特性 575.2.4. 方案分析-IBMECM 585.2.5. 方案分析-OracleWebCenterContent 595.2.6. 方案分析-EMCDocumentum 595.3. 方案三:分布式存储+计算 605.3.1. 简介 605.3.2. 方案架构图 615.3.3. 特性 615.3.4. 方案分析-EMCMapR 625.3.5. 方案分析-天云科技Hadoop 635.3.6. 方案分析-IntelHadoop 645.4. 方案利弊比照 665.5. 倾向性方案 67

前言通关作业无纸化改革试点是2012年全国海关关长会议确定的重点工作。根据监管司《海关通关作业无纸化改革实施方案〔试行〕》要求确定的改革实施步骤,于2012年8月,第一期选定12个海关的不同种类的业务类型进行试点、2013年将进一步深化通关无纸化作业改革试点、2014年将深入推进并将于2015年在全国海关全面推广实施。根据上面的业务改革实施步骤,第一期试点的设计的文件存储系统将无法满足进一步的业务需求,需要建立能支撑通关无纸化业务改革在全国海关全面推广实施后的通关无纸化电子随附单据电子数据存储系统。本方案是在科技司牵头下,信息中心、数据中心、上海海关成立专题工作组,对今后存储、网络等需求进行综合评估,并对业界相关的技术和产品进行调研,初步形成的电子随附单据数据存储方案,本方案的实施将为今后通关无纸化全面推广提供根底的技术支撑。现状与问题分析现状分析信息中心文件系统文件系统结构如下: 整个文件系统分元数据的存储、非结构化数据文件存储、和对文件系统的访问三局部,其中元数据是结构化数据〔包括效劳器的配置信息和非结构化数据文件信息〕,放入到Oracle数据库中,非结构化数据文件放入文件效劳器中,其中文件效劳器是用EMCVMAXe的硬件存储。H2010客户端需要调阅随附单据时,对文件系统进行访问。实现上是由H2010客户端通过中间层效劳器发送请求,中间层向客户端返回文件地址和时间戳,客户端对以上信息及用户信息、请求IP加签,向缓冲文件效劳器发送文件请求。缓冲文件效劳器和总署级文件效劳器上,设立WEB站点,接收文件请求。收到文件请求后,先对请求的内容进行验证,如果能够通过验证且在时间戳后的有效时间内,将对请求内容进行响应。首先,缓冲文件效劳器检索本效劳器是否有相应的文件,如果没有,那么进一步向上级〔总署级〕文件效劳器发送请求,将获得的文件在缓冲文件效劳器缓冲,并返回给请求方。对于非业务量大的海关,客户端向中间层效劳器发送请求,由中间层效劳器直接向总署Web效劳器发送请求文件,并返回给客户端。设备列表硬件名称硬件配置数量软件及版本说明存储EMCVMAXe可用容量10.7TB1文件效劳器CPU:4路8核内存:64GB2OS:Windows2008R264位Cluster信息中心可扩展〔整组增加〕WEB效劳器CPU:4路8核内存:64GB2OS:Windows2008R264位NLB信息中心可扩展MQ效劳器CPU:4路4核内存:8GB2OS:Windows2008R264位IBMMQ7.0Cluster信息中心不可扩展,但能按通道拆分ESB数据库效劳器CPU:4路4核内存:32GB2OS:Windows2008R264位Cluster信息中心不可扩展ESB应用效劳器虚机CPU:4核内存:16GB2OS:Windows2008R264位NLB信息中心可扩展ESBBiztalk效劳器CPU:4路8核内存:64GB2OS:Windows2008R264位Group信息中心可扩展数据中心存储部署结构目前无纸通关工程中上传效劳器在德胜和亦庄两个机房都有部署,但数据库和后台程序只在亦庄机房有部署,拓扑如下:设备列表硬件名称硬件配置数量软件及版本说明上传效劳器CPU:2.8G*4内存:8G硬盘:80G8Os:linux64位中标麒麟5.4Weblogic10Jdk1.6亦庄4台、德胜4台随附单证MQ效劳器IBM750平台CPU:8个内存16G本地盘:120G2MQ:ibmmq6.0部署在亦庄NFSSERVERIBM5608CPU32G内存2OS:AIX1-sp10部署在亦庄,其中一台为冷备机存储IBM-DS8300,存储容量10T1部署在亦庄传输用加密机Sjy362OS:linux部署在亦庄网络目前数据中心为两地三中心的网络结构,北京、上海为三个核心机房的所在地,其中北京为同城主备两个机房,上海为异地容灾机房。各个分中心都是双线上联至数据中心,北方十省的分中心采用联通、电信各一条线路的方式连接到北京同城主备两个机房,南方的分中心使用双电信线路,一条连接到北京,另一条连接到上海。绝大局部情况下每个分中心上联数据中心的带宽都是2M,南方的分中心主用至主运行机房的电信线路,北方十省的分中心通常主用至同城备份机房的联通线路。为了确保无纸化通关工程的顺利进行,数据中心方案将南京、拱北、杭州、北京、天津、福州等6个试点分中心上联至数据中心主用线路的带宽扩容至10M。数据中心的同城主备机房与H2010系统的北京、广东节点都有互联,除今年7月将主运行机房与H2010系统北京节点〔金宝街〕的互联线路升级到为100M裸光纤外,所有与H2010互联的线路都是4MSDH专线。NFSServer设计SAN结构NFS效劳器采用两台IBM小型机P560,两台效劳器互为主备关系,需要手工切换,存储采用IBMDS8300,可用空间10TB,另外新采购EMC存储一台,裸容量为80T,可在后期数据量上升时挂载到NFS效劳器上。拓扑结构如下:文件系统设计NFSServer文件系统上传效劳器挂载点备注/shanghai(1TB)/shenzhen(1TB)

/nanjing(1TB)/huangpu(1TB)/other(1TB)/edoc/2200/edoc/5300/edoc/2300/edoc/5200/edoc先期每个文件系统预分配空间1TB试运行情况信息中心存储截至到12月7日24时,通关无纸化工程自上线以来,系统运行根本正常。总共申报通关无纸化报关单253840份,随附单据〔pdf文件〕共518789个,存储占用约47G〔47417M〕,存储相关的磁盘读写I/O、文件效劳器及WEB效劳器CPU、内存资源空闲。网络在无纸化通关工程试运行的20几天中,全国海关骨干网运行情况较为良好。取试点前一个普通工作日〔2月28日〕的上午10:00至11:00业务顶峰期一小时流量平均值,再取试点最近一个月〔11月13日日至12月13日〕中每天上午10:00至11:00业务顶峰期流量最大一天的一小时流量平均值,得到的比照表如下,从整体上看,试点海关的线路流量增长不明显,骨干网目前带宽现状可以承载试点应用的流量。单次样本具有随机性,不可简单直接相减计算差值,仅用于概要反映整体变化情况。关区名称运行网带宽M试点上线前流量M试点上线后流量M1北京关区期间由2M扩容至8M1.53.042天津关区期间由4M扩容至8M3.92.643上海海关2011.4114南京海关65.64.45杭州关区21.31.16宁波关区61.24.087福州关区21.51.48青岛海关42.53.49广州海关42.12.510黄埔关区64.83.1811深圳海关期间由8M扩容至30M4.16.912拱北关区期间由2M扩容至4M1.62.5数据中心存储截至到12月5日,无通关工程自上线以来,系统运行根本正常。存储占用43630M,存储相关的磁盘读写I/O及NFS效劳器CPU、内存资源空闲。网络在无纸化通关工程试运行的19周中,数据中心网络系统运行非常稳定,试点分中心的线路虽然还未完成扩容,但由于随附单据的业务量不大,因此原带宽目前还能够满足业务需求。截至到12月5日,带宽最大利用率在50%以上,80%以下的有南京、北京,其他分中心均在50%以下。骨干网目前带宽现状可以承载试点应用的流量。截至到12月5日,累计申报的通关无纸化工程报关单数量270899份,累计随附单据文件511674个〔其中已发往海关的随附单据文件484133个〕。问题分析信息中心面临的问题存储信息中心所使用的存储,是在现有设备中,通过与其他工程调剂出的10.7TB可用存储,存储设备为EMCVMAXe。这些存储与根据报关单量估计的每年30TB数据的所需存储容量相距甚远,现有存储容量远远不能满足实际需要。现有非结构化数据,没有专门的备份设备。当数据量随着业务试点的深入迅速膨胀时,无法对非结构化数据进行备份,致使硬件故障后,可能引发数据丧失。现有非结构化数据,只在总署信息中心部署,在广东分中心没有进行容灾备份。当总署节点出现故障无法使用时,将导致通关无纸化系统无法使用。通关无纸化改革试点期间,为保证工程进度,在Windows的NTFS文件管理系统根底上,由信息中心自行开发了文件管理、元数据管理的功能。使用操作系统自身的文件系统,在文件存储容量、数量方面都存在限制,无法满足实际业务量的需要。网络根据前期网络测试和通关无纸化试运行的网络监控情况和对业务量的预测上,需要对局部直属关与总署和信息中心与广东分中心之间的网络进行扩容。运维管理现有对非结构化数据的管理模块,尚无远程同步的功能,无法实现与分中心的容灾,在双中心运行切换、故障切换时,无法快速、无差异的完成非结构化数据管理的无缝切换。现有对非结构化数据的访问,主要通过WEB站点对文件效劳器的共享目录进行访问,没有相应的用户管理和权限管理。数据管理现有对非结构化数据的管理模块,尚无数据生命周期管理的功能,虽然在通关无纸化改革系统实施方案中有所设计,但是还没有功能实现。非结构化数据质量没有现成完善的保障方案。非结构化数据的平安需要重新考虑,包括存取控制、访问权限、防控数据泄露等。数据中心面临的问题存储现有存储空间容量不能满足业务增长的需要;随着数据量的增加,操作系统自身文件系统管理海量数据文件能力较弱;目前只有亦庄有随附单证的存储和传输效劳器,德胜没有,存在同城无备份的情况;共享文件缺乏统一用户管理;分中心的网络接入改造和同城网络改造可能延期,如上线压力大,可能影响目前系统运行;现有存储方案生命周期管理能力较弱,需要较多手工操作;NFS效劳器无法保证高可用性,发生故障时需手工切换;利用小型机作NFS效劳器,SAN存储作为非结构化数据存储本钱较高,扩展性较差,应对高并发访问的能力弱;常规的NFS文件系统的最大容量和最大文件数有限,可能无法满足业务要求。网络目前除与H2010系统互联的带宽完成升级工作外,试点分中心及数据中心局部网络的带宽升级工作还在进行中,因此需要在业务量还未有明显变化时尽快完成所有的带宽升级工作。除此之外网络的高可用、高可靠、可扩展等方面性能在H2010工程中已得到充分的完善。直属海关面临的问题目前集中模式下,地方海关在将非结构化数据上传的过程中,占用了较多的网络信道资源。同时此类数据在总署数据中心和信息中心分为两套存放,也占据了海量的存储资源。海关的现场关员在审单过程中均需调用总署端集中数据库里的非结构化数据,当此类业务操作被频繁提交时,将会再次占用直属海关到总署的网络信道资源和总署端的硬件资源〔包括主机的CPU、内存和磁盘〕。地方海关在非结构数据文件不下发时,一些独立于H2010之外的统计分析类工程无法直接访问总署的非结构化数据文件,造成一些具有地方特色的应用需求无法得到满足。需求分析业务需求数据存留信息中心基于如下考虑应保存一份数据:如果只在数据中心存一份,那么这个库既要负担外网的并发写,又要负担内网的并发读,压力很大,不如分散压力。H2010是一级运维工程,基于容灾的考虑,也应该在内网广东分中心存一份数据。信息中心和数据中心目前网络上只有MQ的通道,无法做到直接存取。在存储设计时信息中心会将保障级别较高运行库尽量做小,历史数据将用廉价设备存储,因此在投资商并不大,相比拟分布式存储反倒更廉价。关里除通关外其它系统也有调阅随附单据的需求,都从数据中心取,在性能上、网络上不一定满足。 直属海关在随附单证非结构数据文件下发后,为结构性通关模式改革提供实现根底

,为二次申报等改革奠定必要条件。分布存放模式可为结构性的通关模式改革提供实现根底,使报关单电子数据的传输、审核、放行与随附单证的传输、审核别离成为可能。实现“逐票电子放行,汇总计征税费〔量和时间上汇总、空间集中〕、批量复核”模式,别离传输可改变以往海关需在狭小时空内完成复杂任务的困境,拓宽时空,提高有效性。目前海关已有的决策支持类系统如海关廉政预警系统〔HL2008〕、批量复审系统、归类综合管理系统等,其分析的对象主要还是结构化的通关类电子数据。而随附单证电子化后的非结构化数据如果下发到各直属关,就可以满足各业务部门在分析结构化数据后对于相关原始纸质单证的调阅和分析需求,从而加强执法监控。此外,下一步随着OCR软件在海关随附单证领域的应用,也可以更加充分挖掘纸质单证资源的潜力。现有问题主要是各关的随附单证根本还是以纸质方式存放,即占用大量场地资源又无法方便查询调阅,且时间长了之后极易损坏,而采用了分布式存储方案可以有效解决此次问题。请上海海关补充本地存留无纸化单证并进行业务创新的一些需求。存储容量根据测试,按照目前对普通无纸化单证存档时对于随附单证的要求〔即非高清HD随附单证〕,各分辨率下的文件大小如下。目前,采用的是格式2——200DPI方式。文件尺寸单位〔字节〕扫描分辨率23页文件BMP图像尺寸PDF格式文件尺寸压缩比100DPI2,797,674375,0167.46∶1200DPI11,186,418964,86711.59∶1300DPI25,174,8341,856,41413.56∶1单票报关单随附单证大小的估算方法如下:根据试点数据,在满足数据中心随附单证规格要求的情况下,平均随附单证尺寸87K〔Byte,最大8M,最小6K〕,单票报关单平均随附单证数量2.7-2.4份〔目前有局部随附单证未列入试点〕。为了简化,数据量估算时考虑将单个随附单证大小以100KByte计,平均每份报关单随附单证数量以5份计〔试点量的2倍〕,每日峰值工作时间为2小时。相应的,存储计算中,单份报关单的随附单证以500KB计;网络计算中,单份报关单的随附单证带宽占用以5Mb/s计。据统计,2011年的报关单数量约为5900万份,2012~2013年报关单数量预计超过6000万份。以单份报关单包含5份随附单据且单份随附单据平均大小为100KB计算,预计2013年报关单将到达6300万份,信息中心年每年需要可用存储30TB;数据中心加上一定的冗余数,年数据增长量约为47TB。读写I/O分析结合存储容量分析,每年产生的数据量约为3亿个文件,按照每年220天工作日计算,那么每天产生的数据数量为136万个文件,既每日产生的交易量为136万,忙时处理能力是按照每日交易量的80%在3个小时内完成,每星期五是一周内的顶峰,是平均的1.5倍,即峰值为每秒钟136万*80%*1.5/3/3600=152个文件,I/O处理能力为152*100KB=14.8MB/s。磁盘并发数分析结合I/O分析,峰值时效劳器请求平均为每秒152个文件。根据压力测试时获取的系统I/O事务数据计算,峰值的I/O请求约为5679次每秒〔IOPS〕。开发需求接口需求存储数据访问方式应做到尽量标准、通用、简单。例如:NFS、FTP、HTTP和HDFS等。迁移改造需求所选方案假设涉及程序迁移改造,方案应提供程序改造时所需的SDK,且改造时元数据管理和非结构化数据迁移影响程度应尽量降低。运维需求管理工具提供便于系统工程师维护和管理系统的操作界面、并提供日常故障诊断工具。生命周期管理工程要考虑到分级存储的需求,保证业务在数据增长符合业务开展需求同时,在运维数据管理上,可根据管理和维护的需求,使用管理工具定义相应的数据维护规那么,可将数据自动或手动迁移到磁带或其他低本钱介质设备进行保存,当需要调取该文件时应用可以自动从介质中获取。随附单据生命周期特征随报关单变化:信息中心可分为:在线期:使用高速存储介质〔例如:SAS〕,建议1年内数据或只存储未理单的报关单对应的随附单据数据;近线期:使用低速存储介质〔例如:SATA〕,建议1-5年数据;离线期:使用离线存储介质〔例如:磁带库〕,建议5年以上数据。数据中心可分为:在线期:0~3个月,使用高速存储介质〔例如:SAS〕近线期:3~12个月,使用低速存储介质〔例如:SATA〕离线期:12个月以后,使用离线存储介质〔例如:磁带库〕根据通关无纸化业务任务书制定的报关单证保存期限:一般的报关单证〔备案号为空,备案号为以“Z”开头且监管方式为“4019边境小额贸易”〕保存年限为3年;备案号为以“D”、“Z”〔监管方式为“4019边境小额贸易”除外〕、“H****D”开头的报关单证保存年限为11年;除前面两种情况之外的报关单证保存年限为5年。对满足这些条件的报关单所对应的随附单据文件数据进行销毁处理。监控工具集成能够使用信息中心和数据中心现有的监控管理软件〔例如MSSystemCenter,BMC监控工具〕进行监控,或可以提供相应的接口,将数据定义成监控工具可以调用的模式。监控中要提供包括硬件故障报警,故障诊断,故障定位,性能报告等功能。设备扩展性设备满足非结构化数据每年信息中心每年约30T和数据中心每年约47T和容量的需要同时,在业务数据增加同时,集群内的容量可以平滑扩容,性能上也可以根据需求在线横向扩展。业务连续性系统不存在单点故障,对主要部件进行冗余设计,机器可以动态上线,可在线进行更换。复制迁移系统可提供同城机房间的文件在线实时复制以及文件迁移功能。数据备份基于本钱和容灾的考虑,信息中心会将运行库做小做精,过期的数据放到保障级别较低的归档库中。在各集中存储的方案中,为各关增配本地缓存效劳器,提高读取效率、节省带宽。存储设备支持数据文件不经过主机,直接备份到磁带上。数据质量对内外网MQ、ESB系统数据传输的及时性进行监控,对数据积压和丧失等故障及时发现和处理。对非结构化数据与结构化数据的一致性进行比对,并对缺失、多余、不一致数据进行补处理。数据平安建立非结构化数据的身份认证和存取控制机制,防止非法数据访问。对元数据中的敏感信息进行加密传输,防止数据泄漏。保存对数据的操作日志,以便问题分析和审计。机房环境需求机房可提供双路220V,380V电源,地板称重每平方米不超过800千克/平方米,机柜高度不超过2米,机房提供空调为侧送风和下送风。技能需求硬件和软件操作不应过于复杂繁琐,应尽量符合业界同类产品操作。升级支持及时提供漏洞补丁。售后效劳支持水平硬件和软件的保证级别为7*24,响应要求为1小时内响应,2内小时解决故障,有充足的备件。提供完整的售后效劳和技术支持,且对中心运维人员有定期的系统性培训支持。设备平安需求提供设备要具备可监控,可管理,可审计,提供的操作系统要能够根据系统平安分析结果,进行操作漏洞进行相应的平安整改,如无法整改的局部,需提供出相应的解决方案。数据平安需求非结构化数据的平安需求包括存取控制、访问权限、防控数据泄露等网络需求需要保证试点分中心到数据中心、互联网企业到数据中心以及数据中心到信息中心的互联带宽能够满足流量增大后的需求,且中间经过各种网络设备的处理及转发性能也完全可以支持业务量增大后对系统资源的要求。网络基准流量的估算方法如下:网络背景流量信息中心网络部根据目前流量状况测算了根底的背景流量,测算方法为:在一个月内随机选取五个工作日,对这五天每个海关早10:00至11:00的流量进行统计,算出一小时平均值,再用此值为根底按每年带宽增长5%计算出五年后的带宽值,此数值即为各海关的背景流量。〔与后面章节中网络整体估算方法保持一致〕关区带宽〔M〕背景流量〔M〕背景流量带宽利用率〔%〕大连21.8492.21%青岛43.6891.89%南京64.7378.81%上海2013.0265.09%黄埔63.3956.48%广州42.2556.16%杭州21.1055.20%宁波42.2054.88%拱北41.9147.86%厦门41.8846.90%天津82.9637.01%重庆20.6431.91%北京82.2728.40%成都20.5226.16%深圳307.6625.53%福州20.4924.57%江门20.4723.61%广东分中心458.4718.83%南宁20.3818.83%武汉20.3818.83%汕头20.3718.51%昆明20.3618.19%长沙20.2613.08%哈尔滨20.2612.76%满洲里20.2612.76%石家庄20.2512.44%沈阳20.2412.12%长春20.2411.81%乌鲁木齐20.2411.81%湛江20.2311.49%西安20.2010.21%郑州20.178.30%呼和浩特20.157.66%海口20.136.70%合肥20.115.74%南昌20.105.11%拉萨20.042.23%贵阳20.031.28%兰州20.031.28%太原20.031.28%银川20.031.28%西宁20.010.64%无纸化报关传输流量通过对试点数据的观测,考虑无纸化方案设计要求,平均每票无纸化报关单月需要5000Kb/s流量,计算得出无纸化报关传输流量在不同比例下产生的带宽占用量为:关别目前带宽各无纸化单证比例下的网络带宽需求〔Mbps〕Mbps目前试点5%10%30%50%80%100%北京关区8是天津关区8是0.5135810.1石家庄区2否000.3太原海关2否000000满洲里关2否00.70.9呼特关区2否00.40.5沈阳关区2否000.3大连海关2否长春关区2否000.3哈尔滨区2否00.60.7上海海关20是3.56.920.834.655.469.2目前试点通关无纸化企业大多为AA类企业或原“无纸通关、单证暂存”企业,其中“单证暂存“企业无需递交纸面单证,也不需要传输随附单证电子扫描件,故原方案根据目前现状估算的传输量可能偏低。参考上海海关存量报关单证电子化系统中随附单证实际情况,每份报关单平均附带10份随附单证,每个随附单证的平均数据量约为300KB,单票报关单随附电子单证的数据量为3MB。故此表中各阶段网络带宽需求可能需要重估,我们推荐的单信道估算值为83.3Mbps〔150000/4/60/60*8〕,考虑备份后需要新增167Mbps。南京海关6是11.318.122.7杭州关区2是宁波关区4是0.71.346.710.613.3合肥海关2否000.3福州关区2是11.62厦门关区4否南昌关区2否000.3青岛海关4是7.812.515.7郑州关区2否000.2武汉海关2否00.60.7长沙关区2否000.3广州海关4是0.510.4黄埔关区6是15.519.4深圳海关30是16.326.132.6拱北关区4是0.30.7汕头海关2否0.611.3海口关区2否000湛江关区2否000.2江门关区2否南宁关区2否00.60.7成都关区2否0.611.3重庆关区2否贵阳海关2否000000昆明关区2否000.5拉萨海关2否000000西安关区2否000.3乌关区2否0.50.81兰州关区2否000000银川海关2否000000西宁关区2否000000小于0.001Mbps计为0无纸化调阅流量信息中心网络部通过对上海海关的运行网线路近半个月流量数据的实际监控,结合运行网上传输的无纸化业务流量与实际发生的上海无纸化报关单量进行了分析,依据目前现场作业对的无纸化随附单证调阅比例,发现调阅一张报关单一般需要2秒,而平均每张报关可能产生的调阅数据量为0.044Mb,因此得出了一张报关单单词产生的调阅数据产生平均流量为:0.022Mb/s。根据目前通关无纸化工程的设计,随附单证可能会在审单、审核和放行环节调用,比照下表和前述“无纸化报关传输流量”可知,目前无纸化随附单证的总调阅率约为1%,为充分满足业务开展需要,假设未来无纸化随附单证的调阅率不少于报关单的改单率〔目前约为10%〕,且调阅比例仅限于单个环节,工程推广后上述三个环节会被现场关员调阅计,平均一张报关单调阅过程将共产生流量为:0.66Mb/s。因此根据各关报关单根底数量,按最大并发计算得出无纸化调阅流量在不同比例下产生的带宽占用量为:关别目前带宽各无纸化单证比例下的网络带宽需求〔Mbps〕Mbps目前试点5%10%30%50%80%100%北京关区8是0.030.060.180.290.470.58长春关区2否0.000.000.010.010.020.03长沙关区2否0.000.000.010.010.020.03成都关区2否0.010.010.040.060.100.13大连海关2否0.030.060.180.310.490.61福州关区2是0.010.020.060.100.160.20拱北关区4是0.030.070.200.330.530.66广州海关4是0.050.100.310.520.831.04贵阳海关2否0.000.000.000.000.000.00哈尔滨区2否0.000.010.020.040.060.07海口关区2否0.000.000.000.010.010.01杭州关区2是0.010.030.090.140.230.29合肥海关2否0.000.000.010.020.030.03呼特关区2否0.000.010.020.030.040.05黄埔关区6是0.100.190.580.971.551.94江门关区2否0.010.010.040.070.110.14昆明关区2否0.000.000.010.020.040.05拉萨海关2否0.000.000.000.000.000.00兰州关区2否0.000.000.000.000.000.00满洲里关2否0.000.010.030.050.070.09南昌关区2否0.000.000.010.010.020.03南京海关6是0.110.230.681.131.812.27南宁关区2否0.000.010.020.040.060.07宁波关区4是0.070.130.400.671.061.33青岛海关4是0.080.160.470.781.251.57汕头海关2否0.010.010.040.060.100.13上海海关20是0.350.692.083.465.546.92需要说明的是:目前试点通关无纸化企业大多为AA类企业或原需要说明的是:目前试点通关无纸化企业大多为AA类企业或原“无纸通关、单证暂存”企业,他们申报的报关单大多为自动放行无需人工干预,同时“单证暂存“企业无需递交纸面单证,也没有上传随附单证扫描件,即使关员人工审核时也不会调阅随附单证扫描件,故原方案根据目前现状估算的传输量可能偏低。另外,此表在进行调阅所需网络流量估算时是以10%的通关无纸化报关单将被现场关员调阅为基准比例得到的。而根据我关业务部门提供的数据,在通关无纸化业务推广到B类和C类企业之后,现场关员将会调阅60-70%的进口报关单和30-40%的出口报关单所对应的随附单证扫描件,故此表中的新增网络带宽可能需要重新预估,我们推荐的网络带宽需新增42.35Mbps,考虑备份信道后需新增85Mbps。需要说明的是:目前试点通关无纸化企业大多为AA类企业或原“无纸通关、单证暂存”企业,他们申报的报关单大多为自动放行无需人工干预,同时“单证暂存“企业无需递交纸面单证,也没有上传随附单证扫描件,即使关员人工审核时也不会调阅随附单证扫描件,故原方案根据目前现状估算的传输量可能偏低。另外,此表在进行调阅所需网络流量估算时是以10%的通关无纸化报关单将被现场关员调阅为基准比例得到的。而根据我关业务部门提供的数据,在通关无纸化业务推广到B类和C类企业之后,现场关员将会调阅60-70%的进口报关单和30-40%的出口报关单所对应的随附单证扫描件,故此表中的新增网络带宽可能需要重新预估,我们推荐的网络带宽需新增42.35Mbps,考虑备份信道后需新增85Mbps。深圳海关30是0.160.330.981.632.613.26沈阳关区2否0.000.000.010.010.020.03石家庄区2否0.000.000.010.010.020.03太原海关2否0.000.000.000.000.000.00天津关区8是0.050.100.300.500.801.01乌关区2否0.010.010.030.050.080.10武汉海关2否0.000.010.020.040.060.07西安关区2否0.000.000.010.020.030.03西宁关区2否0.000.000.000.000.000.00厦门关区4否0.040.090.260.430.690.86银川海关2否0.000.000.000.000.000.00湛江关区2否0.000.000.010.010.010.02郑州关区2否0.000.000.010.010.020.02重庆关区2否0.010.010.030.060.090.11小于0.001Mbps计为0高清无纸化报关传输流量请上海关补充说明原有220M带宽需求的估算过程,并说明该方式在通关流程暂不使用,当前仅使用200dpi黑白模式作为通关时单证交换格式标准。当前通关无纸化尚未采用高清格式扫描、传输,参考上海海关存量报关单证电子化所采用的高清格式,每份电子单证的平均数据量约为300KB,约为标清格式的3倍;预计下阶段单票报关单平均附带10份随附电子单证,为试点阶段的2倍,故单票报关单随附高清电子单证的数据量为3MB,为标清格式单证的6倍。参考上海海关存量报关单证电子化的实际效果,当期无纸化工程推荐使用高清格式单证作为交换格式标准。上海关业务部门认为目前已经开展通关无纸化试点的企业中,大局部均有意选取了随附单证较少的报关单进行无纸化通关以减少工作量,故每个报关单的随附单证以5个计算可能还是偏离了实际情况。根据上海海关统计处提供的试点存量单证电子化的情况来看,每个报关单以10个随附单证来核算应该较为合理。以上海海关为例,该关每天的报关单申报量约为50000份/天,平均每份报关单及随附电子单证的数据量为3MB,数据传输总量为150GB,这些数据主要集中在每天4小时业务顶峰时段内传输,故该关无纸化通关推广至100%报关单时传输流量所需新增带宽需求为83.3Mbps〔150000/4/60/60*8〕。按照现场关员将会调阅60-70%的进口报关单和30-40%的出口报关单所对应的随附单证扫描件〔统计上海海关2012年日均报关单为进口报关单16232份、出口报关单35119份〕并考虑调阅操作每天集中在4小时内全部完成,那么无纸化调阅流量新增带宽需求约42.35Mbps〔〔〔16232*70%+35119*40〕*3/4/60/60*8〕。其它需求本钱应考虑一次性购置本钱、每年维保本钱和学习本钱。产品成熟度应考虑产品所述单位的知名度、产品使用的成功案例和产品自身的研发时间、版本。规划总体结构方案一:集中存放模式总体结构图结构图如下:对结构图的说明:随附单据电子数据的传入随附单据电子数据通过数据中心和各关EDI(主要是上海和深圳)通过MQ发送到统一数据交换平台〔ESB〕,数据平台接收数据时进行处理,一局部是文件的元数据〔文件本身信息、存放地址等〕存入总署Oracle元数据库中,文件本身存入生产库文件效劳器;随附单据电子数据的调阅H2010客户端需要调阅随附单据电子数据时,通过H2010中间层从元数据库中获取文件的地址信息,获取到地址信息后,通过部署在直属海关的管理效劳器〔WebServer〕,连接到总署的管理效劳器,假设直属海关未配置管理效劳器,那么直接连接总署管理效劳器;总署的管理效劳器从生产库文件效劳器上获取文件,如果从生产库上取不到,那么去历史库中取,然后将文件通过总署管理效劳器回传给直属海关管理效劳器,直属海关管理效劳器回传给H2010客户端进行展示,假设直属海关未配置管理效劳器,文件直接通过总署管理效劳器回传给H2010客户端进行展示。随附单据文件的存储生产库文件效劳器上存储局部的文件,可以按照只存一年期〔时间可调〕的数据或者只存储未理单的报关单的随附单据电子数据,其它局部数据转移历史库或带库中。估算一年的存储容量30TB,历史库存4年数据,按照每年增量5%,总共150TB,带库200TB的容量。文件系统的备份、容灾在广东分中心建立文件系统的容灾备份,元数据Oracle按照现有的Oracle双向复制规那么进行,对文件效劳器需要单独建立容灾机制。数据中心的总体结构如下列图:用户主要是通过预录入客户端和上海EDI平台两个途径传入电子随附单据。用户在预录入客户端上操作后,预录入系统一方面把报关单数据传入内网,一方面通过上传效劳器和MQ程序将电子随附单据文件用另一条路径传入内网;对于上海EDI,电子随附单据是通过MQ通道传入数据中心,再由数据中心传到内网。优点对于信息中心数据总署集中一份,能保持随附单据电子数据的整体性数据集中存取,方便运维管理容灾备份时单一数据源目前的试点程序根本可直接使用,仅需局部更新对于数据中心随附单据附件集中存储在数据中心节点,便于统一日常维护、管理;数据中心方便对随附单据附件进行统一的数据分析、挖掘;方便跨关区查看随附单据文件;数据中心作为海关内网的统一入口,对数据平安性有保障;程序集中部署可降低本钱消耗;集中式部署方式不需要改变现有的网络结构,只需在原有的根底上扩容相关线路的物理带宽即可满足业务需求。扩容带宽的操作时间周期较短,工作量较小,并且由数据中心统一规划安排,更容易实施。缺点对于信息中心集中存取导致总署文件效劳器性能、网络流量压力大。各关开发的自有应用将无法直接获取随附单据数据文件,需单独提供访问方式。对于数据中心需要较高的带宽来满足随附单据附件传输需要网络估算净增流量在这种模式下,自海关运行网传输的主要为无纸化调阅数据,主要的无纸化通关流量会由数据中心骨干线路进行传输。因此骨干网带宽只需考虑调阅流量的增量。关别目前带宽各无纸化单证比例下的网络带宽需求〔Mbps〕Mbps目前试点5%10%30%50%80%100%北京关区8是0.030.060.180.290.470.58长春关区2否0.000.000.010.010.020.03长沙关区2否0.000.000.010.010.020.03成都关区2否0.010.010.040.060.100.13大连海关2否0.030.060.180.310.490.61福州关区2是0.010.020.060.100.160.20拱北关区4是0.030.070.200.330.530.66广州海关4是0.050.100.310.520.831.04贵阳海关2否0.000.000.000.000.000.00哈尔滨区2否0.000.010.020.040.060.07海口关区2否0.000.000.000.010.010.01杭州关区2是0.010.030.090.140.230.29合肥海关2否0.000.000.010.020.030.03呼特关区2否0.000.010.020.030.040.05黄埔关区6是0.100.190.580.971.551.94江门关区2否0.010.010.040.070.110.14昆明关区2否0.000.000.010.020.040.05拉萨海关2否0.000.000.000.000.000.00兰州关区2否0.000.000.000.000.000.00满洲里关2否0.000.010.030.050.070.09南昌关区2否0.000.000.010.010.020.03南京海关6是0.110.230.681.131.812.27南宁关区2否0.000.010.020.040.060.07宁波关区4是0.070.130.400.671.061.33青岛海关4是0.080.160.470.781.251.57汕头海关2否0.010.010.040.060.100.13上海海关20是0.350.692.083.465.546.92需要说明的是:目前试点通关无纸化企业大多为AA类企业或原需要说明的是:目前试点通关无纸化企业大多为AA类企业或原“无纸通关、单证暂存”企业,他们申报的报关单大多为自动放行无需人工干预,同时“单证暂存“企业无需递交纸面单证,也没有上传随附单证扫描件,即使关员人工审核时也不会调阅随附单证扫描件,故原方案根据目前现状估算的传输量可能偏低。另外,此表在进行调阅所需网络流量估算时是以10%的通关无纸化报关单将被现场关员调阅为基准比例得到的。而根据我关业务部门提供的数据,在通关无纸化业务推广到B类和C类企业之后,现场关员将会调阅60-70%的进口报关单和30-40%的出口报关单所对应的随附单证扫描件,故此表中的新增网络带宽可能需要重新预估,我们推荐的网络带宽需新增42.35Mbps,考虑备份信道后需新增85Mbps。需要说明的是:目前试点通关无纸化企业大多为AA类企业或原“无纸通关、单证暂存”企业,他们申报的报关单大多为自动放行无需人工干预,同时“单证暂存“企业无需递交纸面单证,也没有上传随附单证扫描件,即使关员人工审核时也不会调阅随附单证扫描件,故原方案根据目前现状估算的传输量可能偏低。另外,此表在进行调阅所需网络流量估算时是以10%的通关无纸化报关单将被现场关员调阅为基准比例得到的。而根据我关业务部门提供的数据,在通关无纸化业务推广到B类和C类企业之后,现场关员将会调阅60-70%的进口报关单和30-40%的出口报关单所对应的随附单证扫描件,故此表中的新增网络带宽可能需要重新预估,我们推荐的网络带宽需新增42.35Mbps,考虑备份信道后需新增85Mbps。深圳海关30是0.160.330.981.632.613.26沈阳关区2否0.000.000.010.010.020.03石家庄区2否0.000.000.010.010.020.03太原海关2否0.000.000.000.000.000.00天津关区8是0.050.100.300.500.801.01乌关区2否0.010.010.030.050.080.10武汉海关2否0.000.010.020.040.060.07西安关区2否0.000.000.010.020.030.03西宁关区2否0.000.000.000.000.000.00厦门关区4否0.040.090.260.430.690.86银川海关2否0.000.000.000.000.000.00湛江关区2否0.000.000.010.010.010.02郑州关区2否0.000.000.010.010.020.02重庆关区2否0.010.010.030.060.090.11小于0.001Mbps计为0运行流量根据以上数字,内网无纸化业务合并背景流量后的网络总流量:调阅流量+背景流量关别目前带宽无纸化单证各比例时网络流量〔Mbps〕Mbps目前试点5%10%30%50%80%100%北京关区8是2.301782.331782.451782.561782.741782.85178长春关区2否0.236110.236110.246110.246110.256110.26611长沙关区2否0.261640.261640.271640.271640.281640.29164成都关区2否0.533270.533270.563270.583270.623270.65327大连海关2否1.874221.904222.024222.154222.334222.45422福州关区2是0.501370.511370.551370.591370.651370.69137拱北关区4是1.944421.984422.114422.244422.444422.57442广州海关4是2.296252.346252.556252.766253.076253.28625贵阳海关2否0.025530.025530.025530.025530.025530.02553哈尔滨区2否0.255260.265260.275260.295260.315260.32526海口关区2否0.134010.134010.134010.144010.144010.14401杭州关区2是1.113981.133981.193981.243981.333981.39398合肥海关2否0.114870.114870.124870.134870.144870.14487呼特关区2否0.153150.163150.173150.183150.193150.20315黄埔关区6是3.488523.578523.968524.358524.938525.32852江门关区2否0.482220.482220.512220.542220.582220.61222昆明关区2否0.363740.363740.373740.383740.403740.41374拉萨海关2否0.044670.044670.044670.044670.044670.04467兰州关区2否0.025530.025530.025530.025530.025530.02553满洲里关2否0.255260.265260.285260.305260.325260.34526南昌关区2否0.10210.10210.11210.11210.12210.1321南京海关6是4.838624.958625.408625.858626.538626.99862南宁关区2否0.37650.38650.39650.41650.43650.4465宁波关区4是2.26522.32522.59522.86523.25523.5252青岛海关4是3.755693.835694.145694.455694.925695.24569汕头海关2否0.380120.380120.410120.430120.470120.50012上海海关20是13.368113.708115.098116.478118.558119.9381深圳海关30是7.817687.987688.637689.2876810.267710.9177沈阳关区2否0.242490.242490.252490.252490.262490.27249石家庄区2否0.248870.248870.258870.258870.268870.27887太原海关2否0.025530.025530.025530.025530.025530.02553天津关区8是3.010973.060973.260973.460973.760973.97097乌关区2否0.246110.246110.266110.286110.316110.33611武汉海关2否0.37650.38650.39650.41650.43650.4465西安关区2否0.20420.20420.21420.22420.23420.2342西宁关区2否0.012760.012760.012760.012760.012760.01276厦门关区4否1.916131.966132.136132.306132.566132.73613银川海关2否0.025530.025530.025530.025530.025530.02553湛江关区2否0.229730.229730.239730.239730.239730.24973郑州关区2否0.165920.165920.175920.175920.185920.18592重庆关区2否0.648140.648140.668140.698140.728140.74814总体流量预判根据以上数字,内网无纸化业务合并背景流量后的网络最小带宽需求为〔与后面章节中网络整体估算方法保持一致〕:〔调阅流量+背景流量〕/80%,得出的数值在向上取整至2的倍数〔带宽扩容最小粒度为2M〕关别目前带宽无纸化单证各比例时网络带宽需求〔Mbps〕Mbps目前试点5%10%30%50%80%100%北京关区8是444444长春关区2否222222长沙关区2否222222成都关区2否222222大连海关2否444444福州关区2是222222拱北关区4是444444广州海关4是444446贵阳海关2否222222哈尔滨区2否222222海口关区2否222222杭州关区2是222222合肥海关2否222222呼特关区2否222222黄埔关区6是666688江门关区2否222222昆明关区2否222222拉萨海关2否222222兰州关区2否222222满洲里关2否222222南昌关区2否222222南京海关6是88881010南宁关区2否222222宁波关区4是444466青岛海关4是666688汕头海关2否222222上海海关20->60是181820222426深圳海关30是101012121414沈阳关区2否222222石家庄区2否222222太原海关2否222222天津关区8是446666乌关区2否222222武汉海关2否222222西安关区2否222222西宁关区2否222222厦门关区4否444444银川海关2否222222湛江关区2否222222郑州关区2否222222重庆关区2否222222数据中心流量估算分中心目前带宽各无纸化单证比例下的网络带宽需求〔Mbps〕Mbps5%10%30%50%80%100%上海16乌鲁木齐20.240.300.741.141.752.15兰州20.020.030.080.120.180.22北京20.580.741.822.814.295.28南京41.622.085.097.8712.0414.82南宁20.040.060.140.220.330.41南昌20.150.190.460.721.101.35厦门20.050.070.160.250.380.47合肥20.120.150.370.580.881.08呼和浩特20.050.070.170.260.390.48哈尔滨20.130.160.390.610.931.15大连20.220.280.681.051.601.97天津20.460.591.432.213.384.16太原20.000.000.000.010.010.01宁波40.140.180.440.681.041.28广州20.320.410.991.532.342.88成都20.360.461.121.732.643.25拉萨20.010.020.040.060.100.12拱北21.121.443.525.448.3210.24昆明20.110.140.330.520.790.97杭州20.911.172.864.426.768.32武汉20.300.390.961.482.262.78汕头20.030.030.080.130.190.24江门20.220.280.691.061.621.99沈阳20.030.040.100.150.230.28海口20.050.070.170.260.390.48深圳40.420.541.322.043.123.84湛江20.100.130.310.480.740.91满洲里20.150.200.490.751.151.41石家庄20.180.230.570.881.351.66福州20.390.501.211.872.863.52西宁20.040.050.110.170.260.32西安20.180.230.560.861.321.63贵阳20.020.030.070.110.160.20郑州20.060.080.200.310.470.58重庆20.520.661.622.513.844.72银川20.030.040.090.140.210.26长春20.050.060.150.220.340.42长沙20.000.010.020.020.040.04青岛20.210.270.661.021.561.92黄埔100.0350.0460.32工作量估算工程信息中心数据中心直属海关开发1、0.5人月现有可满足,无需额外开发工作???无测试1、0.5人月无需…无更新和部署无需设备采购不好估运行监控5人天其他合计1人月???方案二:分布存放模式总体结构图对结构图的说明:随附单据电子数据的传入随附单据电子数据通过上海EDI预录入传入数据分中心,然后经过专用MQ通道从对外接入局域网进入上海海关运行网;上海关数据平台接收非结构化随附单据进行一定的逻辑校验后入库处理,具体包括:1、将文件本身存入本地文件效劳器;2、将文件元数据〔文件本身信息、存放地址等〕存入本地ORACLE数据库;3、通过上海关H2000中间层效劳器上的数据访问组件更新总署端的报关单随附单据列表的状态,供H2010系统的报关单入库和电子审单程序读取。随附单据电子数据的调阅H2010客户端需要调阅随附单据电子数据时,通过H2010中间层从元数据库中获取文件的地址信息,获取到地址信息后,通过部署在上海海关的管理效劳器〔WebServer〕,从本地文件效劳器上取文件,本地管理效劳器再传回给给H2010客户端进行展示。随附单据电子数据的后续使用在H2010 系统的报关单结关完成理单操作后,将随附单据电子化文件库中对应的报关单随附单据传输至存量报关单证电子单证档案库中备案。随附单据电子数据的上传分布式存储模式下随附单据电子数据不再上传到总署信息中心。随附单据电子数据的存储生产库文件效劳器上存储局部的文件,可以按照只存一年期〔时间可调〕的数据或者只存储未理单的报关单的随附单据电子数据,其它局部数据转移历史库或带库中。估算一年的存储容量9TB〔每票报关单附带5个100kb的标清格式电子随附单据〕或54TB〔每票报关单附带10个300kb的高清格式电子随附单据〕,历史库存4年数据,按照每年增量5%,总共45TB〔标清模式〕或270TB(高清模式),带库55TB(标清)或330TB〔高清〕的容量。文件系统的备份和容灾根据总署要求建立数据库和文件系统的容灾备份。数据中心:对结构图的说明:对于外网预录入系统,由于报关单数据是经由数据中心传入内网的,所以报关单的而上海海关的随附单据文件也需要经已经不传给由数据中心传入内网。但是存储可以考虑分布式,即将随附单据文件分布存储在各个分中心。但是因为随附单据文件必须和报关单数据一样同时经由数据中心传入内网,,所以数据中心的传输程序在将随附单据电子数据仅需将报关单数据传入内网时,由信息中心的H2010系统对报关单进行入库或退单处理。此间数据中心无需进行关于随附单证是否到齐的逻辑校验,还需要故数据中心不必从分布式存储上获取到文件。由于外网上海到北京有155M专线,带宽可以支持将上海关的随附单证文件上传至北京,同时数据中心在通关无纸化工程中承当着存证举证的责任,需要在数据中心保存一份随附单据数据,因此建议上海EDI在将随附单证数据从本地直接传入内网的同时,上传一份到北京。数据中心保持这份数据后,可以根据信息中心的需要以及两中心之间的带宽状况,将数据传输给内网。优点对于信息中心直属海关所有的电子随附单证〔非结构化数据〕均无需上传到总署端,不会占用直属海关到总署的网络信道和磁盘资源。各直属海关的现场关员在审单时可以直接调阅存放在本地的非结构化电子数据,其访问速度仅仅取决于直属海关的关区局域网速度以及本地使用的存储性能,如此将较大地缓解总署端现有的网络和磁盘性能压力。各直属海关可以基于本地存放的电子随附单证数据进行二次开发,对其有效利用,从而满足一些地方特色的应用对于调阅报关单随附单证的需求。对于数据中心1、随附单据文件处理量大幅减少,上海海关的随附单据电子数据无须通过数据中心向信息中心传输而在本地有存储,系统运行压力减轻。2、,现有的存储和网络容量大为节约,设备和信道投入本钱降低。企业查看时比拟方便快捷缺点对于信息中心电子随附单证分布式部署之后,总署端将没有一套完整的全国性非结构化数据。而现有的某些业务模式如“异地申报、口岸验放”以及今后的一些业务改革如集中审单和区域化审单等业务流程中,海关关员均需调阅异地海关的报关单和随附单证电子数据。如此,总署的通关程序会面临着交叉调用全国海关数十个数据源〔如南京关员审单需要调用上海的本地非结构化数据〕的困难,极大地增加了程序的复杂程度和出错概率。各直属上海海关均需增加存储设备和效劳器的投入以应对电子随附单证分布式的部署模式。除了首期采购的一次性经费之外,后期对于上述设备的运行维护也给各地方技术部门增加了非常大的工作量和经费压力。现有试点程序需做出一定很多修改才能实现分布式部署核心节点没数据,总署无法把控,与目前大集中的趋势相反对于数据中心由于多地存储,存储平安性较低系统维护管理比拟复杂,对分中心要求较高容灾备份节点较多分中心的采购和维护本钱高应用程序逻辑复杂由于数据中心向内网传输时需要从分布式存储上获取文件,效率不高网络估算随附单证分布式部署后,大量的非结构化电子数据已不再传输到总署数据中心和信息中心,其信道的需求将远远小根本等同于集中或集中分布模式下直属海关到总署的网络带宽。同时海关现场关员调阅时也根本通过关区局域网访问本地数据库和文件效劳,,故上海直属海关到总署的网络信道无需扩容现有带宽。而如此实施后,新的网络瓶颈将会存在于地方电子口岸网到海关运行网之间的通路, 带宽〔M〕大连4青岛6南京6上海18黄埔6广州4杭州2宁波4拱北4厦门4天津4重庆2北京4成都2深圳10福州2江门2广东分中心12南宁2武汉2汕头2昆明2长沙2哈尔滨2满洲里2石家庄2沈阳2长春2乌鲁木齐2湛江2西安2郑州2呼和浩特2海口2合肥2南昌2拉萨2贵阳2兰州2太原2银川2西宁2数据中心无新增流量。工作量估算上海直属关改造工作量:增加上海关数据平台电子随附单证〔非结构化数据〕的入库即将随附单证报文存入文件效劳器数据库的后台效劳程序;增加调用总署数据中心CA验签的接口程序以验证所有企业发送上来的报文真实性;增加本地数据平台增加写入本地随附单证oracle元数据库〔用以记录随附单证电子化后的存放路径〕以及总署端报关单随附单证数据库列表的后台程序。〔需信息中心提供统一版程序〕数据中心程序改造工作量:修改QP报关单导入程序,对于上海发送的通关无纸化报关单不再等待随附单据文件到齐后向信息中心发送。向上海海关提供CA验签的接口程序。增加统一的接口程序以使随附单证电子数据在地方电子口岸的数据管理效劳器上能够落地;增加向直属海关运行网发送电子随附单证的通道和程序〔前提是打通地方电子口岸外网和海关运行网〕;简化现有向信息中心发送随附单证的效劳为只发送报关单数据。对于使用电子口岸预录入系统进行报关业务的上海企业,如果采用这种模式,那么电子口岸预录入系统有两种修改方案:一是随附单据仍然传到数据中心,由数据中心再传给上海海关,这种方式需要新建数据中心到上海海关的传输通道并开发相应传输程序;另外一种是需要在上海分中心新部署电子口岸上传效劳器和MQ传输效劳器,为此需要修改预录入系统客户端,支持将随附单据传到上海分中心的效劳器上,并开发相应传输程序,将上海分中心效劳器上的随附单据文件传到上海海关。同时中国电子口岸数据中心作为第三方存证机构,需要保存全量随附单据,所以还要开发额外的同步程序,将上海分中心的随附单据同步传输到数据中心。信息中心程序改造工作量:向上海海关提供统一版的直属海关本地元数据库和电子随附单证的数据库结构;向上海海关提供写入总署端报关单随附单证库列表和派单表的本地化组件程序接口。信息中心补充:原那么上地方关不能直接操作总署的运行库,不管是连接串还是接口,所以需要上海关与信息中心一起协商如何实现报关单数据与电子随附单证数据如何同步传输,如何激活电子审单程序,其实改动量较大。简化现有接受数据中心电子随附单证的效劳为只接收报关单数据;修改电子审单程序为读写取直属海关本地的元数据库和随附单证电子数据;;修改现场审单程序为读取直属海关本地的元数据库和随附单证电子数据;改造现有的某些业务模式如“异地申报、口岸验放”的相关程序以使异地海关在调阅电子化随附单证时可以读取分布在其他直属海关文件库中的电子化数据。工程信息中心数据中心直属海关开发1、22人月1、架构规划1人月2、设计2人月3、开发5人月???3测试1、12人月2人月2…更新和部署需要分中心配合,不好估视设备采购情况定设备采购需要分中心配合,不好估视设备采购情况定运行监控需要分中心配合,不好估其他合计34人月??????方案三:集中+分布存放模式模式1:准实时下发模式总体结构图信息中心总体结构图:对结构图的说明:随附单据电子数据的传入随附单据电子数据通过数据中心和各关EDI(主要是上海和深圳)通过MQ发送到统一数据交换平台〔ESB〕,数据平台接收数据时进行处理,一局部是文件的元数据〔文件本身信息、存放地址等〕存入总署Oracle元数据库中,文件本身存入生产库文件效劳器;随附单据电子数据的调阅H2010客户端需要调阅随附单据电子数据时,通过H2010中间层从元数据库中获取文件的地址信息,获取到地址信息后,通过部署在地方关的管理效劳器〔WebServer〕,从地方关文件效劳器上取文件,地方关管理效劳器再传回给给H2010客户端进行展示。随附单据电子数据的下发通过准实时的方式下发随附单证电子数据给地方关。随附单据文件的存储生产库文件效劳器上存储局部的文件,可以按照只存一年期〔时间可调〕的数据或者只存储未理单的报关单的随附单据电子数据,其它局部数据转移历史库或带库中。估算一年的存储容量30TB,历史库存4年数据,按照每年增量5%,总共150TB,带库200TB的容量。文件系统的备份、容灾在广东分中心建立文件系统的容灾备份,元数据Oracle按照现有的Oracle双向复制规那么进行,对文件效劳器需要单独建立容灾机制。该模式下数据中心外网局部方案采用同方案一的集中存放模式优点对于信息中心数据总署集中一份,能保持随附单据电子数据的整体性数据集中存取,方便运维管理容灾备份时单一数据源通关过程中访问下发各关的随附单据电子数据,能分散集中总署时访问的压力各关自行开发的应用能直接访问本地数据

对于数据中心,同方案一缺点对于信息中心各关需自行对下发随附单据电子数据的存储、运维通关过程中会实时访问各关的文件效劳器,对运维的要求很高如果下发数据出现不及时,会对客户端对文件的调阅速度有影响对于数据中心,同方案一网络估算在这种模式下,自海关运行网传输的既有无纸化通关的流量,也有为无纸化调阅数据流量,因此骨干网带宽需考虑无纸化通关的流量叠加调阅流量的总和。关别目前带宽无纸化单证各比例时网络带宽需求〔Mbps〕Mbps目前试点5%10%30%50%80%100%北京关区8是0.2930.5871.7602.9334.6925.865天津关区8是0.5051.0103.0305.0508.07910.099石家庄区2否0.0130.0270.0800.1340.2140.268太原海关2否0.0010.0020.0070.0110.0180.022满洲里关2否0.0450.0900.2710.4520.7230.904呼特关区2否0.0270.0540.1610.2690.4300.538沈阳关区2否0.0140.0290.0870.1450.2320.289大连海关2否0.3080.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论