数据迁移整合方案_第1页
数据迁移整合方案_第2页
数据迁移整合方案_第3页
数据迁移整合方案_第4页
数据迁移整合方案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.历史数据的迁移整合

本次系统是在原有系统的基础上开发完成,因此,新旧系统间就存在着切换

的问题。另外,新开发的系统还存在与其他一些应用系统,例如,企业信用联网

应用系统、企业登记子网站、外资登记子网站等系统进行整合使之成为一个相互

连通的系统。本章将针对新老系统迁移和整合提出解决方案。

1.1.新老系统迁移整合需求分析

系统迁移又称为系统切换,即新系统开发完成后将老系统切换到新系统上来。

系统切换得主要任务包括:数据资源整合、新旧系统迁移、新系统运行监控过程。数

据资源整合包含两个步骤:数据整理与数据转换。数据整理就是将原系统数据整

理为系统转换程序能够识别的数据;数据转换就是将整理完成后的数据按照一

定的转换规则转换成新系统要求的数据格式,数据的整合是整合系统切换的关键;

新旧系统迁移就是在数据正确转换的基础上,制定一个切实可行的计划,保证业

务办理顺利、平稳过渡到新系统中进行;新系统运行监控就是在新系统正常运转

后,还需要监控整个新系统运行的有效性和正确性,以便及时对数据转换过程中

出现的问题进行纠正。

系统整合是针对新开发的系统与保留的老系统之间的整合,以保证新开发的系统

能与保留的老系统互动,保证业务的顺利开展。主要的任务是接口的开发。

1.2.需要进行迁移整合的系统

13.数据迁移整合分析

根据招标文件工商总局新建系统的数据库基于IBMDB2,而原有系统的数据库

包括ORACLE,SQLServer,DB2。这种异构数据在总局主要存在于两个方面,

即部门内部的异构数据和上下级部门之间的异构数据。同时,系统的技术构件

有.NET和J2EE两大类。

对于部门内部的异构数据的集成采用数据移植的方法,如:如果数据有基于DB2

彼的,有ORACLE翻1的,有SQLServer管理的,就根据新系统DB2的要求,

把ORACLE的数据迁移到DB2数据库中,把SQLServer的数据迁移到DB2数

据库中。

上下级国工商局之间的异构数据的集成利用数据交换系统来完成,重点在于数据

库存储标准、交换标准的制定和遵守,保证数据的共享,这部分工作由数据中心

完成。

1.4.系统迁移和整合目标

1.4.1.系统迁移的主要目标:

1.保证系统正常运行

在数据转换过程中,由于原有的系统数据的复杂性,给数据转换工作带来了很大

的难度,为了在新系统启动后不影响原系统正常的业务,因此数据转换完成后,

必须保证新系统的正常运行。

2.保证原有系统在新系统中的独立性

原有系统是独立运行的系统,数据在新系统中虽然是集中存放的,但是各个系统

由于存在业务上的差别,数据在逻辑上应当保持一定的独立性。

1.4.2.系统整合的目标:

保证直接关联的系统互动,保证业务的正常办理。例如公众服务系统与基本业务

系统之间互动,基本业务与协同业务之间互动等等。

1.5.系统切换方案

1.5.1.系统切换工作流程

系统切换包括前期调研、数据整理、数据转换、系统切换、运行监控五个阶

段。系统切换的整个工作流程如下所示。

1.5.2.系统切换工作步骤

1.前期调研阶段

前期调研是数据转换中很重要的一个步骤,也是至关重要的一部分。在进行

数据转换工作前,我们需要先认真阅读系统的相关文档,如《数据字典》、询

概要设计报告》等,来熟悉原有的系统。当然在阅读文档的过程中肯定还会有理

解不清晰的地方,这时还需要熟悉原有系统的工程师的帮助。数据转换的前期工

作就是对原系统做一次彻底的全面了解,主要需要的考虑的有下面一些情况:

1)原系统的网络结构;

2)原系统的业务范围、存在几套业务系统以及他们之间的关系;

3)原系统的开发商、开发工具、开发平台以及采用的数据库;

4)原系统的数据分布状况:包括数据范围、数据量大小等;

5)原系统的业务流程;

6)原系统的数据流程;

7)原系统的数据结构;

在了解这些要素的基础上,需要编写《前期调研分析报告》。调研报告主要包含

如下一些方面:

1、将所有数据表进行分类,如系统参数类、代码类、综合业务类、相关业务类

等等。

2、对所有数据表的数据组成、数据来源、用途等进行描述。

3、并非所有的数据都是需要进行转换的,在《数据字典分析报告》中要指出那

些数据表是需要进行转换的,那些是不需要进行转换的,对于不需要转换的表要

说明不需要转换的原因。

4、描述数据在各表中的流向,对于关键的或复杂的业务点要做详细说明。

2.转换设计阶段

转换设计阶段主要是完成新旧数据字典的对照,同时明确各个表中具体数据字段

的转换方式。在转换设计阶段主要是编写《数据字典对照报告》

《数据字典对照报告》主要描述新旧系统数据表间的对照关系以及代码对照关系。以

新系统为准,原系统作参照,将原系统的数据字典对应到相应的系统数据字典中。

在对照过程中,需要遵循数据照搬原则,数据尽量不要作处理。

在数据字典对照表中需要进行转换的数据字段应该一一对应,对新旧数据表中字

段的名称、类型、精度等都要有详细的描述,同时还要明确数据的转换方式。数

据转换方式主要有以下几种:

1)直接转换。直接转换方式是最常用的方式,就是将原表中对应字段的数据原

封不动的搬到新表中来。按照“数据照搬”原则,我们应该应该尽量采用这种

方法。

2)程序转换。对那些需要进行计算才能进行转换的数据将采用程序转换方式进

行。

3)代码对照。某些代码字段,往往新旧系统的编码不相同,这时就需要参照代

码对照表进行代码对照转换。

4)类型转换。少数数据可能需要对类型进行转换,如就表以字符串

'YYYY-MM-DD,来存放日期,而新表中以DATE型来存放日期,这时就需

要进行类型转换。

5)常量转换。新表中某些字段可能存在缺省值,这时将采用常量转换方式,当

旧表没有对应字段或旧表对应字段数据为空时,将直接在新表中写入缺省数

据。

6)不转换。对于旧表有但新表中没有的字段将不作任何转换。

7)新旧系统代码对照列出了全部需要进行转换的新旧系统数据表中存在的二

级代码间的对照关系,主要以二级代码对照表的形式来反映。

1.6.数据迁移方案

1.6.1.数据整理策略

数据整理就是将原系统数据整理为系统转换程序能够识别的数据。数据整理大致

分为两个阶段:第一阶段就是将不同类型来源数据采集备份到统一的数据库中;

第二阶段就是将原始数据进行整理,按照不同的要求分类进入不同的中间数据库,

为数据转换提供中间数据。数据整理过程采用了以下方法:

1.确保原始数据的完整性

在进行数据整理之间,我们先需要对原始采集数据进行备份。备份的目的有两个:一

个是统一数据库,便于数据转换,另一个就是为以后数据追根溯源提供参考依据。

在本系统中,我们将采用DB2作为备份统一数据库。

2.数据分级过滤策略

数据分级过滤就是把数据按照不同的数据级别进行分类整理进入不同的中间数

据库中。本系统中我们把数据分为三个级别:废弃数据、待调整数据、可转换数

据。废弃数据就是该部分数据的存在对系统资源造成浪费的数据,并且会影响以

后系统的运行。待调整数据就是该部分数据严重影响新系统的运行,必须进行人

调整后工作,数据转换前工作。可转换数据是指这部分数据不需要任何处理,基

本满足数据转换的要求,或者建议由新系统对这部分数据进行调整,但不影响系

统的运行,新系统运行后可以进行调整,可以节省大量的数据转换时间。

3.借助数据整理相关工具

数据整理难度很大,涉及的数据量很大,手工检查是无法完成的,所以需要编制

相关的数据整理工具来完成数据整理。包括数据校对工具和数据纠错工具。数据

整理工具负责将原始备份数据库中的数据分类到不同的中间数据库中;数据纠错

工具负责为用户提供友好方便的工具界面,以改进和纠正错误数据。

4.利用中间库作为桥梁

由于原系统和新系统的数据库结构可能不同,因此利用中间数据库作为连接新旧

系统数据的重要桥梁是非常重要的。一旦业务人员对新系统中的一些转换数据有

疑问,可以通过中间库的关联,顺利地找出原始数据。

1.6.2.数据转换

数据转换是将排序后的数据按照对照表的要求进行转换,写入新系统。这个过程

可以通过切换系统来实现。

1.6.3.数据整理与转换步骤

1.设计数据移植方案

数据迁移方案的设计主要包括以下几个方面:研究历史数据的结构、来源、数据

项定义和价值,研究新旧数据库结构的差异,评估和选择数据迁移的软硬件平台,

选择数据迁移方法,选择数据备份和恢复策略,设计数据迁移和测试方案等。

2.源数据库数据清理

对于长时间运行的数据库,主要有三种数据库垃圾:数据库对象垃圾、数据库权

限垃圾和数据垃圾。清理数据库对象不是一件容易的事情,需要认真负责的态度

和耐力。任何错误的清理不仅会导致前端无法运行,还会导致数据丢失。因此,

清理数据库对象可能需要一种安全、准确且可快速恢复的方法。首先要了解数据

库资源,包括数据库对象,比如表,数据库事件,过程,函数,数据库结构关系。

在此基础上,确认数据库垃圾,制定合理的垃圾清理方案,达到清理垃圾的目的。

主要方法是整合分解数据库数据,整合相关数据减少数据重复,分解数据,但数

据组趋于合理。当然,集成和分解应该基于新设计的数据库结构,这样可以简化

转换过程。

3.进行数据模拟移植

根据设计的数据迁移方案,建立模拟数据迁移环境,在不影响实际数据的情况下

模拟实际环境,然后在模拟数据迁移环境中测试数据迁移的效果。

在数据模拟迁移之前,模拟数据要按照备份策略进行备份,以便数据迁移后可以

按照恢复策略进行恢复测试。

4.测试数据模拟移植

根据设计的数据迁移测试方案,测试数据模拟迁移,即数据模拟迁移后检查数据

和应用软件是否正常,主要包括:数据一致性测试、应用软件执行功能测试、性能

测试、数据备份和恢复测试等。

5.准备实施数据移植

数据迁移模拟测试成功后,在正式实施数据迁移之前,要做好以下几个方面的工作:

完整的数据备份、数据迁移方案的确定、软硬件的安装配置等。

6.正式实施数据移植

按照确定的数据移植方案,正式实施数据移植。

1.7.数据整理和转换的关键技术

对于多源异构数据库之间的数据转换,因为目标数据库的格式和约束的限制严格,

直接编写转换程序实现困难,可在原有数据库系统中编写转换程序。

对于源数据库、目标数据库结构有差异的数据,建立中间过渡库,中间库在原数

据库平台中建立,但结构与目标数据库的结构相同。

将源数据库转入中间库的过程是一个数据的重新组合和关联的过程,将是转换的

中心和重点工作,需要对源数据库与新数据库的数据关系进行深入分析,对每一

个数据库写出转换策略。

非空处理:对于应该非空但实际为空的记录制定处理规则。

取值约束处理:对于有取值范围约束的字段进行规范化处理,即将转换后的数据

取值规范到该范围内。

主键处理:重新对中间库进行编号。

填写外键:每个数据库或多或少存在外键,外键越多,标明与其它库关联越多,

这样的库应后处理;反之,外键越少的库应该先处理。

唯一键处理:对要求唯一的数据项(主键、唯一键)进行唯一检测,并对检测出

的不唯一的记录,制定处理规则。

附加分散处理:对某些表中的某些字段进行数据规范化处理,即将不合规范的数

据替换成规范的数据,几个表之间的关联处理,以及一些特殊处理等。数据一致

性处理:对于有多个数据源的数据进行一致性检查,制定处理规则。

1.8.新旧系统切换

第一步:编写《系统切换方案》。

系统切换方案包括系统切换方法、系统切换计划等内容。

第二步:组织相关人员对《系统切换方案》进行评审,如果未通过,则需要调整

系统切换方案。

第三步:进行业务系统数据转换。

在进行业务系统数据转换前,需要先选择一个时间点进行业务系统数据采集。该

时间点的选择以完成一个完整的业务周期为准。

1转换时机

根据以往的经验,我们建议将正式数据转换的时间放在月结刚刚完成后并且最好是

节假日。

1准备工作

正式数据转换前的准备工作是非常多的,现列举如下:

编写详细的《数据转换指南》。《数据转换指南》应该是在前面的几次试转换过程

中编写并完善的,要详细说明数据转换的全过程,包括:准备工作、执行步骤、

注意事项等。

编写执行脚本。在前面几次试转换的基础上编写并完善好数据转换执行脚本。执

行脚本包括:转换执行脚本、验证执行脚本等。所有的脚本都必须安装执行的先

后顺序编写,在正式转换时将按照顺序来执行。

数据库环境准备。根据以往的经验,在正式转换阶段出现的异常往往都是有数据

库方面的,大部分是因为数据库环境没有准备好。数据库方面需要做好如下几方

面的准备:表空间划分、大数据文件准备、大回滚段准备、创建索引等。

其他必要准备。在正式转换前,老系统要停止使用,同时在还需要把老系统的数

据做一次完整的备份。

1执行过程

数据转换时将按照已经编写好的转换执行脚本来进行。对没一步的操作都要做好

日志记录,日志分两种,一种是计算机自动产生的日志,如LOG文件;另一种

是在转换执行过程中手工做的记录。在正式转换时,要求至少两人一起工作,其

中一人负责操作,另外一人负责监督,两人都必须做好记录。

每执行完一条转换命令后都需要去查看一些错误记录表,如果出现异常错误信息,

需要暂停转换执行,对错误分析处理完毕后才能继续执行。

1验证过程

转换执行结束后,需要对转换的结果进行验证,验证时按照已经编写好的验证脚

本来进行,验证最好由两名以上的人员分开来进行,在验证过程中做好每一步的

验证记录。

如果在验证过程中没有发现异常,并且几名验证人员的验证记录都非常一致,则

可以认为已经通过验证。

1收尾工作

数据转换工作执行完毕后,需要对关闭原有系统全部的业务经办功能,只开发查

询功能,以便业务人员在需要时可以继续查询旧系统中的数据。

对新系统的数据进行一次物理备份,同时启动新系统数据库的重做日志功能。

到此时为止新旧系统数据转换工作全部结束,整个应用系统将切换到新系统上来

运行。

第四阶段:新系统运行监控及数据整理

在所有新系统平稳运行后,还需要进行定期的运行监控以及对部分数据进行调整。

对于那些对系统运行未造成影响的,在数据整理过程中,没有进行数据修正,所

以在系统平稳运行后,需要对这些数据进行调整。

1.9.系统切换保障措施

系统在整个切换过程中,安全、平稳过渡是第一位的。我们将采用如下措施保证

系统切换安全:

a)数据备份

在进行新旧系统数据转换时,对原系统数据进行备份以保证历史数据的可追溯性。一

旦在新系统中业务办理出现问题,则可以通过追溯历史数据来判断是数据转换错误,

还是新系统程序存在BUGo

2.数据测试

数据测试分为两个层次测试,一个是数据监测性测试,就是在数据转换完成后,

测试数据的转换正确性;二是验证性测试,验证性测试通过使用已经通过功能测

试的新系统办理实际业务来验证数据转换的正确性。

数据测试是一个关键环节,关系到系统切换的成功与否,所以必须加大测试力度

来保证数据转换的正确性。而与数据测试相关的系统功能测试也必须重视,因为

如果系统功能如果存在问题,则数据测试也就无法保证正确性。

3.切换点的选择

系统在什么时候进行切换,也是一个很关键的问题。一般情况下,我们都选择一

个业务周期结束,下一个业务周期开始的时候进行切换。

4.切换方式的选择

系统切换有两种方式,一种是新旧系统并轨运行,一种是新系统单轨运行。对于

第一种方式旧系统为主,新系统为辅,在时机成熟的时候在切换到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论