HDS大数据迁移解决方案设计_第1页
HDS大数据迁移解决方案设计_第2页
HDS大数据迁移解决方案设计_第3页
HDS大数据迁移解决方案设计_第4页
HDS大数据迁移解决方案设计_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、h ds数据迁移解决方案1 .数据迁移概述数据迁移是企业it建设经常面对的工作。在开发环境向运行环境转换、低 版本数据库向高版本数据库转换、两个不同数据库之间进行转换以至系统硬件升 级时,数据均可能需要被转移并使之迁移后正常运行。基于存储的数据迁移是一次性的将数据从一个存储转移到另一个存储系统 上,它包括对新存储的启用和数据可用性的保证。在一些情况下,基于存储的 数据迁移是进行数据大集中的手段,非常适合大规模数据迁移需求。基于存储的数据迁移又可分为同构存储迁移和异构存储迁移两大类。目前基 于同构存储的迁移是指在同厂家同型号产品之间数据迁移,需要配置支持基于磁 盘阵列内(间)的数据复制软件,在h

2、ds同系列存储环境下,经常性的数据迁移 可利用存储产品中的迁移复制(volume migration,shadowlmage)及存储间的复 制truecopy功能简化数据迁移工作;对emc而言是配置srdf-dm或 timefinder 等。异构存储间数据迁移需要虚拟化技术支持,hds虚拟化技术非常成熟,在 虚拟化基础上将原来不能完成数据复制的存储设备整合在一起,形成统一存储 池,这时物理上在两个磁盘的数据卷之间的迁移,在逻辑上来讲是在整合虚拟后 的同一个磁盘阵列内卷迁移,大大简化了数据迁移的复杂性。许许多多国内外 客户都通过这种数据迁移方式 实现了在线数据迁移。2 .数据迁移的难题当今数据迁

3、移的主要难题是进行一次成功的数据迁移时间要 求越来越短。然而应用在存储方面的需求不断增加,存储的升级和更替更加频 繁;同时,用户的应用趋向于全年不停顿运行、对系统的可靠性、可用性要求不 断提高,维护时间窗口的不断减少等因素,使得进行一次平滑的成功数据迁移越 来越具挑战。在进行数据迁移项目计划时,一些因素是必须考虑的。2.1 数据的保护数据的保护是最重要的,在数据迁移中数据的安全必须得到完全的保护。任何一个更换过个人计算机中的硬盘的人,都对因为在更换过程中对某些细节的 忽视造成的数据丢失有预期和经验。当在企业级数据迁移中,数据备份、实施 步骤的回退计划是保证数据在迁移后的可用性的必需准备。2.2

4、 在线或离线迁移如果应用可以暂停,则迁移过程可以更快捷;但是当今大多数系统有着严 格的可用性要求。当数据迁移在生产环境中进行时,不仅要密切监控数据迁移 的过程,而且要将迁移对生产系统的影响降到最低。2.3 维护时间窗口通常迁移工作只能在预先确定的维护时间窗口中进行。通常时 间窗口是在夜间或周末生产活动最少的时候。这些严格的时间窗口的存在 使得迁移项目可能表现出不规则间断的情况:紧张的迁移在时间窗口中进 行,然后在时间窗口关闭时停止,业务继续运行;迁移工作只 有在时间 再次打开后才可以继续进行。从而使得迁移工作分散成数成不连续的多个 阶段性工作。在开放系统环境中,没有一个完美的数据迁移技术。每个

5、迁移技术均有优 势和劣势。针对每个特定的业务环境,应该根据不同技术的特点进行仔细甄别 选择。直接费用(人力、硬件和软件等)因素应 该和间接因素(应用停止和生 产系统性能影响等)结合起来作为选择迁移技术的判据。有些需要更大的维护 时间窗口,而有些对生产系统 的性能会有较大影响。这些都会成为选择相应存储 技术的考虑因素。2.5 计划和应用停顿的容忍程度数据迁移会对生产系统有着或多或少的影响,当分析完应用可用性要求, 完成维护时间窗口的选择后,可供选择的技术就相对比较固定。2.6 测试需求根据应用的情况,特定时间的迁移前测试和迁移后测试是必须的。 因为没有一个普遍适用的测试计划,所以针对每个特定的环

6、境都需要做出详细的 有针对性的测试计划。测试的时间跨度也与应用情况相关,时间长短也是根据应 用的需求决定。2.7 数据迁移的时间跨度总的来说,决定数据迁移时间跨度的最主要因素是用户对迁移对原应用的影 响的容忍程度。而时间跨度与应用可用性之间密切相关。通常,在费用和可以接 受的应用可用性之间有着一定的关系。越高要求的应用可用性意味着越多的费 用,从而也就制约了时间跨度。经验表明,在没有详细彻底的评估环境和项目 目标的情况下,进行迁移时间的预测是很困难的。一般来说,需要经过评估,分 析,计划和实施等几个步骤。2.8整个环境的复杂性在数据迁移过程中涉及到各种应用和数据之间的关系,越复杂的应用环境,则

7、相应的计划和实施就越复杂。3.数据迁移技术的选择客户的原系统应用系统架构中包括了 hp、旧m等多种主机平台,存储为 hds9970,v将来可扩展个多种存储平台,在进行初步分析的基础上,针对未来 主机操作系统改变与否,我们认为未来系统的选择可以分为两大类:同构环境和 异构环境。3.1 同构环境的数据迁移技术针对与现有系统同构,我们认为至少可以有以下一些技术手段可以选择: 基于磁盘阵列远程数据复制技术的数据迁移。基于主机操作系统逻辑卷镜像技术 的数据迁移。基于数据库备份和恢复技术的数据迁移。基于三方工具的数据迁移。基于存储虚拟化技术的数据迁移3.2 异构环境的数据迁移技术针对异构计算环境,一般推荐

8、可以使用以下几种方法之一,具体方法的选 择还需进一步详细了解现有系统运行环境:基于主机操作系统逻辑卷镜像技术的 数据迁移。基于数据库备份和恢复技术的数据迁移。基于三方工具的数据迁移。 基于存储虚拟化技术的数据迁移3.3 可选的数据迁移技术对于业务数据的迁移,目前主要采用如下五种方法:基 于磁盘阵列远程数据复制技术的数据迁移。基于主机操作系统逻辑卷镜像技术的 数据迁移。基于数据库备份和恢复技术的数据迁移。基于第三方工具的数据迁 移。基于存储虚拟化技术的数据迁移最后的迁移方案应该是上述方案的结合,我们会 在上述方法结合过程中找到最佳数据迁移方案。3.3.1 基于主机操作系统逻辑卷镜像技术的数据迁移

9、此种数据迁移方法,主要利 用业务主机操作系统内置的逻辑卷管理系统的逻辑卷镜像(lv mirror)技术,对 于业务系统所使用的每个lv,都进行pv映射扩展,在新的目标磁盘阵列上扩 展一个pv映射,这样,通过数据的初始化同步,可以保证业务数据在原有的磁 盘阵列和新的磁盘阵列上保持同步,两边数据完全一致。然后,在删除每个lv 到原有磁盘阵列的pv映射,这样,数据就完全从原有磁盘降列迁移到新的磁盘 阵列。原有磁盘阵列上的数据在一段时间内保持不 变,以用来回退,一旦数据 迁移因各种原因无法成功,则还可以利用原来的磁盘阵列提供数据访问。此种方 法存在如下优点:*lv在进行pv映射扩展时,在经过初始化数据

10、同步后,保持镜像状态对系统的 性能影响很小(大概会消耗2%的系统资源);但是,利用这种方法,也存在如 下的问题: 在lv进行初始化数据同步的时候,需要消耗主机系统较大的cpu、memory 以及io资源,因此在进行lv初始化数据同步的时候,会对在线系统的性能造步骤简单,容易实现,速度快;*不需要考虑到上层数据应用 系统的内部的结构;*可以在线进行,只需要较短的停机时间(在所有的lv镜像完成后,需要停机断 开lv和原有磁盘阵列上的pv的映射);成较大的冲击;基于主机的数据迁移方案对于安徽邮政存储银行信息中心本次项目是可行 的,采用该方案可以逐步实现数据迁移,但需要较多的实施步骤和停机次数。 采用

11、该种数据迁移方案各公司间是没有根本区别,hds公司在这类数据迁移实践 中也积累了大量经验。3.3.2 基于数据库备份和恢复技术的数据迁移此种数据迁移方法,主要通过数据库自带的备份和恢复功能以及逻辑日 志追加的技术,实现一个数据逐步迁移的方法,最后达到把数据从原有的磁 盘阵列完全迁移到新的磁盘阵列的目的。本方法比较安 全,当数据迁移不成 功时,不影响生产系统的正常运行,但是迁移时间较长,对技术要求较高, 而且需要专门用于数据迁移的一台与生产主机环境一样的主机,硬件配置可以 稍低一点。基于数据库的数据迁移方案仅仅能够迁移数据库业务应用,对非数据库 应用不可行。因此,对于安徽邮政存储银行信息中心本次

12、项目是不可行的。3.3.3 基于磁盘阵列远程数据复制技术的数据迁移此种数据迁移方法,可以在同一个磁盘阵列内通过基于磁盘阵列的克隆 软件或卷迁移软件实现数据复制,完成数据迁移。如果两个异构的磁盘阵列 通过hds虚拟化技术整合在一起,那么在两个异构的磁盘阵列间的数据复 制就转化为在同一磁盘阵列间的数据复制,这就是hds异构磁盘阵列数据迁 移核心所在。对于两套同型号磁盘阵列,可以通过阵列之间的数据复制技术来实现数据的迁移,如目前的hds的turecopy技术,emc的srdf技术,都可 以实现在两套磁盘阵列之间的数据迁移,并且此种方法不占用主机资源,对 应用透明。但是源磁盘阵列和目标磁盘阵列必须是同

13、一厂 家的同一系列的产 品,而且迁移过程对生产系统有一定的性能影响。3.3.4 基于第三方工具的数据迁移此种数据迁移的方法,利用一些第三方的工 具实现数据迁移,如veritas的vvr。这种方法,不仅需要额外购买第三方工具,实施比较复杂, 同时,对于特定的第三方工具,需要满足一些前提条件,如veritas的vvr 只能基于vxfs文件系统上的卷复制,对于其它的文 件系统或raw device, 则无法使用。3.3.5 基于hds存储虚拟化的数据迁移此种数据迁移的方法,利用hds特有的uspv/uspvm的uvm(universal volume manager) + 卷迁移复制 volumem

14、igration 实 现数据迁 移。这种方法,可以采用hds uvm和volume migration功 能软件,通过 uvm实现uspv对外部存储的虚拟化管理和应用重新映射访问,然后用卷迁移软件volume migration将数据应用不停止的在线迁移到uspv内部,由于不涉及主机的任何设置修改,实施比较简单, 迁移速度非常快。数据迁移方案的比较迁移方案是否需要计划 性停机,几次数据迁移速度、性 能迁移所需要消耗的资源实施难度操作系统镜 像数据命令1次可以根据业务情 况,lun级灵活 控制拷贝速度需要消耗较少的主机端资源 (文件系统层次镜像)完全采用系统管理员熟悉的 文件系统命令,难度很小但

15、 管理非常复杂,手工操作容 灾出错,风险较大。oraclestandy by 方式备份和恢2次中等需要消耗一定的主机端资源(数据库层次log )取决于对数据库的熟悉程度(注意数据库的no log操 作)复磁盘阵列复制(只能在同构 阵列间实施)12次较快,但不能灵 活调节1.需消耗阵列的控制器能力 和大量缓存资源;2.主机io 需增加一定的时延,若在同机 房迁移则影响较小需仔细规划,确保阵列和主 机之间的数据完整性。迁移结束后测试验证可回退 性差。存在安全隐患,实施 案例很少。第三方工具2次速度可控tdmf需要占用5-10%的主机系统资源取决于数据迁移服务人员实 施能力。hds存储虚拟 化十卷迁

16、移1次速度最快,非常 灵活1不消耗任何主机资源,需 消耗阵列的控制器能力和大量 缓存资源;2.主机io需增加 微不足道的时延需要将外部存储fc端口和 uspv逻辑连接,以便uspv 能识别和虚拟化外部存储的 lun,然后通过卷迁移将外部 存储的卷在线迁移到uspv 内部。非常多成功案例。4.安徽邮政存储银行数据迁移方法数据迁移方法的选择要依据客户的现 状选择相应的迁移技术。例如:是否可以停机做数据迁移、可以停机时间、 是否需要在线做数据迁移。通过对多种数据迁移方法的分析和比较,根据安徽邮政存储银行信息中 心的实际状况,由于新存储系统选用的是hds中端ams230,0与原有高端 9970v存储系

17、统无法进行直接的数据复制。因此,建议采用操作系统镜像方式的实际数据迁移方案。4.1 数据迁移方案描述数据迁移方案架构lan存禽包氏工作站原有光纤交蝴hds ams2300hds 997gvhds oem cisco9124如上图所示,数据迁移方案需要通过操作系统的镜像,在原9970v和新购 得ams2300间进行数据复制。数据迁移的操作前需要对业务系统主机进行 比较繁琐的配置,需要较长的准备时间。4.2 数据迁移方案步骤4.2.1 数据迁移的测试为了保证数据迁移的成功实施,必须在正式进行数据迁移前,对所采 用的技术进行测试。一方面验证技术是否切实可行,另一方面,通过测试, 可以大致了解数据同步

18、的速度,这样就可以计算整个数据迁移所需要的时 间。同时,为了避免数据迁移在业务高峰时段对应用系统的性能造成冲击,可以根据测试得到的数据同步的速度值和每个业务低峰时段持续的时间,把所有相关的lv进行分组,保证每组lv都可以在一个业务低峰时段完成数据同步。这样就可以把对系统性能冲击最大的数据同步操作控制在业务低峰时断 进行。4.2.2 数据迁移的准备1 .安装并配置新储存hds ams23002 .将ams2300划分的lun按用户要求分配给相应的主机3 .在主机端识别新加的lun (pv)aix: #cfgmgr - v#lspvlinux: #dmesg#fdisk - i4 .确认原有的hd

19、lm是否支持ams230,0如果不支持,则需要升级 hdlm,具体升级步骤按hdlm手册执行,需要停机。(hdlm不支持红旗 linux )5 .主机认到新的lun (pv)后,加入到需要迁移的vg中#extendvg vgname hdiskx hdisky6 .确认添加后的vg的状态是否正常#lsvg - i vgname4.2.3数据迁移的实施在准备工作完成的情况下,就可以进行生产数据的迁移工作。为了避免 数据迁移在业务高峰时段对应用系统的性能造成冲击,可以根据测试得到的 数据同步的速度值和每个业务低峰时段持续的时间,来确定执行数据同步的 时间,这样就可以把对系统性能冲击最大的数据同步操

20、作控制在业务低峰时断进行。同步速度主要依赖于主机和存储的性能,目前2g san架构下的主流速度约在150gb/小时左右,综合用户的环境保守估计同步速度约在 100gb/小时左右,而用户的关键业务数据库总数据量约在300gb左右,即迁 移关键业务数据库的同步时间约在3小时左右。关键业务其他数据约 1200gb,迁移时间约要12小时。对于次关键业务数据库数据(150gb)迁移时间约需2小时。次关键业 务其他数据(500gb)迁移时间约需6小时。1 .创建镜像#mirrorvg - m vgname hdiskx hdisky2 .确认镜像同步完成#lsvg -i vgname -所有 iv 都是 syncd 状态3 .测试数据库的可用性,正常则数据库数据镜像成功回退:a.去除新加pv的镜像#unmirror vgname hdiskx hdiskyb.将新盘从vg中去除#reducevg vgname hdiskx hdisky4 .开始停应用,确保对磁盘无任何io操作5 .将9970的光纤线拔出,可以确保原数据保存6 .去除原有pv的镜像#unmirror vgname hdiska hdiskb7 .将原盘从vg中去除#reducevg vgname hdiska hdiskb#varroffvg vgname

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论