




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、什么是multipath普通的电脑主机都是一个硬盘挂接到一个总线上,这里是一对一的关系。而到了有光纤组成的SAN环境,由于主机和存储通过了光纤交换机连接,这样的话,就构成了多对多的关系。也就是说,主机到存储可以有多条路径可以选择。主机到存储之间的IO由多条路径可以选择。既然,每个主机到所对应的存储可以经过几条不同的路径,如果是同时使用的话,I/O流量如何分配?其中一条路径坏掉了,如何处理?还有在操作系统的角度来看,每条路径,操作系统会认为是一个实际存在的物理盘,但实际上只是通向同一个物理盘的不同路径而已,这样是在使用的时候,就给用户带来了困惑。多路径软件就是为了解决上面的问题应运而生的。多
2、路径的主要功能就是和存储设备一起配合实现如下功能:1. 故障的切换和恢复2. IO流量的负载均衡3. 磁盘的虚拟化二、为什么使用multipath由于多路径软件是需要和存储在一起配合使用的,不同的厂商基于不同的操作系统,都提供了不同的版本。并且有的厂商,软件和硬件也不是一起卖的,如果要使用多路径软件的话,可能还需要向厂商购买license才行。比如EMC公司基于linux下的多路径软件,就需要单独的购买license。其中,EMC提供的就是PowerPath,HDS提供的就是HDLM,更多的存储厂商提供的软件,可参考这里。当然,使用系统自带的免费多路径软件包,同时也是一个比较通用的包,可以支持
3、大多数存储厂商的设备,即使是一些不是出名的厂商,通过对配置文件进行稍作修改,也是可以支持并运行的很好的。 请与IBM的RDAC、Qlogic的failover驱动区分开,它们都仅提供了Failover的功能,不支持Load Balance负载均衡方式。但multipath根据选择的策略不同,可支持多种方式,如:Failover、Multipath等。Failover的功能解释:通俗地说,即当A无法为客户服务时,系统能够自动地切换,使B能够及时地顶上继续为客户提供服务,且客户感觉不到这个为他提供服务的对象已经更换。这里的A和B可以存在于各种领域,但一般fail-over特指计算机领域的数据库、应
4、用服务、硬件设备等的失效转移。三、multipath的组成我这里以红帽x86_64为例,虽然版本比较老,但下面的配置方式基本适用后面的所有版本。引用# cat /etc/redflag-releaseRed Flag DC Server release 5.0 (Trinity SP2)# uname -aLinux localhost.localdomain 2.6.18-164.el5 #1 SMP Tue Aug 18 15:51:48 EDT 2009 x86_64 x86_64 x86_64 GNU/Linux# rpm -qa|grep devicedevice-mapper-ev
5、ent-1.02.32-1.el5device-mapper-1.02.32-1.el5device-mapper-multipath-0.4.7-30.el5device-mapper-1.02.32-1.el5这些是需要安装的安装包,如果没有安装需要到安装光盘中# rpm -ivh device-mapper-*将以上这些包全部安装# chkconfig -list |grep multipathmultipathd0:关闭1:关闭2:关闭3:关闭4:关闭5:关闭6:关闭# chkconfig multipathd on可见,一套完整的multipath由下面几部分组成:1. device
6、-mapper-multipath提供multipathd和multipath等工具和multipath.conf等配置文件。这些工具通过device mapper的ioctr的接口创建和配置multipath设备(调用device-mapper的用户空间库。创建的多路径设备会在/dev/mapper中);2. device-mapperdevice-mapper包括两大部分:内核部分和用户部分。内核部分由device-mapper核心(multipath.ko)和一些target driver(dm-multipath.ko)构成。dm-mod.ko是实现multipath的基础,dm-mu
7、ltipath其实是dm的一个target驱动。核心完成设备的映射,而target根据映射关系和自身特点具体处理从mappered device 下来的i/o。同时,在核心部分,提供了一个接口,用户通过ioctr可和内核部分通信,以指导内核驱动的行为,比如如何创建mappered device,这些device的属性等。用户空间部分包括device-mapper这个包。其中包括dmsetup工具和一些帮助创建和配置mappered device的库。这些库主要抽象,封装了与ioctr通信的接口,以便方便创建和配置mappered device。device-mapper-multipath的程
8、序中就需要调用这些库;3. scsi_id其包含在udev程序包中,可以在multipath.conf中配置该程序来获取scsi设备的序号。通过序号,便可以判断多个路径对应了同一设备。这个是多路径实现的关键。scsi_id是通过sg驱动,向设备发送EVPD page80或page83 的inquery命令来查询scsi设备的标识。但一些设备并不支持EVPD 的inquery命令,所以他们无法被用来生成multipath设备。但可以改写scsi_id,为不能提供scsi设备标识的设备虚拟一个标识符,并输出到标准输出。multipath程序在创建multipath设备时,会调用scsi_id,从其
9、标准输出中获得该设备的scsi id。在改写时,需要修改scsi_id程序的返回值为0。因为在multipath程序中,会检查该直来确定scsi id是否已经成功得到。四、配置multipath原理看了一堆,实际配置还是比较简单的。配置文件只有一个:/etc/multipath.conf 。配置前,请用fdisk -l 确认已可正确识别盘柜的所有LUN逻辑单元号,HDS支持多链路负载均衡,因此每条链路都是正常的;而如果是类似EMC CX300这样仅支持负载均衡的设备,则冗余的链路会出现I/O Error的错误。multipath.conf的配置参数、默认值,可参考:1、编辑黑名单默认情况下,m
10、ultipath会把所有设备都加入到黑名单(devnode *),也就是禁止使用。所以,我们首先需要取消该设置,把配置文件修改为类似下面的内容:# vim /etc/multipath.confdevnode_blacklist #devnode * 用#将此行注释掉 devnode hda wwid 3600508e000000000dc7200032e08af0b这里禁止使用hda,也就是光驱。另外,还限制使用本地的sda设备,这个wwid,可通过下面的命令获得:# scsi_id -g -u -s /block/sda3600508e000000000dc7200032e08af0b2、
11、编辑默认规则不同的device-mapper-multipath或操作系统发行版,其默认的规则都有点不同,以RedHat x86_64为例,其path_grouping_policy默认为failover失效转移,也就是主备的方式。这明显不符合我们的要求。(HDS支持多路径负载均衡,EMC CX300等只支持Failover)。所以,我们需要修改默认的规则:defaults udev_dir /dev path_grouping_policy multibus failback immediate no_path_retry fail user_friendly_name yes关键是path
12、_grouping_policy一项,其他选项可参考说明文档。3、启动服务及生成映射# modprobe dm-multipath# service multipathd restart# multipath -v04、查看复合后的设备# multipath -ll会看到类似下面的信息:mpath0 (360060e80058e980000008e9800000007)size=20 GBfeatures=0hwhandler=0_ round-robin 0 prio=1active_ 3:0:0:7 sdaa 65:160 activeready_ round-robin 0 prio=1
13、enabled_ 4:0:0:7 sdas 66:192 activeready_ round-robin 0 prio=1enabled_ 5:0:0:7 sdbk 67:224 activeready_ round-robin 0 prio=1enabled_ 2:0:0:7 sdi 8:128 activeready这说明,已由四条链路sdaa/sdas/sdbk/sdi复合成一条链路,设备名为mpath0。状态正常的话,把multipathd设置为自启动:# chkconfig multipathd on# mkdir /oradata# mkfs.ext3 /dev/mapper/m
14、path0# mkfs.ext3 /dev/mapper/mpath1# blkid /dev/mapper/mpath0生成该存储设备的UUID# blkid /dev/mapper/mpath1# vim /etc/fstab(修改该配置文件并添加如下)UUID=47931c90-140b-45fe-9dfa-5a0f56810db3 /oradata ext3 defaults 0 0保存退出# mount -a注意:要使用哪块存储设备就在fastab里面挂载就可以了5、使用mpath设备用multipath生成映射后,会在/dev目录下产生多个指向同一条链路的设备:/dev/mappe
15、r/mpathn/dev/mpath/mpathn/dev/dm-n但它们的来源是完全不同的:/dev/mapper/mpathn 是multipath虚拟出来的多路径设备,我们应该使用这个设备;/dev/mpath/mpathn 是udev设备管理器创建的,实际上就是指向下面的dm-n设备,仅为了方便,不能用来挂载;/dev/dm-n 是软件内部自身使用的,不能被软件以外使用,不可挂载。简单来说,就是我们应该使用/dev/mapper/下的设备符。对该设备即可用fdisk进行分区,或创建为pv。6、分区或创建lvm以前,我考虑到从系统iostat看到的都是dm-n的设备,所以一直都是直接对d
16、m-n操作。但这会产生一个问题,就是没法分区。而对/dev/mapper/mpathn设备操作就没有这问题。只要要注意,用fdisk分区并保存后,必须刷新multipath的映射表,以便其创建分区对应的设备符,例如:# fdisk -l /dev/mapper/mpath0Disk /dev/mapper/mpath0: 214.7 GB, 214748364800 bytes255 heads, 63 sectors/track, 26108 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytes Device Boot Start
17、 End Blocks Id System/dev/mapper/mpath0p1 1 26108 209712478+ 83 Linux# multipath -F#删除现有路径 两个新的路径就会被删除# multipath -v0#格式化路径# ll /dev/mapper/mpath0p1brw-rw- 1 root disk 253, 2 5月 7 07:40 /dev/mapper/mpath0p1同样的,mpathn或其分区都可用来做pv使用:# pvcreate /dev/mapper/mpath0p1# vgcreate test /dev/mapper/mpath0p1# l
18、vcreate -L 1g -n lv1 test# lvdisplay# mkfs.ext3 /dev/test/lv1 注意:根据网上的资料,有部分multipath版本存在与lvm兼容的问题。具体表现是,使用device-mapper设备创建lvm完成,重启后,虽然lvm仍存在,但/dev/mapper下的设备丢失。为了防止可能的意外,建议还是修改一下lvm的配置文件/etc/lvm/lvm.conf,加入:types=device-mapper, 17、其他最简单的测试方法,是用dd往磁盘读写数据,然后用iostat观察各通道的流量和状态,以判断Failover失效转移或负载均衡方式是
19、否正常:# dd if=/dev/zero of=/dev/mapper/mpath0# iostat -k 2另外,如果是在由多台服务器构建集群环境中,为了让每台服务器识别的mpathn设备顺序一致,需进行wwid的绑定工作,请参考后面“自定义设备名称”中的内容。五、答疑1、为什么黑名单中不直接使用devnode sda 呢?因为按Linux对设备的编号,当设备从sda到sdz时,后一个设备应该是sdaa。而multipath对黑名单的设置是以匹配的方式进行的,也就是说,如果你设置为devnode sda,那么除了sda为,sdaa、sdab等的设备(通道)都会被加入到黑名单中,而禁止使用。
20、当然,你也可以参考配置文件中的样式,以正规表达式的形式进行描述:devnode sda$。但考虑到每次重启后,udev分配的盘符可能都不同(没有做udev绑定的情况),所以,我觉得以wwid的方式处理更可靠。2、为存储定制特定的策略在前面的配置中,我们已经在/etc/mulitpah.conf中配置了多路径的默认path_grouping_policy为multibus。但有时候,同一台机器上如果连接了一个以上的存储时,可能默认规则并不完全适用。这时,我们可以给特定的存储定制多路径符合的策略。a、mulipath命令该命令提供了一个-p的参数,可以修改默认策略,参数有:-p policy fo
21、rce all maps to specified policy : failover 1 path per priority group multibus all paths in 1 priority group group_by_serial 1 priority group per serial group_by_prio 1 priority group per priority lvl group_by_node_name 1 priority group per target node例如,执行:# multipath -F# multipath -p failover -v0有
22、如下结果:引用mpath18 (360060e8010463ef004f2b79f00000006)size=320 GBfeatures=0hwhandler=0_ round-robin 0 prio=2active_ 5:0:0:6 sdaf 65:240 activeready_ 4:0:0:6 sdv 65:80 activeready_ round-robin 0 enabled_ 2:0:0:6 sdb 8:16 activeready_ 3:0:0:6 sdl 8:176 activeready这说明,当你对mpath18设备读写时,sdaf、sdv 会处于active状态,都
23、有数据流,但sdb、sdl 组成的链路是enabled,作为ready情况。这为Failover(主备)情况,仅当sdaf、sdv组成的链路出现问题时,才会切换到sdb、sdl 的链路上。b、修改配置文件可以在配置文件中为指定的存储定义策略。首先,可以用multipath -v3 -ll 看看存储的信息,例如,我这里的机器就同时连接了两个不同的存储:= path info sdaa (mask 0x5) =bus = 1dev_t = 65:160size = 10487040vendor = HITACHI product = OPEN-V rev = 6006h:b:t:l = 2:0:1
24、:24tgt_node_name = 0x50060e80058e9800path checker = readsector0 (internal default)state = 2uid = 360060e80058e980000008e9800000058 (cache)= path info sdaf (mask 0x5) =bus = 1dev_t = 65:240size = 671088640vendor = HITACHI product = DF600F rev = 0000h:b:t:l = 3:0:0:6tgt_node_name = 0x50060e8010463ef1p
25、ath checker = readsector0 (internal default)state = 2uid = 360060e8010463ef004f2b79f00000006 (cache)默认情况下,multipath已经支持大部分常见的存储型号(可见multipath.conf.defaults),但不同的multipath版本可能都有些不同。这时,建议参考存储的官方文档:devices device vendor HITACHI /厂商名称 product OPEN-V /产品型号 path_grouping_policy group_by_prio /默认的路径组策略 get
26、uid_callout /sbin/scsi_id -p 0x80 -g -u -s /block/%n /获得唯一设备号使用的默认程序 path_checker readsector0 /决定路径状态的方法 path_selector round-robin 0 /选择那条路径进行下一个IO操作的方法 prio_callout /sbin/mpath_prio_alua /dev/%n /获取有限级数值使用的默认程序 failback immediate /故障恢复的模式 hardware_handler 0 /确认用来在路径切换和IO错误时,执行特定的操作的模块。 no_path_retry queue /在disable queue之前系统尝试使用失效路径的次数的数值 rr_min_io 100 /在当前的用户组中,在切换到另外一条路径之前的IO请求的数目 千万不要写错
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国卧式调速电动机市场分析及竞争策略研究报告
- 2025至2030年中国单点电控燃油喷射系统行业投资前景及策略咨询研究报告
- 2025至2030年中国半透高流动性PP降温母粒行业投资前景及策略咨询报告
- 2025至2030年中国医用纯化水设备行业发展研究报告
- 2025至2030年中国加边墙汽车篷市场调查研究报告
- 2025至2030年中国制版设备配件数据监测研究报告
- 2025至2030年中国冰箱密封热熔胶市场现状分析及前景预测报告
- 记者证考试重点内容与试题及答案
- 2024年记者证求解思路与试题及答案
- 工厂工件搬运合同范本
- 左宗棠课件完整版
- 中药学电子版教材
- 市政道路电力、照明、通信管道工程施工方案方案
- 球的体积和表面积说课稿
- GB/T 30726-2014固体生物质燃料灰熔融性测定方法
- 可吸收丝素修复膜(CQZ1900597)
- 凯莱通综合版
- 步行功能训练详解课件
- 物理讲义纳米光子学
- 保洁服务礼仪培训(共55张)课件
- 中考英语写作指导课件(共41张PPT)
评论
0/150
提交评论