AIX6.1操作系统部署方案设计和安装配置指南(V1.1)_第1页
AIX6.1操作系统部署方案设计和安装配置指南(V1.1)_第2页
AIX6.1操作系统部署方案设计和安装配置指南(V1.1)_第3页
AIX6.1操作系统部署方案设计和安装配置指南(V1.1)_第4页
AIX6.1操作系统部署方案设计和安装配置指南(V1.1)_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、aix6.1aix6.1 操作系统部署方案设计和安操作系统部署方案设计和安装装配置指南配置指南(v1.1v1.1)北京数据中心开放系统平台管理部北京数据中心开放系统平台管理部2010-3目目 录录1前言前言.51.1编写目的.51.2预期读者.52系统部署模式系统部署模式.62.1单机模式.62.2基于系统技术的 ha 方案;.62.2.1active-standby主备方式.72.2.2active-active 互备方式.72.2.3一备二模式.72.2.4循环备份模式.82.2.5concurrent并行处理模式.92.3基于软件技术的cluster方案.92.4基于网络硬件设备的负载均

2、衡方案.93应用部署建议应用部署建议.104系统设计考虑的因素系统设计考虑的因素.114.1用户.114.2相关命名.114.3存储/本地盘容量限制.114.4系统网络.124.5参数设置.124.6软件安装.124.7空间规划.134.8安全加固.134.9时钟同步.145命名规范命名规范.155.1资源分配原则.155.1.1设备分档.155.1.2资源调整.155.2机器及机柜的编号规则.155.2.1机柜的命名和编号规则.155.3分区使用规范.165.3.1分区的部署原则.165.3.2分区资源的分配原则.165.4主机命名原则.185.5用户及用户组命名.195.5.1目标.195

3、.5.2指导方针.195.5.3用户组.205.5.4用户.215.5.5用户和组id的分配情况.225.6应用 vg、lv 和文件系统.235.6.1应用vg.235.6.2应用lv的命名.245.6.3lv条带化.255.6.4应用文件系统的使用规范.375.6.5patrol监控使用的文件系统.385.7软件安装路径.255.7.1数据库.255.7.2中间件.255.7.3应用系统.255.8hacmp命名.265.8.1命名规则.265.8.2配置举例.266aix 设计规范设计规范.286.1操作系统的内核.286.2软件包安装规范.286.2.1aix系统需要安装的软件包.286

4、.2.2字符集安装要求.296.3系统补丁的安装规范.296.3.1操作系统.296.3.2adapter 微码.306.4操作系统参数的设置.306.4.1基本操作参数系统环境.306.4.2vmm参数.316.4.3io参数.326.4.4网络参数.336.4.5security参数.346.4.6hacmp相关参数.346.5系统主要文件系统的使用方法.356.5.1/tmp .356.5.2/var.366.5.3/usr .366.5.4/ .366.5.5/home.366.5.6aix文件系统建议值.376.6系统转储空间和交换区的设置.386.6.1dump设置.386.6.2

5、pagingspace设置.386.7用户权限设置.396.7.1用户文件权限规范.396.7.2用户资源限制.396.8口令使用规范.396.8.1口令设置规范.396.8.2口令保存规范.406.8.3用户口令限制.406.8.4root用户口令使用规范.416.9系统安全加固.416.9.1系统安全加固的原则.416.9.2aix系统安全加固.416.9.3 用户path搜索路径.416.10系统网络设置规范.466.10.1ip地址申请.466.10.2网卡速率的设置.496.10.3网卡绑定的设置.496.10.4系统静态路由的设置.496.10.5网络端口的使用.506.11系统监

6、控.506.12系统备份的相关规定.516.13nfs 的使用 .511前言前言1.1 编写目的编写目的为总结我中心开放系统建设的成果,加强开放系统平台建设工作的规范化管理,我们梳理了开放系统平台基础设施设计的相关文档,并进行了深化、细化,力求结合实际的设计、实施工作,对设计、实施起到规范、指导作用。本指南主要从一个设计者的角度进行阐述,相关章节也按此思路编写。作为一个设计者,首先要了解产品可实现的部署模式,如何选择部署模式,其次要考虑设计涉及到的因素,有针对性地做好 ibm 操作系统的设计等;在界线的划分上,基础产品只涉及本产品的设计,上层应用产品对基础产品的需求放在应用产品中,例如,ora

7、cle 部署对 aix 的要求,放在oracle 设计指导中。在编写过程中,特别关注可操作性,不仅仅是要求,而是提出建议,尽量覆盖设计工作中涉及的工作要点。本指南中参数建议值是对系统设计时的指导,是合理的经验值,但由于应用系统的复杂性,每个系统有自己的特点,建议按建议值进行系统的初始配置,在压力测试和系统上线后根据实际需要做相应的调整。1.2 预期读者预期读者项目基础设施可行性研究、设计和实施人员,项目组应用系统设计人员,相关运行维护技术人员。2系统部署模式系统部署模式对于业务中断时间要求高的系统和服务,应该提供高可用性保护。对于业务中断时间要求不高的应用系统,可以考虑采用单机或冷备机方式进行

8、部署。针对网络的不同层次,我们提供了不同的高可用性保护方式。包括:1、基于系统技术的 ha 方案;2、基于软件技术的 cluster 方案;3、基于网络硬件设备的负载均衡方案;4、基于数据库技术的并行处理模式2.1 单机模式单机模式对于业务中断恢复时间要求比较低的非关键系统,可以采用单机的部署模式,单机部署具有以下特点。优点优点1、 硬件成本低。单节点,硬件投入较低,满足非重要系统的需求。2、 安装配置简单,管理维护成本低。缺点缺点1、 可用性不高,由于是单台服务器,没有备机,故障恢复时间较长。2、 扩展性差。2.2 基于系统技术的基于系统技术的 ha 方案;方案;ha 方案方案是服务器生产厂

9、商或第三方提供的,基于硬件设备的系统级软件。它可以提供系统失效接管的自动解决方案,在系统失效后,自动将应用相关资源交由备份机接管,并可以自动恢复业务的运行。应用相关资源包括:网络地址,应用代码、存储和业务数据,进程及相关内存区,相关服务。ha 解决方案的缺点是:技术复杂,需要一整套硬件设施来提供失效接管的冗余结构,包括服务器、网络链路、存储链路、存储空间等,其开销是比较大的,另外,维护成本也相应提高;ha 方案的优点是:业务恢复的时间短,自动化程度高,不需要人工干预。此方案适合部署了数据库软件的服务器使用,对于单数据库、多数据库、并行数据库都适用。部署方式主要有:2.2.1 active-st

10、andby 主备方式主备方式主备方式主备方式 一台服务器为生产机,另一台服务器为备份机,备机平时不提供任何服务。这种方式适用于服务器在故障切换后,要求备机处理能力不能下降的重要系统。对于采用 ha 方式的数据库软件代码、中间件代码、应用代码要求部署在本地,数据部分部署在共享存储上。2.2.2 active-active 互备方式互备方式一般由于服务器数量限制,但又有高可用保护需求的系统,如只有两台服务器的系统一台为 ap,一台为 db 服务器。ap 与 db 服务器配置成互为备份,ap 服务器平时提供应用服务,db 平时提供数据库服务,当任一台服务器故障时,其上的服务会切换到另一台健康的服务器

11、上,继续对外提供服务。此时由于 ap、db 同时运行在一台服务器上,服务器的处理能力会明显下降。这种方式适用于服务器负载相对空闲的系统。部署时还要考虑切换后两个服务使用一台服务器的 cpu、内存资源,由于资源的减少,当 db 服务切换到 ap 服务器上,启动数据库时,需要减小 db 的 sga 区分配等操作(oracle) ,以满足数据库对资源的需求。2.2.3 一备二模式一备二模式 一备二模式类似于主备模式,只是备份服务器同时承担两台生产机的备份工作,优点是可以节省一台备份服务器。如 a 为生产主机,b 为生产主机,c为备份机,c 机同时备份 a 机及 b 机。考虑数据存储的安全,配置一备二

12、的系统,a、b 两台生产机的存储设备不需共享,即不识别对方的存储设备。2.2.4 循环备份模式循环备份模式a-b-c 均为生产机,c 机备份 a 机,c 机备份 b 机,a 机又备份 c 机。这种方式适用于服务器资源紧张的非关键应用,又有高可用保护要求的系统,缺点是只有一台生产服务器发生故障时备机可以接管,当两台服务器同时发生故障时备机无法正常接管。注意:对于采用一备二或者循环备份方式的系统需要考虑两个因素,一是实施要求,集群中的所有服务器需要部署在相同网段;二是维护要求,由于所有服务器均在同一个集群 cluster 中,如果其中的一台主机进行配置变更需要 ha 同步配置时,整个集群中的服务器

13、都需要停下来同步 ha,因此最好是同一套应用系统,且可以同时启停的系统采用一备多的方式。2.2.5 concurrent 并行处理模式并行处理模式适用于 oracle 数据库的 rac 方式等,详细内容见 oracle 设计规范部分。2.3 基于软件技术的基于软件技术的 cluster 方案方案基于软件技术的基于软件技术的 cluster 方案方案,是利用中间件等应用平台软件本身具有的集群功能,将应用部署到多台设备上,在某台设备出现故障时,由其它正常的设备将出现故障的设备上的客户访问请求接管过来,继续提供服务。 (如tuxedo、weblogic、websphere 的集群技术)cluster

14、 方案的缺点是:需要购买额外的 license;配置比较复杂,增加了管理难度;此方案的优点是:不需要购置额外的网络链路、存储链路,也不需要额外的存储空间,业务恢复的时间比较短,只有连接故障服务器的客户需要重新登录;此方案适合那些部署了带有集群功能软件的设备使用,主要适合应用层的中间件服务器使用。2.4 基于网络硬件设备的负载均衡方案基于网络硬件设备的负载均衡方案基于网络硬件设备的负载均衡方案基于网络硬件设备的负载均衡方案,是利用网络负载均衡设备,根据一定的负载均衡算法,将客户端访问请求分配到若干台服务器上,其中任何一台服务器出现故障都不影响业务的正常运行。这种解决方案的优点是:服务器上不需要配

15、置任何冗余部件,也不需要进行任何额外的软件配置,控制简单,服务器扩展平滑简单。缺点是:只能对少数类型的服务提供负载均衡功能。此方案尤其适合 web 服务。3应用部署建议应用部署建议在三层架构中,居于中心位置的是业务数据。相对于业务代码和 web 服务,业务数据的规模比较大,业务数据一旦丢失,整个业务都将陷于停顿,并且难以恢复。因此,应该重点保护业务数据。应用逻辑是重要性相对低一些的部分,恢复相对容易,所以在三层架构中是次要保护对象。重要性最低的是数据展现层,该层没有自己独立的数据和业务逻辑,完全被动地展现经业务逻辑层过滤后的业务数据,因此,它的恢复是最容易的,不需要花费太大的力量进行保护。根据

16、上述分析,结合三层应用架构的特点,我们建议:1、为数据库服务器提供最高级别的可用性保护,也就是基于系统技术的ha 保护。如果业务明确提出,数据重要程度很低或易于恢复,业务对恢复时间的要求也不高,也可以不进行 ha 保护。2、应用层服务器进行基于软件技术的 cluster 保护。因业务逻辑相对容易恢复,所以,我们建议选用 cluster 解决方案。3、针对最简单的 web 层服务器,我们建议用网络负载均衡设备实现服务的高可用性。4系统设计考虑的因素系统设计考虑的因素4.1 用户用户用户分数据库用户、中间件用户、应用用户、应用监控用户、应用维护用户等,不同的用户划分不同的权限及组,避免同一用户拥有

17、不同角色的权限。原则上:1、 应用用户不能属于数据库组也不能属于中间件组2、 用户的 rwx 权限限制,应用监控用户不能对应用程序及配置文件有写和执行权限3、 应用用户不能有启停数据库的权限4、 规范用户口令设置,登陆权限5、 合理设置用户资源限制 limits4.2 相关命名相关命名统一命名规则,需要统一的命名的内容包括:机柜、主机、分区、操作系统、用户、用户组、id、文件系统、卷组、逻辑卷、目录、集群 ha 等。4.3 存储存储/本地盘容量限制本地盘容量限制单个分区本地磁盘一般配置为 2 到 4 块 146gb 的 scsi 硬盘,用于rootvg、软件代码安装。外置存储:1、 数据库服务

18、器、数据加工处理类服务器、需要存储空间很大的系统及有共享需求的系统可以连接外接存储设备。2、 数据库一般使用划分为 raid10 的磁盘,文件系统一般使用划分为raid5 的磁盘。3、 为了合理利用存储及交换机资源,应用服务器、web 服务器、windows服务器一般不连接存储设备。4.4 系统网络系统网络系统网络设置:1、 对于没有 ha 保护的服务器系统,为了提高可用性,网卡配置为双网卡绑定工作,模式为主备模式,两块网卡分别连接主备两台交换机。2、 网卡的速率设置需要与网络部门共同确定,需要与交换机的端口设置保持一致,要求采用自适应模式(包括光口和电口) 。3、 网络参数,根据安装的软件需

19、求,进行合理的设置,以满足应用部署需求。4.5 参数设置参数设置服务器参数设置首先满足其上部署的数据库或中间件对操作系统的参数设置要求,再根据 ibm 的建议值进行设置。参数设置包括1、 pagingspace2、 vmm3、 网络4、 io5、 操作系统位数6、 异步 io7、 时区(使用东八区)8、 语言环境(中文环境)4.6 软件安装软件安装数据库、中间件、应用等软件的代码安装在本地磁盘的文件系统上,安装目录统一命名,并建立相应文件系统,不能使用系统的文件系统作为软件安装目录。例:数据库软件安装在 /home/db/informix中间件安装在/home/mw/weblogic应用软件/

20、home/ap/ocrm4.7 空间规划空间规划1、 系统级文件系统大小设置2、 非系统级文件系统的空间大小根据实际需要进行设置,如/home/db/oracle 10gb/home/db/informix 5gb/home/mw/weblogic 2gb3、 存储空间一般按满足业务数据半年到一年的增长需求进行分配4.8 安全加固安全加固ibm aix 主机操作系统安全加固技术主要是通过对操作系统本身模块和组件的增加,修改或裁剪等技术,屏蔽和消除操作系统自身缺陷和安全漏洞,确保操作系统安全稳定运行,满足业务系统稳定、安全运行的要求。遵循以下原则:1、组件服务最少 最小的服务和组件。 区分服务器

21、的用途和角色,禁止安装不必要的服务和组件。 服务内部组件也应采用上述原则进行裁减。2、最小账户 进行严格的账户管理,实施严格的账户策略。 严格控制增加、修改和删除系统中的账户、群组。 删除所有系统上不使用的账户和数据中心组。3、最小权限 尽可能的降低系统服务、群组和账户的权限。 对操作系统提供权限的授予进行严格限制。 禁止不必要的账户访问不需要的资源。4、专用原则 尽量避免利用一台主机实现多种服务的角色功能。 分区专用,隔离系统、应用和数据所在的分区。安装 openssh 软件,禁用 telnet 服务。定期检查 ibm 发布的 security 补丁建议,补丁链接地址:http:/ 时钟同步

22、时钟同步时间保持一致非常重要,一是便于各个系统管理员的设置系统的时候有一个统一的时间标准;同时也是各个系统,包括操作系统、数据库、中间件、网络、存储等产生的日志有一个统一的时间戳,这样便于分析日志之间的关系。对于有时钟同步需求的系统,配置成时钟同步服务器的客户端,与时钟服务器进行时钟同步。在没有时钟同步服务器的情况下可以采用系统内部服务器之间进行时间同步。5命名规范命名规范5.1 资源分配原则资源分配原则5.1.1 设备分档设备分档 设备分档仅考虑小型机系统; ibm 小型机分三档:p595/590(p690) 、p570(p670) 、p550; 高端设备的配置不小于 16c32g,中端设备

23、的配置不大于 16c32g,低端设备的配置为 4c8g; 高端、中端设备进行分区,分区数不多于 4 个,低端设备不分区;5.1.2 资源调整资源调整 高端设备分区的初始配置为 8c16g 或是 16c32g,当资源不够时,以 2c4g 为单位进行纵向调整; 中端设备分区的初始配置为 8c16g(试点阶段)或 16c32g(推广阶段) ,当资源不够时,以 1c2g 或是 2c4g 为单位进行纵向调整; 低端设备的配置为 4c8g,当资源不够时,进行至中端设备的迁移或是进行横向扩展。 横向扩展的节点数不大于 4 个。 整体的 buffer 冗余量保持在 20%,当冗余量低于 10%时,考虑进行设备

24、扩容。5.2 机器及机柜的编号规则机器及机柜的编号规则5.2.1 机柜的命名和编号规则机柜的命名和编号规则原则上,机柜和机器从进入生产序列,直到退出生产序列,分配的编号始终不变。机柜规则机柜规则:区号(3 位)序列号(5 位) 区号规则如下:1、这里涉及的区号只包括一级分行以上的城市的编号某个城市的区号与该城市的电话区号相同;2、如果同一城市有多个建行机构,例如:总行机构、开发中心、一级分行,那么,以第一位区分。0:总行机构;a:开发中心;b:一级分行举例:北京数据中心 5 楼 010 0 5079 5.3 分区使用规范分区使用规范5.3.1 分区的部署原则分区的部署原则需要进行分区的生产环境

25、设备共分为以下几种 ibm 设备:高端 p690 590 中端 p670 570 高端服务器理论上是用来部署数据库分区的,但必须预留出一定得资源用于以后的扩展;同时从资源的高利用率来考虑,还可以先在这类服务器上部署少量的不适用外置存储的 ap 服务器,当不要时,可方便的将它们迁移出来。 中端服务器主要用于部署 ap 及少量的 db。5.3.2 分区资源的分配原则分区资源的分配原则cpu 资源分配原则(包括内存):1、为了统一管理 cpu 和内存等资源,每个分区最低将按照 4 到 8 个 cpu 进行配置供不同的应用使用,这样配置将便于将来对资源的整合和调整;2、cpu 与内存在分区内将按照 1

26、:2 的原则进行部署,将对有特殊要求的应用项目根据实际需求确定;3、提供给每个应用系统的 cpu 和内存资源将按照分期部署的原则,根据业务发展的速度,逐步为应用系统提供充足的资源;关于服务器的 i/o 配置原则:4、生产服务器:2 到 4 块内置硬盘,做镜像;3 块网卡(2 块为生产用,1块作为管理和备份使用) ;3 块 fc hba 卡(2 块连接 san 中的磁盘系统,一块连接磁带库系统) 。5.3.3 分区硬件资源的冗余划分分区硬件资源的冗余划分对于型号为 p570、p590、p595 的设备,需要划分分区使用时,为了做到板卡冗余配置,如果硬板背板或总线出问题将会影响整个系统运行。为了避

27、免硬件的单点故障,建议遵循以下原则进行板卡划分。1、rootvg 的两块镜像磁盘,分布到不同背板的 i/o 插槽内2、连接存储设备的两块 hba 卡,分布到不同背板的 i/o 插槽内3、网卡的主、备卡,分布到不同背板的 i/o 插槽内不同背板的 i/o 插槽,对于 p59x,背板 p1、p2 是指不同背板或者分布在上下 i/o 抽屉内;对于 p570 不同背板指的是不同的抽屉(满配的 p570 有 4 个抽屉):p59xp59x 的的 p1p1、p2p2p570p570 背板分布图(背板分布图(4 4 个抽屉)个抽屉)背背板板1背背板板2背背板板3背背板板45.4 主机命名原则主机命名原则主机

28、名命名规则为: 行名编码(2 位)+ 环境编号(1 位)+ 应用名编码(3 位)+服务器用途码(2 位)+序号(2 位) 说明:说明: 行名编码为一级分行的企业网代码,总行机构与一级分行在同一城市的,也使用该一级分行编码。 只有总行使用的系统才使用该环境编号,如果是分行使用的系统,则不使用环境编号。环境编号规则如下:生产环境编号:1灾备环境编号:2测试环境编号:3开发环境编号:4 项目缩写的长度为 3 位,全部是英文字符;公共资源类设备的主机名中前三位的规则与机柜编号中区号规则相同。 服务器用途标志长度为 2 位,全部是英文字符,详细说明如下:db(database server):数据库服务

29、器ap(application server):应用服务器wb(web server):web 服务器rp(report server):报表服务器op(operation server):监控服务器ws(workstations):工作站 pr(printers):打印机 ts(terminal servers ):终端服务器dc(domain controllers ):域控制器mx(mail servers):邮件服务器ss(sms servers):sms 服务器 序号取值范围从 01-99; 例:bj1ocrdb015.5 用户及用户组命名用户及用户组命名5.5.1 目标目标确保管理

30、员在定义用户 id 的规则一致为用户 id 密码文件或存储此类信息的文件的规则一致为将来提供全局用户目录服务提供基础对不同应用用户及不同项目组提供一致的用户 id为 lv 提供一个有效的命名思路5.5.2 指导方针指导方针主机分配用户的标准是:用户的名字跟在姓氏的后面,例如张三= zhangsan。如果存在两个名字相同的用户需要为他们的登录或管理任务创建用户 id,应该在名字后面加一个数字,例如 zhangsan2。虽然这里使用了大写字母,但用户名称应该只使用小写字母。用户 id 不能超过 10 个字母和数字。应该为所有服务器都创建一个具有备份权限的特殊用户,该用户的唯一权限是执行软件备份。其

31、用户名应该为“xxxxxx” (填入一个名字) 。该名称不应该是组织中的任何用户,名字的命名要与该用户的工作相关。5.5.3用户组用户组为了保证系统操作的安全性,用户的建立和权限授予应该遵循以下原则:1、 “权限最小化”的原则。2、每个运维人员“建立一个组 id”的原则。除操作系统缺省的用户组外,还应根据应用系统需要,建立不同的用户组,确保访问的安全性。主要有以下几种用户组:用户组用户组权限权限数据库系统管理员组该组用户拥有数据库实例的所有权限。要求在建立时,每个数据库实例建立一个数据库系统管理员组。应用数据库管理员组该组用户具有数据库的 dbadm 权限。要求在建立时,每个应用系统数据库建立

32、一个应用数据库管理员组,对于同一应用系统的数据库可以建立一个应用数据库管理员组。中间件用户组该组用户是生产用户,具有中间件的管理权限。要求在建立时,每个产品一个中间件用户组。应用系统用户组该组用户是生产用户,具有应用系统用户的管理权限。要求每个应用系统建立一个应用系统用户组。维护管理用户组该组用户是管理用户,完成对数据库、中间件和应用系统的监控维护管理。要求每台服务器建立一个维护管理用户组。监控用户组在实际实施过程中,根据上表的指导,再结合应用系统及应用系统选择的数据库和中间件的要求,完成最终的用户组的建立。这些用户组的命名规则如下:用户组用户组组名称组名称备注备注数据库系统管理员组infor

33、mix、dba中间件用户组mqm、mqbrkrs、tuxedo、weblogic、websphere应用管理/维护用户组xxxmtnxxx 是三位的应用缩写,缩写的规则见 2.6.1监控用户组xxxmonxxx 是三位的应用缩写5.5.4 用户用户ps1 用户登录提示符设置用户登录提示符设置vi /etc/profile 文件,增加下面一行:ps1=whoamihostname:$pwd设置后,登陆时提示符会显示如:数据库软件属主数据库软件属主用户名:采用数据库英文名称,例如:informix路径: /home/db/数据库英文名称,例如:/home/db/info

34、rmix用户 id: 数据库的用户 id 从 300 开始分配,如 informix 用户组 id 为 300,informix 用户的 id 为 301,以下依次类推。具体数据库用户及其文件系统情况见后续章节。中间件用户中间件用户用户名:中间件名称,例如:websphere 、weblogic路径:/home/mw /中间件名称,例如:/home/mw/websphere用户 id:中间件的用户 id 从 400 开始分配,如 websphere 用户组 id 为 400,websphere 用户的 id 为 401,mqm 用户组 id 为 410,mqm 用户的 id 为

35、411,以下依次类推。应用系统用户应用系统用户用户名:应用系统英文简称,例如:bdb路径:/home/ap/应用系统英文简称,例如:/home/ap/bdb用户 id:应用系统的用户 id 从 500 开始分配,其它应用类似。用户名称用户名称用户角色用户角色文件权限文件权限组组xxx应用管理用户(属主) rwx管理组(xxx 是应用英文简称,见2.2.5)xxxmtn应用维护用户rw管理组xxxmon应用监控用户r监控组监控用户监控用户、1、监控用户用户名:sfmon、路径:/home/ap/sfmon、用户 id:监控用户 id 从 901 开始分配,组 id 从

36、 900 开始分配。2、patrol 监控用户、用户名:patrol、路径:/home/ap/patrol (为用户建立单独的文件系统) 、用户 id:监控用户 id 从 911 开始分配,组 id 从 910 开始分配。5.5.5 用户和组用户和组 id 的分配情况的分配情况数据库用户 informix 数据库其他用户:在 302-309 之间 oracle 数据库其他用户:在 312-319 之间 db2 其他用户:在 323-329 之间中间件用户 websphere 其他用户:在 402-409 之间 mqm 其他用户:在 412-419 之间 tuxedo 其他用户:在 422-42

37、9 之间 weblogic 其他用户:在 432-439 之间mqbrkrs 其他用户:在 442-449 之间监控用户:监控用户的名称为 patrol,用户 id 为 911,组名称为 patrol,组 id 为 910。各项目组应用用户的分配情况见用户 id 分配表。系统环境中,用户和组 id 分配情况见用户 id 分配表 。5.6应用应用 vg、lv 和文件系统和文件系统5.6.1 应用应用 vg应用应用 vg 命名命名不同项目的 vg 名称必须不同同一项目内不同应用的 vg 也必须不同 vg 命名格式三位项目缩写+vg+2 位数字,对于磁盘数量多的系统参见

38、应用 vg 的划分各项目三位缩写参见 2.2.6 的表格。两位数字编号从 01 开始,编号 00 为根卷组保留,这个编号通常在逻辑卷命名时使用。例如:eaivg01同一项目内的卷组统一编号。使用 mkvg 命令创建卷组时,请使用 the -b-b or -s-s flag 参数以突破每个卷组255 logical volumes and 32 physical volumes (disks)的限制。卷组物理分区大小的规定卷组物理分区大小的规定根卷组的 pp 大小为:aix 系统,physical partition size(pp)设置为256m。为避免空间的浪费,也为避免 pp

39、 太多造成管理难度加大,所以应用卷组的 pp大小不应太大或太小,以 128m/pp 或 256m/pp 为宜。应用应用 vg 的划分的划分对于大型数据库系统,为数据库划分卷组时,尽量将数据按不同的功能区分卷组,以便于管理。这些卷组依据下列规定单独命名,可以遵从以下的规则:xxxyy(nn) (p)tttvgmmxxx 是项目缩写yy 代表数据库用途,详见数据库规范数据库命名部分的规定。nn 代表数据库编号,详见数据库规范数据库命名部分的规定。p 代表数据是分区数据或不分区数据,如果数据库没有分区表,该标志可以不设置;p 代表分区数据或索引;ttt 代表数据类型dat 代表数据;i

40、dx 代表索引;sys 代表数据库系统用数据;mm 代表同类卷组的编号;例如:oracle 数据库划分卷组时可以分为:ecipdsysvg01 数据库系统表空间使用卷组ecipddatvg01 应用分区数据表空间ecipdidxvg01 用户非分区索引表空间5.6.2 应用应用 lv 的命名的命名 lv 命名目标:通过特定的 lv 名字知道此 lv 在哪个 vg 上通过特定的 lv 名字知道此 lv 的用途若此 lv 为文件系统,则通过 lv 名字可知道此 lv 的 mount 点 lv 的均给予以下格式命名:xv0ylzx,代表卷组名字中字母 vg 之前的部分,例如 ecipddatvg01

41、,x 就应该是ecipdat;y 为一位,与 0 一起标识 vg, 如 v00 表示系统 vg,v01 表示第一个应用 vg 等等。z 为 45 位数字(与用户 id 有关) ,00-09 为文件系统,其余为其他设备。z 与特定用户(组)的 id 相关;如和 informix 相关的 lv 编号从 3000-3099,其中 300-309 为 informix 用户范围;3000-3009 为此数据库需要用到的文件系统,裸设备的 lv 编号从 3010 开始。5.6.3 lv 条带化条带化为了提高磁盘 i/o 性能,数据库裸设备 lv 需要做条带化。条带宽度一般不超过 4 块磁盘。存储系统上创

42、建的文件系统使用的 lv,原则上应该做条带化。文件系统使用的逻辑卷的条带宽度以不超过 3 块磁盘比较合适,将来扩展时也比较方便。1、对于日立存储设备 hds,条带大小设置 1mb。2、对于 emc 存储设备,条带大小设置 512kb。5.7 软件安装路径软件安装路径不管是数据库、中间件还是应用软件,建议建立单独的文件系统,且文件系统的 mount 点不要直接建立在根目录下,且不能直接建文件系统/xxx,应该建在/home/ap/xxx 文件系统。5.7.1数据库数据库路径: /home/db/数据库英文名称,例如:/home/db/informix。若安装文件不能定制安装路径,实例配置信息应存

43、放于上述目录。5.7.2 中间件中间件路径:/home/mw/中间件英文名称,例如:/home/mw/websphere。若安装文件不能定制安装路径,实例配置信息应存放于上述目录。5.7.3 应用系统应用系统路径:/home/ap/应用系统英文简称,例如:/home/ap/bdb 等。5.8 hacmp 命名命名5.8.1 命名规则命名规则集群名集群名:xxxyyzz 其中 xxx 代表项目名缩写,yy 代表功能,cl 代表 cluster ,例如 ocrdbcl节点名节点名:与主机名一致网络网络:ip 网络 etherx x=1-9,串口网络 rsx x=1-9ipip labellabel

44、:label xxx+yy+1 位编号+用途,xxx 代表项目缩写,yy 代表功能,编号 1-9,用途有 boot、svc、stb、tty资源组资源组:xxx+yy+1 位编号+res;xxx 代表项目缩写,yy 代表功能,编号 1-9应用服务应用服务:xxx+yy+1 位编号+app;xxx 代表项目缩写,yy 代表功能,编号 1-9启停脚本路径及命名启停脚本路径及命名:1、 在根目录下创建 /hacmp 目录,用于存放启停脚本2、 启动脚本,xxx+yy+zzz+1 位数字+start.sh 例如 ocrdbapp1start.sh3、 停止脚本 xxx+yy+zzz+1 位数字+stop

45、.sh 例如 ocrdbapp1stop.sh4、 启停脚本的权限设置为 rw-r-r5.8.2 配置举例配置举例拓扑配置clustercluster namenameocrdbclocrdbclnode namebj1ocrdb01bj1ocrdb02ip labelocrdb1bootocrdb1svcocrdb1stbocrdb1ttyocrdb2bootocrdb2svcocrdb2stbocrdb2ttynetwork typeethernetethernetethernetrs232ethernetethernetethernetrs232network attributepubl

46、icpublicpublicserialpublicpublicpublicserialnetwork nameether1ether1ether1rs1ether1ether1ether1rs1ip addressadp. id-/dev/tty0-/dev/tty0adp. func.bootservicestdbyservicebootservicestdbyservice资源组划分res.res. grp.grp. namenamenodenode rel.rel.part.part. nodenode namenameocrdb1rescascadingbj1ocrdb01,bj1o

47、crdb02ocrdb2rescascadingbj1ocrdb02,bj1ocrdb01建立 app 应用服务器appapp namenamestartstart scriptscriptstopstop scriptscriptocrdb1app/hacmp/ocrdb1appstart.sh/hacmp/ocrdb1appstop.shocrdb2app/hacmp/ocrdb2appstart.sh/hacmp/ocrdb2appstop.sh配置资源组res.res. grp.grp. namenameserviceservice ipipfilesystemsfilesystems

48、volumevolume groupgroupapplicationapplication serversserversocrdb1resocrdb1svcocrvg01ocrdb1appccrdb2resocrdb2svcocrvg02ocrdb2app6aix 设计规范设计规范6.1 操作系统的内核操作系统的内核aix 系统应使用 64 位的内核及 smt 功能。1、 硬件平台为 64 位,且应用没有特殊要求的情况下安装 64 位操作系统;2、 硬件平台为 32 位,或应用需要 32 位平台的情况下,安装 32 位操作系统;6.2 软件包安装规范软件包安装规范6.2.1 aix 系统需要安

49、装的软件包系统需要安装的软件包1、需要安装的 bundles 软件包包括:app-devcdegraphicsserverperftools2、安装的其它软件包:安装完上述 bundle 之后,请核对下列软件包是否存在,如果不存在,请安装。需要核对的软件包包括:patbos.datax11.adtx.tcp.serverbos.rte.srcbos.rte.libcbos.rte.libcfgbos.rte.libcurbos.rte.libpthreadsbos.rte.odm 如果您要安装并行的资源组,还要安装下面的包:cluster.es.clvm.rtebos.clvm.enh.6.2

50、.2 字符集安装要求字符集安装要求字符集系统的 primary language 语言环境设置采用默认的 en_us,除了英文环境还要安装中文环境,add additional language environments,需要安装中文环境包括:ibm-euccn chinese (simplified euc) zh_cnutf-8 chinese (simplified utf) zh_cngb18030 s-chinese (gb18030) zh_cn6.3 系统补丁的安装规范系统补丁的安装规范6.3.1 操作系统操作系统需要安装的补丁包括:补丁包,补丁包中不包含的其它系统软件的补丁,补

51、丁包中不包含的其它已知 bug 的紧急补丁。1、补丁包每个新上线项目安装补丁包时,应该安装次新的 tl 版本,最新的 sp。2、其它补丁其它系统软件的补丁包括:rsct 的最新补丁。hacmp 的最新补丁。3、紧急补丁ibm 通知的、或已经在生产环境中碰到的 bug 的补丁,在安装的 csp 补丁包中不包含的紧急补丁。补丁升级策略详见aix 操作系统版本升级策略.doc6.3.2 adapter 微码微码为了更好的与存储设备兼容,对于光纤卡,微码使用最新原则,参见 ibm 网站上发布的最新补丁根据光纤卡的 feature code 和 part number 确定光纤卡型号。可以用命令 lsc

52、fg vl fcsx 查到,z9 field will have the firmware level。或 lsmcodelsmcode -d-d fcsxfcsx链接地址:http:/ 操作系统参数的设置操作系统参数的设置以下参数是针对操作系统 aix6.1 进行的设置。在应用没有特殊要求的情况下,操作系统参数按照下面的规定进行设置,表中的参数值为通用值,对 ap和 bd 均适用。在需要按装某种特定软件(例如,oracle、informix、was、tuxedo、weblogic 等)的情况下,操作系统参数的设置应该根据这些软件或应用的实际要求进行设置。6.4.1 基本操作参数系统环境基本操

53、作参数系统环境序号序号参数参数参数名称参数名称defaultdefault建议值建议值调整原则及注释调整原则及注释1用户最大进程数maxuproc1288192+如果应用实际需要启动的进程数大于这个值,根据实际需求数调整。2系统资源限制情况ulimit/etc/security/limits 文件设置: fsize = 2097151 core = 2097151 cpu = -1 data = 262144 rss = 65536 stack = 65536 nofiles = 2000对数据库及应用用户无限制,设置为 -1;对其它维护用户、监控用户等非关键用户采用默认值。1,如果限制 da

54、ta, rss, stack 的大小,有可能使应用因为内存资源不足而意外中止。2,如果限制fsize,nofiles ,有可能因为文件大小的受限制或者打开多于限制之上的文件数量而导致应用失败;4,设置成无限制后,当应用程序异常,打开大量的文件时,没有限制打开的文件数,直到消耗所有系统资源。3交换空间paging space系统默认配置和内存大小相关根据内存需求和使用率设置合理的 paging space 值;1、内存配置在 16g 以下:与内存大小一致;2、内存配置在 16g 以上,交换区初始大小设置为 16g,以后根据实际使用情况进行调整;设置合理的paging space 值以防内存耗尽而

55、导致系统 hung 4dump 设备dump device和内存大小相关运行/usr/lib/ras/dumpcheck p 来检查并设置合理的 dump lv 的大小一旦系统崩溃,可以得到完整的 dump 数据5总是允许系统转储的选项always allow dump关闭开启总是允许系统转储的选项:# sysdumpdev -k开启该选项后,在系统未异常宕机但是处于 hang机状态的情况下,可以通过一些特殊的外部干预方式产生转储数据,以帮助分析 hang 机的原因。6.4.2 vmm 参数参数序号序号参数参数参数名称参数名称defaultdefault建议值建议值调整原则及注释调整原则及注释

56、1空闲列表中可接受的实际内存页面帧的最小数量maxfree108810882空闲列表中可接受的实际内存页面帧的最大数量minfree960960不正确的配置会引起 vmm换页问题;1.maxfree=minfree + (#cpus x maxpgahead) / memory pool;2.minfree=max(960, #cpu x120) /memory pool3.memory pool 确定 vmstat -v|grep memory pool4.maxpgahead 确定 ioo a|grep head3用于缓存非maxperm%90%90%1.可以消除因高文件页面计算性分页的最

57、大内存量用于缓存非计算性分页的最小内存量minperm%3%3% 用于缓存非计算性客户端分页的最大内存量的限制maxclient%90%90%lru 算法lru_file_repage00访问率而导致的计算内存被换页;2.minperm%值,如果数据库服务器为单纯的db,没有其它应用或文件类操作,可以设置更小值如:5%rbroffonmount filesystem with the release-behind-when-reading capability. when sequential reading of a file in this filesystem is detected,

58、the real memory pages used by the file will be released once the pages are copied to internal buffers. set this option when backup a filesystem to other device, e.g: tape avoid running out of working memory4日志类一次性读写类文件系统 mount 参数rwboffonmount filesystem with the release-behind-when-writing capabilit

59、y. when sequential writing of a file in this filesystem is detected, the real memory pages used by the file will be released once the pages written to disk. set this option when a filesystem is used for data backupavoid running out of working memory.6.4.3 io 参数参数序号序号参数参数参数名称参数名称defaultdefault建议值建议值调

60、整原则及注释调整原则及注释1异步 ioaioononrequired by databasecio onon2文件系统mountfsfastpath11对于基于文件系统创建的数据库,建议用 cio 来mount,以提高性能。同时enable fsfastpath ,命令是:aioo -o fsfastpath=16.4.4 网络参数网络参数序号序号参数参数参数名称参数名称defaultdefault建议值建议值调整原则及注释调整原则及注释1clean_partial_connsclean_partial_conns01clean_partial_conns 用途:启动 clean_partia

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论