数据库技术方案_第1页
数据库技术方案_第2页
免费预览已结束,剩余22页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选欢迎下载广西区质量技术监督局数据库维保服务方案南宁秦唐科技有限公司2016 年 8 月目录广西区质量技术监督局数据库 .1维保服务方案 .11项目背景及目标 .51.1项目背景 .51.2项目目标 .52需求分析 .6精选欢迎下载3维保范围 .74数据库维保方案 .84.1系统健康状态检查 .84.1.1Oracle数据库运维主要核查项 .84.1.2Mysql数据库运维主要检查项 .154.1.3SqlServer数据库运维主机检查项 .164.2数据库性能分析与优化调整 .174.3数据库备份以及恢复服务 .184.4数据库补丁分析与安装 .184.57*24小时数据库救援服务 .18

2、5技术支持以及服务体系 .195.1故障处理要求 .195.2重大活动现场护航 .205.3维护作业计划 .205.4信息安全保障 .205.5第三方协助服务 .215.6服务质量分析 .216项目实施以及管理 .216.1项目实施策略 .216.2.项目实施计划226.3.项目精选欢迎下载交付文档226.4.交付要求22精选欢迎下载6.5提交文件资料. 23精选欢迎下载1项目背景及目标1.1项目背景广西区质量技术监督局信息化建设经过多年的发展和完善, 已经建立成熟的网络环境及生产经 营管理的各类应用系统, 目前质监局拥有多套不同类型的数据库 (多种操作系统) 混合使用(Oracle,Mysq

3、l,SqlServer),共十几个节点,其中最大的oracle生产数据库已高达3TB;随着质监工作的 业务发展,各系统数据量逐年增加 ,作为业务核心的数据库,安全性,可靠性的要求也变得越来 越高,需要更加专业细致地对数据库维护,以便更好地为全区质监工作提供IT服务。1.2项目目标通过建立规范的维护作业体系,及时发现数据库运行中的风险问题,防患于未然,保障数据库 运行健康持续。对数据库运行性能进行监测分析, 及时发现瓶颈, 通过外部资源调优、 行的重新安排调优、SQL性能调优、表格和索引存储参数设置调优等方式,及时对性能问题进行处理,保障数据库稳定高效 工作;对各个系统数据库进行补丁升级服务,

4、安装补丁前需要对补丁的可行性及风险性进行分析, 并 制定升级计划和应急回退计划。同时要做好系统备份准备及详细的测试工作,确保系统的稳定性、 安全性,保障系统业务数据的安全;精选欢迎下载2需求分析广西区质量技术监督局项目现场多种数据库共存,相互为多个应用系统服务。为保证数据库系统的稳定、安全、合理和高效,减低故障对生产的影响,消除生产故障的薄弱环节,现需购买对以下数据库的保修和维护服务。ID数据库节点数据库类型应用说明保障级别1oracle rac 双节点(HP 主机)oracle10g金质工程核心数据库重要2oracle rac 双节点(Linux)oracle10g金质工程核心数据库重要3O

5、racle 单节点Oracle 10g边界交换数据库重要4Oracle 单节点Oracle 10g云平台数据库(内网)重要5Oracle 单节点Oracle 10g云平台数据库(外网)重要6SQL SERVERMSCS1mssql server2008外部门户数据库重要7SQL SERVERMSCS2mssql server2008外部门户数据库重要8SQL SERVERMSCS3mssql server2008OA 考核重要精选欢迎下载10SQL SERVERMSCS4mssql server2008重要11mysql 集群 1普通12mysql 集群 2普通3维保范围1)提供常态化服务和技

6、术支持,并配备资深工程师,工程师熟悉oracle/sqlserver/mysql等各种主流数据库技术,保证能快速、有效的解决各类故障。2)配置和优化系统安全、加固,故障的诊断与排除等。3)数据库系统恢复服务,确保系统崩溃后的快速恢复。4)为客户提供各个版本数据库系统运行和维护的合理建议。5)数据库系统软件升级(用户要求)和不限次(或配合用户)安装。6)对数据库系统本身存在的安全隐患和安全问题,进行修复;对系统配置和数据定期备份7)提供系统维修及维护报告。精选欢迎下载4数据库维保方案数据库维保工作主要包括: 数据库健康状态检查、 数据库性能分析与调整、 数据库备份与恢复、 数据库补丁分析与安装、

7、7*24小时数据库救援等工作。4.1系统健康状态检查检查内容包括:Oracle数据库和CRS错误日志和分析; 文件系统空间使用情况检查;Oracle数据库及RAC系统运行情况状态、性能分析和优化建议;检查其OS状况,包括CPU、内存和交换区使用情况,硬盘和网络的IO情况检查;记录Oracle数据库存储空间的逻辑结构;Oracle数据库备份情况检查;等根据检查结果分析并给出数据库可行的调整建议和实施;每月至少进行一次系统健康状态的检查,根据制定的维保服务内容和流程对Oracle、Mysql,SqlServer进行一次全面巡检,包括检查数据库设备、系统的运行情况;每月25日之前提供数据库 巡检报告

8、。4.1.1 Oracle 数据库运维主要核查项数据库的运维主要结合广西质量技术监督局的实际情况, 提供切实可行的运维建设机制, 内 容覆盖ORACLE数据库的日常维护、 紧急故障处理, 软件升级等, 客户可依据服务内容进行相应的定制。我们将会提供全面的、针对性的服务解决方案,以保客户系统稳定、高效、可靠的运 行,以达到对业务系统的有精选欢迎下载效支持。检查数据库cpu、I/O、内存性能记录数据库的cpu使用、10、内存等使用情况,使用vmstat,iostat,sar,top等命令进行信息收集并检查这些信息,判断资源使用情况。检查rman备份的有效性restore

9、 preview/restore database preview命令此命令用来查看还原需要使用哪个备份集来执行特定的恢复使用validate和check logical参数的restore命令,检查备份集,以确认数据库是可恢复的restore database validate使用check logical参数可以更完全的检查最新备份集runrestore database check logical validate;使用validate backupset命令使用具有validate参数或check logical参数的restore命令只能检查最新的备份集如果要检查任意的备份集,就需要

10、用validate backupset命令。精选欢迎下载首先必须确认要检查的备份集的键(backup set key)list backupset;再执行检查validate backupset 141;或validate backupset 141 check logical;检查oracle数据库集群运行状况用crs_stat-命令检查oracle数据库的几个集群模块是否有offline的检查数据库的Alert.log日志,是否有ora错误对每个数据库,cd至I bdump目录,通常是$ORACLE_BASE/admin/bdump查看最新时候有ora错误,找出

11、来分析收集每个数据库的AWR报告,根据报告内容,优化数据库排查是否存在影响系统性能的等待事件、top 5 SQL、硬解析是否太高、缓冲区命中率是否高检查ASM磁盘组空间是否足够selectin sta nce_n ame,host_ name,startup_time,status,database_statusfromgv$in sta nee;确保数据磁盘组有足够的空间给数据库使用,如果是用于归档日志用的ASM磁盘组空间满,必须及时用rman备份并删除旧的归档日志。检查各个数据库操作系统的磁盘空间利用率df -h或者df -m文件系统空间使用率超过

12、80%,必须要清理磁盘无用的文件或者日志精选欢迎下载检查数据库各个节点都处于读写模式select n ame,log_mode,ope n_mode from gv$database;各个节点都正常,数据库才能实现负载均衡和失败切换的功能查看表空间使用率,及时添加数据文件SELECTUPPER(F.TABLESPACE_NAME)表空间名,D.TOT_GROOTTE_MB 表空间大小(M),D.TOT_GROOTTE_MB - F.TOTAL_BYTES 已使用空间(M),TO_CHAR(ROUND(D.TOT_GROOTTE_MB - F.TOTAL_BYTES)

13、 /D.TOT_GROOTTE_MB * 100,2),990.99)使用比,F.TOTAL_BYTES 空闲空间(M),F.MAX BYTES 最大块(M)FROM (SELECT TABLESPACE_NAME,ROUND(SUM(BYTES) / (1024 * 1024), 2) TOTAL_BYTES,ROUND(MAX(BYTES) / (1024 * 1024), 2) MAX BYTESFROM SYS.DBA FREE SPACEGROUPBY TABLESPACE NAME) F,(SELECT DD.TABLESPACE_NAME,ROUND(SUM(DD.BYTES)

14、/ (1024 * 1024), 2) TOT GROOTTE MBFROM SYS.DBA_DATA_FILES DD精选欢迎下载GROUPBY DD.TABLESPACE_NAME) DWHERE D.TABLESPACE_NAME = F.TABLESPACE_NAMEORDERBY4DESC;密切关注各个表空间使用情况,使用率查过85%以上的,要及时添加数据文件到表空间,并与上个月巡检结果对比,估算主要业务表空间增长增长情况,一次性添加做过数据文 件0检查失效的索引Select * from dba_indexes where status=UNUSABLE:如果有失效索

15、引,alter in dex in dex_name rebuild online在线重建。1检查大表,分析是否需要转换成分区表存放SELECT SEGMENT_NAME, ROUND(SUM(BYTES) / 1024 / 1024 / 1024, 2) GFROM DBA_SEGMENTSWHERE OWNER NOTIN (SYS, SYSTEM)AND segme nt type NOTIN(INDEX, INDEX PARTITION, INDEX SUBPARTITION)GROUPBY SEGMENT_NAMEORDERBY G DESC;对于日志大表,建议改造成采

16、用按时间分区的分区表,提升数据库读写效率。2检查oracle每个实例的的实际连接数和数据库配置的连接数精选欢迎下载Select count(1) from v$session;-实际连接的session数量show parameter sessi on;如果实际连接的session连接数快要达到系统配置的session数量,需要增加session的数量,以免有业务无法正常连接数据库3检查数据库运行慢的SQLSELECT USERNAME,SID,OPNAME,ROUND(SOFAR * 100 / TOTALWORK, 0) | % AS PROGRESS,TIME

17、_REMAINING,SQL_TEXTFROM V$SESSION LONGOPS, V$SQLWHERE TIME_REMAINING 0AND SQL_ADDRESS = ADDRESSAND SQL_HASH_VALUE = HASH_VALUE;4检查占用CPU比较多的SQLSELECT P.PID PID,S.USERNAME USERNAME,S.OSUSER OSNAME,精选欢迎下载P.SERIAL# S_#,P.TERMINAL,P.PROGRAM PROGRAM,P.BACKGROUND,S.STATUS,RTRIM(SUBSTR(A.SQL_TEXT, 1,

18、 80) SQLFROM V$PROCESS P,V$SESSION S,V$SQLAREA A WHERE P.ADDR = S.PADDR AND S.SQL_ADDRESS =A.ADDRESS(+) AND P.SPID LIKE%&1%;5检查最消耗内存资源的SQLselect b.pga_alloc_mem / 1024 / 1024, a.* rom v$sessi on a, v$process b where a.PADDR = b.addr andpga_alloc_mem / 1024 / 1024100;精选欢迎下载4.1.2 Mysql 数据库运维主要检

19、查项检查数据库备份是否正常检查是否有备份机制,已有备份机制,且最后一个备份成功为正常检查数据库后台日志,最近是否有error错误检查data目录下host_name.err近期是否有错误检查MySQL数据库连接统计show status;检查Aborted_clients由于客户没有正确关闭连接已经死掉,已经放弃的连接数量。Aborted_connects尝试已经失败的MySQL服务器的连接的次数。Threads_connected当前打开的连接的数量。Max_used_connections同时使用的连接的最大数目以Max_used_connecti

20、ons远小于f中的最大连接数目则正常。如果接近则考虑增 大最大数目。检查MySQL数据库表锁统计(包括立即锁及等待锁)show status like table%;如果waited的数值比较高,说明数据库锁争用比较严重主库查看状态Show master status查询从服务器状态Show slave status,经常检查从服务器的复制状态,防止复制过程中出现故障从而导致 进程停止Mysql连接数排查精选欢迎下载Show variables like%max_connectins%Show gloable status likemax

21、_use_connections 当前数据库已经使用的最大连接数不能超过阀值Mysql文件打开数检查Show global status likeopen_files;Show variables likeopen_files_limit 打开数量要小于limit值4.1.3 SqlServer数据库运维主机检查项检查数据库自动备份是否正常检查是否有备份机制,以有备份机制,且最后一个备份成功为正常验证备份集验证备份集(RESTORE VERIFYONLY )检查数据库集群是否能正常工作检查磁盘空间是否足够检查数据文件所在的磁

22、盘空间使用情况 检查日志文件所在的磁盘空间使用情况 检查备份的磁盘空间使用情况检查系统日志使用 “事件查看器 ”,查看系统日志,关注错误信息排查错误。 重点关注与SQLServer相关的日志信息。及时备份与清理过期的日志信息。4.2数据库性能分析与优化调整根据用户需要进行数据库的性能分析,针对发现的问题提出合理的解决方案;每月巡检中包含 对数据库运行性能的分析。精选欢迎下载主要包括:数据库性能的监控和调整、系统资源的监控及管理。如:优化服务器配置根据现有硬件配置及用户访问量及服务器性能指标,确定是否存在系统(cpu,内存,硬盘)瓶颈及数据库配置问题,提出解决瓶颈的方法及建议。优化

23、应用程序根据应用程序配置,确定是否存在应用程序问题使系统运行缓慢,提出应用程序优化建议(如:负载均衡)。数据库及应用程序整合分析数据库与应用布局是否合理,提出整合建议。数据库参数调整优化参数,使数据库在最优的环境下运行。数据库潜在重要问题数据库是否存在潜在问题,对数据库有什么重要的影响,或深圳广西质量技术监督局方面认 为紧急的。优化内存配置与系统后台进程优化物理文件的存放,对大型数据库考虑用磁盘阵列柜存放优化数据库逻辑结构 优化表空间、临时表空间、回滚段 优化数据库对象 优化表结构、建立分区表,优化索引结构、更新统计信息 优化SQL语句查询运行慢的SQL语句,并给出优化建议 提供数据库优化方案

24、及实施方案、报告等4.3数据库备份以及恢复服务根据现场情况,制定合理的备份计划,定期备份各个数据库。具备条件的情况下,要定期对备 份集进行异机恢复,测试备份集是否可用。精选欢迎下载数据库发生重大故障时 (如磁盘阵列故障导致的数据库瘫痪) ,以最快的速度从备份系统中恢复 数据,并使系统能够在最短的时间内恢复正常运行。4.4数据库补丁分析与安装根据用户需要提供相关系统软件升级服务;当数据库ORACLE、MYSQL、SQLSERVER软件 有最新更新升级时,维保方须及时通知广西质量技术监督局,并根据广西质量技术监督局的要求和 安排到现场进行更新升级(每年一般不超过两次)。4.57*24 小时数据库救

25、援服务提供7疋4小时应急响应热线,由具有丰富工作经验的资深OCP认证工程师 在用户的Oracle产品出现重大故障时提供现场紧急救援服务。重大故障包括:精选欢迎下载OS故障,导致Oracle不能正常启动或运行硬件故障(包括CPU、硬盘等),导致数据库崩溃人为故障,包括维护人员不小心删除数据库文件,或人为将Table中的数据删除等等导致数据库不能正常运行的情况,如控制文件遭破坏,Redo Log文件遭破坏,数据文件遭破坏等等其他故障,包括影响数据库正常运行的各类紧急故障5技术支持以及服务体系5.1 故障处理要求25分钟内故障处理电话响应服务,故障服务的现场响应时间小于1小时,即1小时内有能够处理故

26、障的技术人员到达现场,并立即投入对故障的处理,并能够在2个小时内恢复故障系统的正常运行。如果用户的问题不能通过电话解决,客户服务部会立刻派经验丰富的工程师到现场为用户解决 问题,客户服务人员对解决的过程进行记录,并向用户提供解决问题的报告包括问题原因、解决 方法、解决问题的方式和进程,以及建议用户对系统进行正常使用的指导和培训问题解决后需要 用户进行确认。诚信、专业阳卜亍厂査持精选欢迎下载5.2重大活动现场护航敏感时期、重大节假日、领导巡查,维护技术原因提前入场做详细巡检,并于活动时间段内入 驻客户驻地,提供5*8小时的现场保障服务。在国家节假日期间前一个星期,提供节日值班表,包含:当日负责人

27、姓名及联系电话、反应时 间、到现场时间、处理好时间等内容。以发电子邮件方式告知客户负责人。5.3维护作业计划为保障数据库系统的长效运行。我们制定日、周、月的检查内容,通过自动、远程、现场相结 合的方式,形成日常作业计划,对数据库运行情况检查,及早发现问题和处理问题。如:每日的数 据库表自动分析、每周的远程备份情况检查、每月的现场设备检查等。5.4信息安全保障系统的安全性是业务正常运行的保障,其重要性不言而喻。我公司会根据标准的安全规范和成 功经验,为用户的系统进行安全性检查,包括文件权限的设置、用户访问的限制、增补软件的更新 等技术方面,同时对系统安全策略进行评估,将发现的问题隐患及改进建议以报告的形式提交给用 户。通过系统安全性检查,可以提高系统的安全级别,防止系统遭到恶性攻击口。5.5第三方协助服务协助用户或第三方完成对系统设备、软件的维护、升级、扩容等技术支持工作,确保客户生产 系统的安全平稳运行。5.6服务质量分析提供每月1次对oracle、sqlserver、mysql全面巡检服务,对维保范围系统进行细致全面地监 视、检查、隐患排除等。并按照用户要求提供特殊时段保障要求的巡检。精选欢迎下载每月提交月度服务报告、 包括并不限于服务天数、 次数、 电话接通延迟时间、 报修故障及原因、 恢复措施报告等定量数据;根据用户需要召开服务质量分析例会,对该

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论