基础软件平台维保服务招标项目-技术部分_第1页
基础软件平台维保服务招标项目-技术部分_第2页
基础软件平台维保服务招标项目-技术部分_第3页
基础软件平台维保服务招标项目-技术部分_第4页
基础软件平台维保服务招标项目-技术部分_第5页
已阅读5页,还剩171页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自动化测试环境管理图版本管理:代码与配置保持与生产同步,模拟最真实使用的环境,确保测试有效性;规范版本部署流程,确保部署版本正确,保障版本测试质量,提高系统稳定性;测试环境问题协调及其跟踪(包括中间件、数据库);数据管理:跟踪数据更新过程,确定测试数据与代码版本相匹配,从而保障测试真实性;数据访问权限管理及审计策略,保障测试数据不被意外删改,保障版本测试数据准确性;系统安全:账号安全,采用实名制账号,密码定期更新;避免非相关人员不规范操作损坏测试环境,影响测试工作进度;评审及协助环境变更相关工程实施方案和进度跟踪,保障测试环境的高可用性;资源管理:规范自动化测试工作流程,按照规范指标评审版本,保障版本自动化测试有序进行;避免资源浪费,规范使用流程,避免资源紧张情况发生;通过数据清理和回收机制,合理利用数据、硬件资源。开发自动化测试脚本根据用例设计开发自动化测试脚本,其中内容包括:对象录制、脚本编写、组件编写、根据测试需求组合测试套件、根据测试计划组合测试工程等。通过可视化拖拽方式快速生成脚本,平台统一生成可执行的自动化测试脚本,支持多维度校验方式,包括前台界面数据验证、后台数据库表验证等,同时支持某个脚本执行前的数据初始化,同时支持某个脚本运行完成后,对数据进行还原。调优自动化测试脚本根据案例变动或页面变动,对自动化测试脚本调优。调优内容包括:调优内容调优方法备注对象调优调整对象的属性、位置、类型等脚本调优调整脚本执行的等待、延时、处理先后顺序、执行效率等组件调优调整组件的执行参数套件调优调整用例组合工程调优调整套件的执行次序为了能在短时间内完成脚本调试工作,我方在开发阶段介入脚本调试,解决验证时间短、系统更新频繁导致无法完成脚本调试,详细可以按以下三方面实施:1、开发商阶段性完成某些功能,第三方启动开发环境调试脚本,提前进入脚本调试工作。2、定期在开发环境上运行自动化验证,提前预测脚本调试范围,并能及时调整自动化测试脚本。3、在客户验收环境定期运行自动化验证,增强脚本健壮性,提升通过率。执行自动化测试计划按业务需求、版本测试需要,执行相关的测试计划,并由平台监控执行情况,如图:升级时间紧张,官方规定是提前3日封包,实际上可能更新前半日至1日封包,业务复杂,主要功能案例较多,能否在规定时间内更新脚本,并执行完成,是客户面临的难点,我方在成熟的平台上配置足够多的执行终端,解决案例多和验收时间短问题,详细情看下图。通过上图,自动化测试平台将执行任务自动分配到执行终端中执行,通过大量的执行终端,平台根据任务的优先级将验证任务智能分派到空闲的执行终端中执行,平台实时监控执行终端的空闲状态,平台检测到有空闲的执行终端,平台将剩下待执行优先级高的任务优先分派到执行终端中执行,实现智能调度功能。同时为了快速完成验证大量用例,平台支持建立定时计划执行,通过制定晚上执行计划,利用晚上时间快速完成验证任务,同时可以配置重跑次数,将失败的用例重新组成执行任务,在执行终端重复执行,根据配置次数,平台每次将运行失败的案例自动组成新的执行任务,直到重跑次数跑完,或者执行用例全部都通过的时候,平台不再进行重跑。详细可以看下图:生成自动化测试报告当自动化测试脚本、套件或工程执行完成后,会自动统计用例执行情况,并可生成测试报告,如图:开发先进的自动化测试框架,使框架与脚本分离、脚本与数据分离,并通过可视化拖拽方式快速生成脚本,扩展性极高,最终达到降低开发成本、缩短执行时间,有效支撑敏捷开发,从而促进系统质量提升。分析测试报告,定位问题常用的缺陷分析定位方法:方法一:分解法【适用场景】:最终依赖与其他应用或则产品先的请求相应。【方法】:先排查发出的请求是否正确;在排查响应端的响应结果是否正确;最后分解,缩小排查范围,帮助开发有效定位BUG。方法二:排除法【适用场景】:没有任何的头绪,errormessage不能提供任何有用的信息,拿不到对应的代码【方法】:先排除掉自己想到的可能性,步步为营,层次分离,剩下不确认的,一般便是问题所在,即便是不能完全定位到问题,但是也可以有效的缩小需要进一步定位的范围。总结与改进总结与改进阶段包括以下工作内容:用例执行统计:在自动化报告发布之后,第三方测试组对自动化测试执行结果进行统计,统计指标包括所属系统、总用例数、执行用例数、通过用例数、不通过用例数、执行通过率、总通过率等。缺陷统计分析:自动化报告发布之后,第三方测试组对自动化测试过程中出现的严重缺陷和一般缺陷进行统计,统计内容包括所属系统、累计发现缺陷数、跟进后关闭缺陷数、各个缺陷分类下的缺陷数量等。发布自动化测试总结报告:对整个自动化测试过程的各个阶段进行总结,对测试过程遇到的问题提出相应的改进措施,将成功经验推广到其他地市。根据经验报告和新增或变更的功能更新系统测试用例库和核心功能用例库,持续维护用例库:对整个自动化测试进行总结,根据总结更新维护用例库。新炬自动化平台在某省自动化测试实施案例中国移动南方基地自动化测试项目,包括一期、二期项目,主要建设自动化测试平台,通过自动化测试手段,保障BOSS3.0版本核心业务的质量。通过具有自动化、模块化及集中化图形展现的新炬自动化测试平台,保障BOSS3.0版本114个核心业务的质量,实现416个自动化脚本,功能验证时间从13个小时缩短至2个小时,大幅提升功能测试质量和效率。以下是核心业务功能测试案例管理模块:以下是自动化测试脚本模块:以下是自动化测试脚本对应数据管理及数据初始化模块:以下是自动化测试平台计划制定及实时监控图形界面:以下是自动化测试平台报告图形化界面:

RUEI高级服务方式及内容为了更快速有效的构建业务系统性能管理能力,快速提升业务系统性能,将通过RUEI工具以实现系统各功能操作性能最大化为主要目标,建立用户体验指标体系、性能感知评估体系,提供可量化的性能评估数据及端到端的整体解决方案,为湖北电信其它业务系统提供性能指导依据,最终达到电信业务系统整体可持续优化的目的。为了从整体对业务系统性能情况有一个了解,并进行针对性的性能分析与优化,有效提升应用系统性能,构建长效的性能管理机制。本项目将通过构建应用性能管理平台,提供对业务支撑系统的运营分析能力,形成真正意义上的业务性能管理领域的网管系统。主要工作如下:基于RUEI构建性能管理平台,提供业务系统运营分析能力部署最终用户使用感知收集系统,收集各用户各页面操作的真实响应时间,从系统整体、用户、关键业务、地市、业务模块等不同维度对性能情况进行评估与分析。通过对性能数据的分析,并结合应用系统实际情况,从效率、效益和整体满意度和服务质量预期进行对比分析,综合评估应用系统性能情况。通过对数据的运营与分析,构建业务系统性能评估体系,用于指导系统性能优化及建设工作。发掘性能问题,进行端到端优化提升通过性能管理平台的主动分析与监测,分析各业务功能模块的性能情况,进行端到端的分析及优化。从应用-中间件-数据库-主机-网络多个层面进行分析与优化,并制定优化实施方案进行优化实施,有效提升应用系统性能。构建性能问题分析标准,对于个案问题及整体问题进行有效区分,提升性能问题分析能力及解决效率。建立性能管理指标体系,进行主动监控及处理通过对湖北电信业务系统实际情况的分析,并结合业界对应系统业务功能响应标准,建立湖北电信业务系统性能管理指标体系。指标体系包括管理、系统、用户行为、用户体验等多个维度,用户评估应用系统整体性能情况。并根据指标的变化情况,评估新建应用及新上线应用的应用质量,用于从前期推动应用质量的提升。另外通过对指标变化的实时监控,对系统整体性能情况及关键业务功能进行实时监控,对指标下降进行及时有效的处理,实现对于性能问题的提前处理。进行多维度业务运营分析,优化系统建设通过应用性能管理平台,对用户行业、业务功能响应情况、业务访问量、地市访问量、用户退出行为等多维度、多角度的分析,可以充分了解用户使用真实体验,了解用户使用习惯,了解系统瓶颈,用于指导并优化系统建设。如大部份用户仍使用IE6老版流览器,对于新应用开发必须满足对IE6版本流览器的最佳兼容性及性能要求。制定开发性能规范,提升优化前移能力通过对于性能问题的综合分析,总结性能问题经验,从应用开发、部署、应用系统使用终端、环境、网络等多方面建立规范,有效提升应用性能开发质量及优化前移能力。RUEI安装与配置在不改变现有CRM应用系统配置现状前提情况下,利用OracleREUI系统,通过采取旁路侦听机制对系统真实用户体验进行全方位监测:RUEI软件特点全方位监测企业级的性能旁路侦听(TAP)/端口拷贝(SPAN)实时性强,100%精确的方法旁路侦听做到了特有的五不不干扰生产不影响性能不使用探针(adapters)或插件不修改应用(与开发框架、数据库、中间件和底层平台无关)不需人工介入通过“区域分析”、“响应时间分析”、“业务维度”、“流程维度”4个维度了解用户体验,谁什么时间什么地点做了什么操作,如何操作的。然后对问题的性能、区域、业务逻辑、访问路径进行分析,找出问题原因。资源需求资源描述备注服务器物理机器最小资源要求CPU:4*6(4个cpu,每个cpu4核)内存:32G磁盘空间:500G操作系统redhatlinux5.564bitRUEIORALCERUEI,用于真实用户体验洞察分析数据库ORALCE,用于存储交换机旁路数据ORACLE.064位服务端、.0(client)64位网络交换机需提供两个接口位置及配置交换机镜像端口地市标准终端,为了更好的了解地市业务系统使用情况,排除因网络、终端等影响,建议每个地市提供一台标准终端,用于地市业务验证及地市网络信息收集。地市标准终端非必要配置。资源描述备注地市标准终端物理机器最小资源要求CPU:2*2(2个cpu,每个cpu2核)内存:4G磁盘空间:300G操作系统Windowxp业务系统调研分析系统调研:系统调研是实施性能优化的先决条件,主要包括主机、中间件、数据库、网络拓扑、程序部署结构等。通过系统调研规划端到端性能分析工具(APM)部署结构。业务调研:根据2/8定律,80%的性能问题是由20%的应用导致的,而20%应用属于核心业务。业务调研主要目的是一方面了解哪一些是用户访问量较大、用户关注度较高、影响日常办公效率的核心业务;另外一方面是通过业务调研为建立业务优化模型提供数据支撑。用户调研:用户体验是评价一套系统好坏的重要指标,对地市用户所使用系统核心业务功能进行调研,加强与用户互动沟通,全面了解用户真实感受情况,以便于后续优化工作开展,提升优化工作价值。通过行业特定领域里广泛认同的最佳实践,制定一系列用户体验有关的KPI维度,主要包括效率、效益和整体满意度和服务质量预期的对比,来评估web系统性能。用户体验监控提供web系统的综合满意度快照,帮助实时了解系统服务所处的用户满意度水平。通过用户调研及用户体验监控基准数据,建立与用户达成共识的KPI,超过警戒值及时通知维护人员,优化团队主动优化用户所关心业务性能,加速用户满意度改良。RUEI用户体验监测配置基础配置地市信息配置在RUEI当中配置地市名称与客户端IP对应列表,对监测到用户请求数据实现“用户名-客户端-地市”的对应关系。关键业务配置根据前面“业务调研”中所调研出的关键业务,在用户体验监测系统上配置关健业务与业务请求URL对应关系,方便监测到交换机旁路数据直接转换成对应业务名称。地市标准终端配置在地市标准终端上安装与配置如下软件:安装软件备注HttpWatch页面分析工具

,获取所处地市页面元素加载性能情况网络监测脚本用于实时了解地市网络情况数据分析配置地市运营编号配置监测项1总体访问量PV及上周同比(过去24小时)2地市访问量PV及上周同比(过去24小时)3关健业务访问量PV及上周同比(过去24小时)4系统整体响应时间及上周同比(过去24小时)5各地市页加载时间及上周同比(过去24小时)6关健业务响应时间及上周同比(过去24小时)7页面报错误比例(过去24小时)8各地流量比例(过去24小时)精准用户体验编号配置监测项1用户差页比例(过去24小时)2用户响应时间(过去24小时)3用户访问活跃度(过去24小时)4用户访问错误率(过去24小时)5用户体验端到端时间(过去24小时)6用户访问页面对象大小(过去24小时)系统监控编号配置监测项1性能杀手(过去24小时)2端到端性能监测(过去24小时)3大对象监测(过去24小时)4失败页访问量监测(过去24小时)5关键业务访问失败监测(过去24小时)访问量通过访问量反映系统整体使用情况,对用户使用时间及不同地市访问情况进行分析,预防因为系统性能或网络性能下降引发的访问量下降,当访问量有明显下降就需进行核查原因。响应时间通过响应时间反映系统整体性能情况,对用户使用性能及各地市性能情况进行分析,预防因为系统性能或网络性能下降引发的响应时间增长,当响应时间增长有明显增长就需进行核查原因。满意度通过满意度反映系统整体性能情况,对用户使用性能及各地市性能情况进行分析,预防因为系统性能或网络性能下降引发的满意度下降,当满意度有明显下降趋势就需进行核查原因。错误比率通过错误比率反映系统整体性能情况,对用户使用性能及各地市性能情况进行分析,预防因为系统性能或网络性能下降引发的错误比率增长,当满意度有明显上升趋势就需进行核查原因。每页端到端时间通过每页端到端时间反映系统整体性能情况,对用户使用性能及各地市性能情况进行分析,预防因为系统性能或网络性能下降引发的每页端到端时间增长,当每页端到端时间有明显上升趋势就需进行核查原因。性能杀手监测针对服务器耗时比长的URL请求进行监测,同时性能杀手也反应了系统哪上些URL对应的业务比较频繁,方便全面了解业务运行状况,对耗时比长的URL请求,需重点关注。业务性能KPI监测配置服务器性能:服务器性能面板主要是监测服务器各个指标项的性能情况。编号配置监测项1Web站点错误页访问量2吞吐量3并行会话4服务器负载5服务器错误页访问量6每页的服务器时间网络性能:网络性能面板主要是监测网络各个指标项的性能情况。编号配置监测项1吞吐量2所有流量3每次点击的大小4每页的网络时间5网络错误页访问量页性能:页性能面板主要是监测页各个指标项的性能情况,页是性能监测中最基本的元素。编号配置监测项1正常页访问量2客户端中止页访问量3服器错误页访问量4每分钟页访问量5每页的大小6每页的服务器时间7每页的端到端时间8每页的网络时间9页加载时间构建业务性能指标体系业务性能指标体系是衡量用户体验好坏的标准,通过构建指标体系,全面了解应用系统性能,并作为优化及提升效果的标杆。那么如何构建指标体系,主要是采取如下措施:通过行业特定领域里广泛认同的最佳实践,制定一系列用户体验有关的KPI维度,主要包括效率、效益和整体满意度和服务质量预期的对比,来评估业务系统性能。通过业务性能指标的变化,衡量新上线应用质量。通过用户体验监测系统提供web系统的综合满意度快照,帮助实时了解系统服务所处的用户满意度水平。通过用户调研建立与用户达成共识的KPI,超过警戒值及时通知维护人员主动优化业务性能,不断加速用户满意度改良。系统监测维度应用性能杀手排名最慢的页面排名系统资源开销排名实时系统性能分析应用大对象监控应用、中间件、数据库、网络性能监测管理维度实时系统整体满意度实时系统整体出错率用户访问区域分布发生错误的页面错误分类及比例客户满意度实时趋势分析用户行为分析用户感知维度业务响应时间接口处理时间业务稳定性业务可操作性全方位的监控体系RUEI自动化监控告警通过服务器性能、网络性能、页性能、关健业务性能、关健模块性能五个维度时实了解系统运行状况,系统每隔1分钟自动刷新性能数据,并通过预设的阀值对超过阀值范围性能数据进行告警提示。定时人工扫描关键性监控指标分时段扫描RUEI关键性监控指标数据,及时发现异常数据,实时监控系统的运行状态。RUEI服务器性能监控部署监控脚本可以实现自动监控、短信告警,实施采集并记录系统运行数据,包括:操作系统cpu使用率、内存使用率、磁盘空间使用率,RUEI进程的运行情况,RUEI数据库的运行情况。异常情况处理当人工扫描及RUEI配置发出业务告警数据时,及时对性能数据进行分析,如的确存在性能问题,采集端到端优化工作;如是监测到业务大面积异常则及时通知应用系统厂家,检查系统是否已处于故障中,需急时对系统进行修复处理。RUEI数据深度分析性能问题收集用户上报为了更好地提升用户系统操作体验感知,同时规范性能问题的收集和上报,避免含糊不清的性能问题描述(例如不好用、感觉慢),通过前期的优化和调研,我们也发现地市访问资源应用也存在一定自身的瓶颈,例如终端IE版本过低、采用无线接入访问等,这些在一定程度上影响性能问题的重现和分析。因此,我们建议性能问题上报前,按如下流程进行初步的自查:排查排查终端自身的问题排查排查网络问题排查应用系统问题排查应用系统问题上报性能优化团队上报性能优化团队首先进行初步的自查(主机、网络等),自查后确认仍为系统性能问题,再上报数据(问题描述、网络数据、录屏数据等)给地市接口人,地市接口人统一受理审核后发到省公司优化接口人,优化接口人会分析重现问题,并将优化的进展和结果及时反馈。主动监控通过主动监控方式获取系统的性能数据,如结合RUIE工具实时对系统进行监测,对监测的业务性能数据进行采集,发现系统潜在性能问题的业务。性能杀手系统业务80%核心业务是用户最常操作的业务,同时也是服务器上运行总耗时最长的业务,需对监测到性能耗时比较长且运行次数较多的URL请求进行分析优化,可将每隔一两个月作为时间段,找出性能杀手中所占服务时间比重大的前10个作为分析的重点。TOP响应时间定期对监测到的用户/地市/页面平均响应时间较长的数据进行分析优化,找出地市最耗时对应的URL请求。TOP差页差页访问量多少,直接影响到系统整体满意度好与坏,目前定义差页标准是响应时间在8秒以上表示是差页,所以需定期对监测到的用户/地市/页面响应为差页数据进行分析优化,找出地市访问业务差页最多访问对应的URL请求。TOP错页错页访问主要是访问页面出错、页面没有响应、服务器错误等现象影响了用户体验,需定期对监测到的用户/地市/页面访问到错页数据进行分析优化,将错页排出掉,提升系统整体满意度,定期找出地市访问业务错页最多访问对应的URL请求,在前期业务调研当中找出对应的业务名称。地市差异分析编号分析内容1地市访问系统整体业务响应时间差异分析2地市访问系统关健业务响应时间差异分析3地市访问系统整体业务访问量及正常页比例差异分析4地市访问系统关健业务访问量及正常页比例差异分析5地市关键业务活跃度分析6地市网络差异分析性能分析报告日报:分析系统月底月初的用户体验情况当日系统整体性能(总访问量、差页率、失败率)TOP5差页运行性能(差页率、失败率)关键页运行性能(差页率、失败率)失败页分析(失败原因)前日对比分析(总访问量、差页率、失败率)异常数据分析周报:分析系统业务高峰期运行一周的整体用户体验情况本周系统整体性能(总访问量、差页率、失败率)TOP5差页运行性能(差页率、失败率)关键页运行性能(差页率、失败率)失败页分析(失败原因)前周对比分析(总访问量、差页率、失败率)异常数据分析月报:分析系统运行一个月的整体用户体验情况,对比分析整改效果本月系统整体性能(总访问量、差页率、失败率)TOP5差页运行性能(差页率、失败率)TOP5对象页面(对象大小超过10kb以上)TOP5网络页面(网络传输时间超过2秒以上)TOP5服务器页面(最耗系统资源的页面)关键页运行性能(差页率、失败率)失败页分析(失败原因)关键页地市维度分析关键页终端维度分析前月对比分析(总访问量、差页率、失败率)整改效果对比分析异常数据分析总结性报告:定期(季度|年度)分析历史数据,度量系统健康度(所有系统)系统的历史性能数据是衡量系统健康程度的重要依据,分析各项性能指标各时间段的数值,并予以对比,以便有效分析服务器性能趋势,根据分析对比结果,制定优化、扩容方案等增强系统性能的措施。根据分析结果,有针对性地调优,保障系统长期高性能运行现有系统增长趋势评估分析性能问题整改落实根据RUEI的深度数据分析结果,通报系统整体、用户、关键业务、地市、业务模块等不同维度性能情况。负责向各部门对RUEI的深度数据分析结果进行解释。落实性能问题整改(会议确认整改责任方,问题核实,整改计划),将发现的性能问题根据不同分类派发到对应业务部门。各业务部门给出整改步骤措施及完成时限并指定专人跟进。各部门整改事项落实之后基础部在内部流程工单系统中根据会议内容生成派发任务单。整改实施跟进电话加邮件及当面沟通的方式跟进整改方案、整改措施、整改时间是否落实到位。分周、月通报整改进度。将前期责任到人的待整改事项每周根据责任人进度反馈以邮件形式通报整改进度状况。 每月将发现的所有问题全量通报,包括是否完成,如未完成则说明目前进度,给出后续工作计划。优化效果评估用户满意度调查验证对经过优化实施的功能通过标准终端及用户进行验证,记录优化前后效果对比情况,量化优化效果。RUEI监测对比分析验证结合RUEI工具将性能问题所采取的优化措施及监测到的优化前后性能对比情况,记录优化前后效果对比情况,量化优化提升比。经验推广对经过验证的优化实施经验形成规范及建议,用于指导后续开发,并作为后续版本验收标准,及时更新《优化效果对比分析》、《优化经验总结》、《应用优化案例分析文档》等优化工作文档对经验进行总结提炼。端到端性能数据优化分析场景回放通过对用户操作回放分析,可以追踪用户操作轨迹,回放出错页面,获取用户真实体验情况。当用户反馈访问系统某个业务比较慢的情况,可以通过此功能,回放用户操作轨迹,找出响应慢的URL请求,逐层对URL网络层、业务逻辑层、数据库层耗时情况进行分析。端到端分析问题总体思路分析问题,主要是基于端到端分析方式,从业务逻辑到平台层,从用户请求的上至下,分析每一层性能情况。客户端分析针对使用浏览器访问系统,可借助常用网页分析工具httpwatch、firebug等,分析用户从客户端请求,到服务器响应返回结果,发现每一个请求的耗时情况。业务逻辑分析一般常用的应用逻辑,都是采用串行方式运行,执行过程中的每一个代码段都有可能成为影响业务性能的元凶。对于复杂的应用,梳理它的执行过程显得尤为重要,需对业务逻辑每一个执行步骤性能分析。中间件分析监控中间件运行状况,从系统运行线程、jvmgc情况、连接池使用情况,从中间件层面发现是否有性能瓶颈。SQL效率分析对于注重响应时间的应用系统,Sql执行性能往往是制约应用性能很重要的一个部分。一个sql的执行效率直接影响到用户的体验效果。数据库分析从数据库层面,分析cpu、内存、io、连接数,高耗SQL语句是否存在性能瓶颈。主机存储分析利用主机资源性能监测工具如OSWATCH、NMON等工具,对CPU、I/O、内存资源进行监测,分析各项资源使用情况,CPU资源消耗是否过高、I/O有无热点、内存有没有出现换页情况,这些资源性能好坏,直接影响到业务整体性能。地市网络性能分析在性能分析过程中,用户终端所处的网络环境,也会影响到用户操作业务性能,需在用户终端部署网络性能跟踪脚本,实时了解地市网络运行状况,并进行各地市网络情况差异性对比。共性/个别问题分析共性问题系统上线之前,业务逻辑实现通常在同一个架构下,由不同技术实力开发人员实现,业务性能也参差不齐,如同类型查询功能普遍较慢的问题。这些共性问题可能存在于多个方面,需采用分层分域的优化手段及闭环优化流程,提高优化效果与优化效率,纵向分层包括硬件层、平台层与应用层,所述横向分域包括查询域、接口域、流程域、展现域、架构域和需求域。分层:即纵向对应用系统的组成部分分层,通常我们将其分为硬件层、平台层与应用层,首先判断问题发生在那里层面,再由不同专业的工程师进行分析处理,该做法可充分利用工程师的专业能力,提高优化质量。分域:即横向对用户提出的问题按优化级别进行分类,哪一些是重点问题域、重要场景域、共性问题域,对一些相同类型的问题分析处理方法大同小异,利用已有的优化经验可加快问题处理效率。个别问题针对个别用户访问系统较慢的情况下,通常会采取如措施:用户终端检查首先检查用户终端(主机、网络等)是否存在问题,主机(主机资源配置差,打开太多的应用软件,系统负载较高)及网络性能直接影响到用户体验较果,有必要规范性能问题的收集和上报,避免含糊不清的性能问题描述(例如不好用、感觉慢)。用户操作过程需进行录屏方式处理,以便于优化人员用户操作过程进行分析服务端分析从用户操作过程录屏文件中,得出用户操作方式,并结合性能管理分析平台,对用户操作进行回放分析,可以追踪用户操作轨迹,回放出错页面,获取用户真实体验情况。找出响应慢的URL请求,逐层对URL网络层(RUEI)、业务逻辑层、数据库层耗时情况进行分析。

专项优化服务项目随着应用系统投入使用时间的逐步增加,将会由于数据量的增加、用户数量的增加、应用的修改等各种原因导致的系统的整体或关键功能性能下降。系统性能下降后将会出现应用响应缓慢、统计或报表计算时间加长和难于维护等不良影响,严重生产效率。对于重要系统,应用性能是否高效非常重要,当系统出现性能问题时,问题涉及层面可能是应用、网络、中间件、数据库、集群软件、操作系统、主机存储,很多时候,单纯优化某一环节根本解决不了问题,很多时候需要找出性能问题的根源,或者进行系统的整体优化,才能取得显著的效果。上海新炬会积极跟踪客户系统现状,定期成立专项优化专题,分析性能下降的业务系统的应用类型和用户行为、评价客户数据库的参数设置、数据分布、硬件和系统资源的使用情况等,并提出相关调整建议,必要时可以随时在规定的时间内派优化技术专家到达客户现场,推进系统的专项优化工作,处理客户系统性能问题,确保客户系统的高效运转。具体内容和步骤包括:上海新炬具有丰富的基于Oracle软件产品的性能优化经验,根据系统运行状况以及应用系统的特点,与客户一同制定性能调整所涉及的范围以及具体操作方法、流程和性能调优预期等,主要包括:与客户沟通,确认问题分析数据库及中间件运行情况分析当前数据库运行瓶颈或故障数据库及中间件参数配置分析操作系统、主机、网络配置分析诊断并定位性能瓶颈提供用户完整的性能诊断报告和优化方法在必要的时候实施数据库及中间件的调整性能基线检查。根据已经制定好的性能检查规范与检查方法,针对调整范围内的Oracle数据库系统进行有计划的性能检查。结合上海新炬的“基于基线”运维管理方法论,对各个性能调整对象的关键指标进行持续的监控与检查。上海新炬针对每个性能优化案例或项目提供性能调整报告,包括相关发现及对结果的分析等内容。对于系统优化中发现的问题将持续跟踪并最终解决。从用户感知出发,制定优化目标和优化方向随着业务系统的性能问题覆盖面越来越广,系统架构、业务流程越来复杂,因此对于系统的优化必须从整个系统应用层面进行考虑,纵向从WEB页面到中间件到数据库到主机到存储(还有网络等)的端到端优化;横向各系统间数据交互、接口、流程的优化,从用户感知出发,提升用户使用体验。从提升用户体验出发,主要的优化目标为:通过对现在已有功能模块、系统环境的分析优化,消除已有功能的性能瓶颈,提升用户体验;通过制定核心功能模块的性能指标,进行核心流程性能监测与主动优化,保证用户良好体验;通过制定及落地性能规范,确保后续功能模块的高效性,保证用户持续的良好体验。以优化目标为导向,主要的优化方向包括:功能模块端到端性能优化目前系统已上线推广了许多功能,这些功能中有部份存在较大的性能问题,已影响到用户的正常使用及相关功能业务的推广。因此需要对这部份已知性能问题进行重点分析与优化,对客户提出各种性能问题进行分析、跟踪、优化及反馈,做到快速定位、快速解决。同时通过收集客户对应用需求的反馈,形成问题和需求的发现、分析、改进、验证的螺旋式提升的机制,持续优化现有流程和应用,提升系统对日常维护工作的支撑效能。主要包括如下内容:对已上线各功能进行端到端性能优化分析对各业务场景业务逻辑进行优化分析对中间件整体配置进行优化分析对数据库整体配置进行优化分析对应用涉及系统环境进行优化分析(主机、存储、网络等等)对涉及各数据模型进行优化分析经验总结及开发规范制定高并发大数据量性能优化目前系统的许多功能模块或流程还处于试用阶段,用户量、数据量并不太大,因此许多性能问题并不太明显。针对全省应用及推广出现用户量、数据量增长带来的性能问题进行分析,对于由此带来的风险,从应用框架、数据存储、资源管控、降低消耗等多个方面进行优化提升。主要内容如下:针对后续出现用户量、数据量增长带来的性能问题进行分析应用框架高并发、大数据量适用性分析及优化重点业务场景技术实现方式可靠性,容错性分析及优化系统环境高压力,抗冲击分析及优化业务系统业务增长及资源消耗趋势预警及分析高并发大压力下的性能验证与瓶颈分析经验总结及开发规范制定应用接口与框架性能优化业务系统架构复杂,同时各系统间存在许多数据接口、WEB接口等,这些接口的使用频繁,接口的稳定性与性能直接影响到系统整体的稳定与性能。需要对业务涉及各其他系统间数据访问接口、页面框架、WEB接口、单点登录等进行梳理、分析、与优化。制定更合适更有可扩展性的接口方案,确保接口的有序、高效与稳定。应用框架分析优化页面、数据交互、人机交互、流程引擎等分析优化具体业务场景技术实现手段评估与优化系统间数据交互与接口性能优化页面加载方式与数据流控制分析优化数据发送、接收与处理方式分析优化经验总结及开发规范制定数据库性能优化报告(模板示例):目录1. 概述及总结 52. 系统描述 63. 系统整体压力分析 73.1 从业务角度了解系统压力 73.2 从数据库角度了解系统压力 73.2.1 数据库资源使用率均值分析 73.2.2 数据库资源使用率峰值分析 84. 主机系统性能分析 114.1 系统参数及配置 114.2 主机CPU负载分析 124.3 主机IO负载分析 124.4 主机内存及SWAP使用分析 134.5 优化建议 135. 数据库配置性能分析 145.1 数据库参数及配置 145.2 数据库版本及补丁分析 155.3 统计信息收集策略分析 155.4 大表使用分析 165.5 索引层数分析 175.6 并行使用分析 175.7 表碎片分析 185.8 重做日志切换频率分析 185.9 优化建议 196. 数据库高峰时段运行性能分析 206.1 TOP等待事件分析 206.2 GlobalCache性能分析 216.3 软解析比分析 216.4 TOPSQLorderedbyElapsedTime 216.5 TOPSQLorderedbyCPUTime 226.6 TOPSQLorderedbyGets 226.7 TOPSQLorderedbyReads 236.8 表空间IO性能分析 236.9 数据文件IO性能分析 246.10 数据缓存区使用分析 246.11 PGA内存区使用分析 246.12 共享池使用分析 256.13 TOP逻辑读对像分析 266.14 TOP物理读对像分析 266.15 优化建议 267. 关键SQL优化分析 287.1 68wjcguv4fswx 287.2 6axzqm90ubhax 287.3 6axzqm90ubhax 287.4 6axzqm90ubhax 287.5 优化建议 288. 系统业务功能性能分析 29上海新炬在系统性能优化方面拥有十分丰富的实践经验和项目案例,我们可以向客户承诺优化效果,保证达到预期的优化目标。如下是我们从多个优化维度的进行简要阐述和案例分享:操作系统、存储子系统、网络子系统调优建议上海新炬是一个具备综合服务能力的公司,除了数据库之外,包括操作系统、存储、网络、中间件等均拥有经验丰富的专业人才,在我们为湖北电信提供专项优化过程中,可随时协调这些专家一起对业务系统进行全方位的整体分析,结合业务现状对现有配置及规划提出恰当的建议,并对不断变化的业务系统进行跟踪,配合其他厂商最大化的提高存储、网络子系统等的可用性和性能。操作系统优化操作系统参数的合理配置,对主机的性能发挥、系统的稳定运行起着重要的作用。操作系统参数的合理调整,也是我们专项优化工作的不可忽视的一部分。案例:国家电网直属单位财务管控系统数据库自动重启问题问题描述多家直属单位财务管控系统数据库部署在相同的物理环境,而系统资源有限,资源使用极其紧张,在月初高峰期时常出现部分直属单位数据库自动重启的问题。物理内存仅64GB,主机内存使用率达到99%以上,并且pagein/pageout明显,经常出现使用交换空间的现象。原因说明多家直属单位数据库使用相同主机,资源争用严重vm.nr_hugepages设置过大,引起物理内存浪费4GB优化方法根据SGA分配,计算vm.nr_hugepages合理设置为25686优化效果数据库运行长期稳定,未再出现因内存不足引起故障网络优化网络作为业务系统重要的物理组成部分,在系统的性能发挥中同样起着不可或缺的作用。如public网络配置不合理,直接影响客户端与数据库之间的数据交互,最终影响用户使用感知;RAC环境私有网络配置不合理,可能出现大量的gc等待事件进而影响整个业务系统的性能,甚至会出现其中一个节点自动重启的严重故障。案例:某电网公司物资管理系统向集团总公司同步数据缓慢问题描述某电网公司物资管理系统通过dblink每天定时向集团总公司同步物资变更数据,每次同步的数据量仅只有1MB到2MB,而数据同步时间却达到20秒原因说明省公司与集团总公司数据库主机之间网络带宽较小(百兆),并与其它系统共享带宽优化方法使用另一组专用网络进行数据同步优化效果数据同步时间降低至2秒左右,效率提升10倍!中间件优化对于B/S架构的业务系统,一般都使用到中间件,中间件上的应用需要从数据库读取数据来完成用户的访问交互。所以,中间件的配置合理性同样会影响系统的整体运行效率。在中间件配置方面,尤其需要关注连接池配置、JVM、线程等的配置。案例:某省移动CRM接口域WEBLOGIC经常发生OOM,影响业务交互访问问题描述某省移动CRM接口域WEBLOGIC经常发生OOM,导致核心业务调用接口失败,引来用户投诉原因说明当大量并发调用该接口应用时,其中一个JAVA类需要占用较多的内存,而当前配置的最大内存只有2GB,不足以分配,所以大并发调用时会出现OOM。优化方法将对应WeblogicServer的最大内存由2GB调整到4GB优化效果未再出现OOM的故障,接口应用长期稳定运行重要业务逻辑与数据库交互方式调优建议所有的业务功能实现,都离不开业务逻辑,也都离不开与数据库的交互行为。我们在维护的过程中,会主动的去学习和梳理关键业务流程的逻辑实现,并根据这些业务的特点审视现有数据库交互方式是否合理得当,是否有改进优化的余地,再与相关的开发商进行讨论优化方案,通过优化核心业务流程达到优化整个业务系统的目的。案例:某省移动CRM系统数据库主机CPU使用率高问题描述某省移动CRM系统的数据库CPU使用率高,通过vmstat监控发现,CPU队列经常达到80以上。容易引起核心业务的堵塞,引来大量用户投诉。原因说明1、有3条SQL语句的执行频率达到1万次/秒以上,频率很高。2、这3条SQL语句查询的都是小表(小于1MB),且属于静态数据,如地域关系表、公共参数表、渠道资源表等。优化方法开发商优化应用程序,修改应用逻辑,将这些小表缓存到应用端,由原来的高频率查询数据库改为直接读取应用缓存,大幅度减少应用与数据库的交互次数。优化效果vmstat中CPU队列消失,CPU使用率平均下降30%,业务堵塞现象消失。数据库物理、逻辑结构调优数据库的物理和逻辑结构设计,是影响数据库性能十分关键的一环。数据库物理设计包括了表和索引的设计,表的设计影响着数据如何存储,而索引的设计直接影响着数据的访问效率。如分区表设计、分区索引设计、组合索引设计等。表、索引设计是否合理,对SQL语句的执行效率起着十分关键的作用。上海新炬不仅参与新上业务流程物理、逻辑结构审查,还对以往的数据库逻辑结构进行回顾,检查数据库物理、逻辑结构是否存在潜在的风险和隐患,并提出优化调整建议和跟踪实施解决。案例:某核心平台某大数据量查询模块查询缓慢原因说明由于查询涉及到的三个表,均比较大(30GB以上,过亿条记录),在对地市的数据进行汇总时,物理读非常高,而存储的IO性能无法在较短时间内满足如此大量的物理IO请求,导致该SQL语句执行超过1小时甚至卡死。SQL语句SELECTzsjg_dm ,bbb.zsjg_dmASzsjg ,zsxm_dm ,bbb.zsxm_dmASzsxm ,bbb.zspm_dmASzspm ,(…… )gltk LEFTJOIN( SELECTsq.jk_xh ,sq.jklsmxh_xh ,tsmx.st_je FROMt_qs_tssq_sqmxsq ,t_qs_tspzmxtsmx ,t_qs_tspzpz WHEREsq.wsh=tsmx.wsh …… ANDpz.cz_bj='0' )tkONgltk.jk_xh=tk.jk_xh ANDgltk.jklsmxh_xh=tk.jklsmxh_xh )bbbGROUPBYzsjg_dm ,zsxm_dm ,zspm_dm优化方法将三张大表均按地市字段进行分区改造优化效果1、每次执行在10分钟内,执行效率提升了10倍。2、三张大表的历史数据清理可在线的进行了。索引专项调优与重组索引是性能的一把双刃剑。合理的索引会使得查询十分高效,但维护索引是需要成本的,过多的索引又会给增、删、改操作带来性能上的影响,合理的索引设计十分关键。在对索引优化的工作中,我们可以从选择度(空值、唯一性)、前导列(重复性)等技术角度,对索引的合理性进行评估,梳理出不合理的索引,进行索引调优或重组。典型问题1:在大量空值的列上创建索引(没意义)典型问题2:在大量重复值的列上创建索引(没意义)典型问题3:在同样的前导列上创建子集索引(多余)由于开发厂商更关注业务功能的实现,应用上线时容易片面的为某些功能的效率考虑而创建一些从整体来看反而不合理的索引,缺乏整体的全局观和数据库专业的角度考量,从而可能导致因为索引而带来的性能下降。从上面的测试案例可以看到,定期的对索引进行优化或重组是十分有意义的。除了从唯一性、空值、前导列重复等角度关注索引的合理性外,还有复合索引的字段个数、单表索引个数都是值得关注和分析优化的。性能不良SQL调优上海新炬通过自身的运维管理平台AMP或编写脚本,每天定时采集数据库的TOPSQL,并定期进行分析,向开发商提出专业的优化建议,并跟踪后续的实施直至解决。SQL语句执行效率的好坏直接影响着系统的性能,对于高消耗SQL进行优化,将可带来很明显的效率提升。案例:某核心平台计划进度统计模块查询缓慢原因说明每个指标均对t_zjb_yjs_ssjhjdqk_zclx进行一次查询,然后使用大量unionall整合数据,对t_zjb_yjs_ssjhjdqk_zclx的扫描次数达到10余次,需要消耗大量的物理读和逻辑读。修改前SQL语句selectaa.zclx_dm,sum(aa.srhj_bqsr)srhj_bqsr,sum(aa.srhj_bnlj)srhj_bnlj,sum(aa.zyj_bqsr)zyj_bqsr,sum(aa.zyj_bnlj)……(select'11'aszclx_dm,t.gljg_dm,……fromt_zjb_yjs_ssjhjdqk_zclx……unionall……unionall……unionall)aagroupbyaa.zclx_dmorderbyaa.zclx_dm;优化方法调整SQL代码,使用casewhen取各指标的数值,从而可减少对t_zjb_yjs_ssjhjdqk_zclx的访问次数至1次!修改后的SQL:selectv.zclx_dm,sum(v.srhj_bqsr)srhj_bqsr,sum(v.srhj_bnlj)srhj_bnlj,sum(v.zyj_bqsr)zyj_bqsr,sum(v.zyj_bnlj)zyj_bnlj,sum(v.sj_bqsr)sj_bqsr,sum(v.sj_bnlj)sj_bnlj,sum(v.sjgd_bqsr)sjgd_bqsr,sum(v.sjgd_bnlj)sjgd_bnlj,sum(v.sjgx_bqsr)sjgx_bqsr,sum(v.sjgx_bnlj)sjgx_bnlj,……from(selectcasewhent.zclx_dm='110'then'11'fromt_zjb_yjs_ssjhjdqk_zclxtwheret.TJNY=201210andt.gljg_dmlike'2442%'andt.zclx_dmin('110','120','130','150','151','159','160','170',……)groupbyt.zclx_dm优化效果调整后,执行效率提高约57倍,5秒内执行完毕。RAC架构及性能指标专项优化上海新炬会通过自身的运维管理平台AMP,对RAC数据库的各种性能指标进行监控,定时测量并记录当前的数据库性能,确定RAC性能瓶颈点并及时进行有效的预防。案例:某省电信CRM集群数据库GC等待严重,数据库整体性能下降严重!问题描述某省电信的CRM集群数据库(3节点),随着业务量和访问量的增长,逐步开始出现业务的GCBufferBusy等待事件,数据库性能下降严重,经常导致业务不可用。原因说明业务在前期没有做好与数据库集群对应的规划,没有按节点进行业务分离,导致GC等待事件的不可避免发生。而且,在目前的业务架构和软件架构下,要重新调整十分困难;数据库集群间采用的是千兆心跳网络,因业务没有按节点分离,心跳流量经常超过100MB/S,很容易就突到网络性能瓶颈,从而加极了GC的等待事件发生。优化方法增加多一组千兆心跳网络,心跳流量支持能力翻倍,支撑能力达到200MB/S以上。优化效果集群数据库的GC等待事件明显减少(20以下),数据库整体性能恢复正常,运行稳定。业务系统OWI优化上海新炬会通过自身的运维管理平台(AMP)对数据库进行实时的监控,通过对历史数据的分析,生成各种性能趋势图。对于等待事件,我们会重点关注,通过量化的等待次数、等待时间、平均等待时间等指标,对等待事件进行预警,在数据库性能变更更糟糕前提前介入分析和优化OWI条目,保证系统终端用户的性能体验提升。案例:某省移动核心系统logfilesync等待事件严重,影响月结出账的效率问题描述1、月结出账时,CPU的IOWAIT达到40%2、logfilesync等待事件异常高eventwaitsTotalWaitTime(s)Avgwait(ms)%DBtimelogfilesync278,57550,34218162.45原因说明1、月结时频繁的DML操作,REDO生成量大,每分钟约1GB的归档日志生成,高峰时切换不过来2、RedoLogFile全划分在一个磁盘(PV)上优化方法1、将RedoLogFile打散到16个磁盘(PV)上2、将redolog大小由200MB调整为1GB,由3组调整为6组优化效果1、月结的抵扣入库提前30%的时间(约1小时)完成;2、CPU下降了30%,高峰期也最多只有10%的IOWAIT3、Logfilesync等待事件基本消失优化提前虽然上海新炬有大量的实践经验证明,大多数情况下,经过专项优化,均可取得比较可观的性能提升效果,但由于专项优化是在现网的基础上进行,某些优化手段(如业务逻辑调整)实施起来不仅难度大且风险高,所以上海新炬更建议和希望可在开发商前期规划到业务开发提前介入,结合业务特性与数据库特点,从专业角度给出建议和意见,从设计上就充分考虑数据库性能问题,从而避免后期整改存在的潜在风险。上海新炬公司有丰富的数据库架构设计、数据库规划、数据库变更管理等的项目经验,我们将携手湖北电信共同保障业务系统的性能,将优化前移,以更小的投入成本,产出更多的效率性能,保障和提升终端用户对业务系统的使用体验。专项优化效果示例1、某省移动BOSS系统优化效果示例:2、某省移动综合综管系统优化效果示例:3、某省地税综合应用平台优化效果示例:4、某省移动CRM系统优化效果示例:专项优化实施案例某省移动综合资管系统性能优化案例某省网管系统在建设和运营过程中,面临设备数量庞大、业务访问量激增、用户体验低下等困难,各功能模块平均响应时间接近14秒,需要从系统的业务功能、用户界面、应用性能等方面开展网管系统的专项优化,提升系统的高效性、稳定性、可扩展性和用户体验感知。经过上海新炬实施专项优化服务后,各功能模块平均响应时间从14秒提升到2秒,平均优化效果提升790%。主要优化内容包括:业务功能模块性能优化对综合资管已上线功能包括无线、核心、传输、管线、存量等,进行针对性性能优化。包括:各功能模块性能问题收集记录,并进行性能情况验证采集对各项需要优化的操作从业务层,应用层,系统层进行逐层优化分析操作实现业务逻辑分析操作实现技术手段分析应用程序数据访问特点分析应用技术框架分析操作实现底层代码分析对WAS,WEBLOGIC,TOMCAT等中间应用进行优化分析对后台系统环境进行优化分析对各业务场景各操作涉及SQL语句进行优化分析对涉及各数据模型进行优化分析数据库表数据分布分析数据空间数据存储方式分析系统数据增长、数据访问特点、空间需求分析、评估应用布署方式分析优化系统软件配置参数分析优化。系统软件版本及补充分析优化。根据优化分析情况,制定优化方案。跟进并执行优化测试进行优化验证制定正式生产环境优化布署方案执行正式生产环境优化实施正式生产环境优化效果验证端到端流程性能优化根据综合资管系统实际情况,列举系统实际存在的工作流程。布署系统全流程真实用户体验收集系统。通过流程编排设计,将收集的各操作数据进行串接。进行全流程业务操作响应时间分析排查响应时间较长的操作对响应时间较长的操作进行分析优化根据收集的真实用户体验数据,进行场景使用率排序,列举重要业务场景对重要业务场景进行压力分析实施上线前的测试工作,包括环境搭建、数据准备、跟踪监控、结果分析、环境清理。在优化实施后提供系统平台中间件、数据库实例运行的主机系统性能、I/0性能、网络性能以及数据库和应用程序统计信息进行监控、确定数据库实例运行环境的整体健康状况。高并发、大数据量优化综合资管系统将由惠州试点转向全省推广使用,同时资管系统做为全省网络资源管理的核心系统,系统全省推广使用后将带来高用户并发,大数据量的巨大压力。因此需要在全省推广使用前对系统高并发,大数据量的承受能力进行优化,主要包括以下方面的工作:针对后续其他地市试点及推广出现用户量、数据量增长带来的性能问题进行分析。通过过试点期间对性能数据的监控分析,制定性能收集策略,采样在不同级别用户量、不同级别数据量的情况下系统操作的性能响应效率。针对因为并发量增长、数据量增长呈现响应时间逐步降低的操作进行优化分析。对应用框架进行高并发、大数据量适用性分析及优化对重点业务场景技术实现方式可靠性,容错性分析及优化系统环境高压力,抗冲击分析及优化,包括系统的高可用性,系统资源的横向扩展能力。在试点及逐步推广过程中对业务系统业务增长及资源消耗趋势预警及分析,并提供及实施优化,避免大面积出现性能问题。在试点及推广过程中提供全程技术支持服务,随时解决出现的各类性能问题。并提供系统基础软硬件平台的监控评估。平台架构优化综合资源系统做为将来全省资源管理的核心系统,将面临推广及深化应用。系统当前的平台架构将需要做出优化,以便支撑更多的用户,更方便的扩展,更快速的布署。平台架构方面的优化工作如下:现有架构分析现有系统中间件架构情况分析,集中分析现有中间件架构在性能、高可用性、可扩展性方面的不足,现有中间件应用部署存在问题、现有系统中间件功能组件使用状况分析、系统中间件方面的资源开销、增长趋势评估。应用程序数据访问特点分析数据安全状态、数据安全保防现状分析数据库连接特点分析数据库网络访问特点、网络安全情况分析现有数据库系统,运行期间存在问题分析、评估大表数据分区方案、数据表存储部署现状分析现有系统用户分布状态、数据分布现状分析现有系统的资源开销、增长趋势评估分析。现有版本存在问题分析、评估现有系统补丁版本、one-off–patch功能分析平台架构新技术使用分析,针对目前主流的中间件,数据库版本,评估新版本对于资源管理系统的适用性。根据当前平台架构分析中存在的问题及新版本对于中间件产品版本升级。开源中间件向企业级中间件产品迁移主机,存储性能条带化,热点数据重构,优化数据存取性能应用部署规划物理部署条带化策略,通过对现网和目标业务情况分析,按照业务对系统资源要求特征,确定物理部署条带化方案。逻辑条带化策略,确定组件基线,分析6-12个月需求对组件变更影响,重构组件,代码修改范围控制在不稳定组件,降低变更风险和测试投入。编写应用部署方案。应用部署实现不停机(不需要中断全部应用)部署,也就是应用部署不会影响到整体应用业务输出。高可用性规划高可用方案设置,实现平台级故障主机级别隔离,确保单个或者个别中间件、数据库平台的故障不会引起整个系统瘫痪,同时防止一个中间件、数据库平台故障扩散到全系统的风险,提高系统稳定性。中间件、数据库负载均衡方案设计,中间件平台根据主机配置特点主动分配合适应用负载,使中间件集群的各主机负载分配均衡,数据库平台根据市公司业务均衡原则实现各市公司业务负载的平均分布,防止出现个别主机负载过高,提高系统整体稳定性。扩展能力设计根据系统的性能扩充特点实现垂直扩展方案,在主机处理能力增加的情况下,充分考虑如何利用主机处理能力,提升中间件系统的处理能力和性能根据系统的性能扩充特点实现水平扩展方案,实施水平扩展方案时,不会影响现有的系统稳定的同时,提升整个中间件系统的处理能力和性能数据库横向扩充能力,通过多节点RAC实施,使之具备横向扩充能力,避免数据库扩容引发的物理部署调整。针对整体架构中涉及的新技术,分析其对应用价值及实际问题解决方案,提出产品选型建议及后续演进方案。项目团队管理团队文化建设团队文化是指团队成员在相互合作的过程中,为实现各自的人生价值,并为完成团队共同目标而形成的一种潜意识文化。团队文化是社会文化与团队长期形成的传统文化观念的产物,包含价值观、最高目标、行为准则、管理制度、道德风尚等内容。它以全体员工为工作对象,通过宣传、教育、培训和文化娱乐、交心联谊等方式,以最大限度地统一员工意志,规范员工行为,凝聚员工力量,为团队总目标服务。清晰的团队目标一个积极的、运转灵活的团队不但非常清楚地了解自己的目标体系,而且还会积极主动地与组织的其他部分保持友好的合作关系。上海新炬与很多公司合作多年,一直以“优质诚信、服务客户”为宗旨,为客户实现业务目标提供高质量的支持服务,降低提供和使用IT服务的总体成本;优化了支持服务的投资和管理,为业务、流程和技术的全面变革提供支持。上海新炬将打造出一支团结、努力、创新、活力的团队,为IT支撑事业提供最优质的服务。优秀的团队领导团队的领导有两类:先锋型领导和赤字型领导。前者往往会身体力行,试图通过榜样的力量灌输给团队成员同样的品质。后者强调的是领导要善于根据薄弱环节进行补差,团队缺乏活力,他就提供活力,团队缺少控制,他就提供控制;前者强调对现有资源进行激发,后者强调为团队成员提供发挥才智的空间;前者突出领导对团队要求些什么,后者突出团队对领导要求些什么。进入二十一世纪以来,组织结构的扁平化、知识更新的加速化倾向日益凸现,赤字型领导应当成为一种首选模式,注重去培养下属,鼓励和支持下属承担更为艰巨的任务。上海新炬一向重视团队领导的培养,除了公司内部的系统培训和指导,定期安排各团队领导参加外部的资质培训,从而丰富了管理理念和增强项目管理的能力,公司的干部储备充足,拥有高级别的技能知识和管理实践经验。不仅在团队内部有影响力,而且对团队以外的更大范围内都有足够的影响力,更好地协调好一二线之间的合作。健全的制度体系完善的制度体系包括两个方面:有形的制度和无形的制度有形的制度:包含各种规章制度,主要有行为规范和奖惩制度两个部分。行为规范又包括有日常的工作规范、工作交接要求、信息安全等;奖惩制度,主要以绩效考核和激励办法作为体现。无形的制度:有形的制度不可能将团队成员的一切行为都列入规范范围,例如,法律以外、道德层次的行为就不易规范,但作为一个团队来说,又需要有自己的准则,这就是无形的制度。通俗地说无形制度又是一种氛围,处在一种氛围之中,如果不顺从多数人的行为,就会被视为另类。团队内无形制度的形成过程比较长,其形成的主要因素,一是团队文化的宣染;二是团队领袖和员工的愿望和目标一致。每个人都在为实现自己的目标而奋斗,甚至愿意贡献一生。那如果我们都有了共同的愿望和目标,我们的心都往一处想,劲都往一处使,就能很好的实现同心同德,同甘共苦,团结互助。在上海新炬的企业文化里面,员工之间的团结互助、积极进取是素有口碑的,这个优良的信念必定弘扬下去,建立每一个健康向上的团队。完善的培训计划培训在现代企业经营管理中是一种重要的管理手段,同时也是企业员工职业发展的推动器,它能使员工对企业文化和企业目标有深刻的体会和理解,能培养和增强员工对企业的认同感,通过培训提高员工各方面的职业素养和专业技术水平,从而达到任职资格要求,使企业和个人双方受益。上海新炬对于员工的综合素质培训非常重视,每个项目都有针对性的培训计划,包括岗位技能知识、业务知识、人员素质培训等等。除此之外,公司在每月组织一次面向全公司的内部培训,培训内容包括技术知识、管理知识和业务知识等,对于骨干员工或有较大潜力的员工,公司还安排外部的培训和认证考试,为打造一支有资质有实力的团队,公司不惜投入大量的资源。和谐的团队氛围营造公司良好工作氛围,是搞好团队建设的关键。人与人之间的相互影响效应是非常明显的,在企业中营造一种良好的人际氛围,体现人与人之间的人格平等。通过开展企业文化建设,培育共同的价值观和行为准则,营造相互鼓励、相互帮助的工作氛围,形成“胜则举杯相庆,败则拼死相救”的团队精神。以和谐的工作环境使每个员工在企业中不但干得好,还干得开心,从而不断增强企业的凝聚力和团队的活力。上海新炬对团队氛围的建设一向都是非常重视,为每个员工提供活动经费,每个团队可以灵活组织户外活动,除此公司还定期组织活动和专题拓展,大力支持建设活力、积极向上的团队,从而营造了和谐的团队氛围,也大大提高了员工的创造性及工作热情。团队激励方案团队的激励方式要围绕企业业务发展的总目标而采取灵活多样的方式,一个成功的激励或自我激励应该能够激励成长,对任何人来讲发展空间都很重要。大多数人都仅仅发挥出一半的能力,被告知和要求发挥出另一半的潜力是激励的最有效方式。上海新炬激励员工手段和方法:(方法和手段的运用原则是:按需、原则不变、手段常新)原则不变基于业绩和岗位的工资及绩效奖励;公司及组范围内的晋升和培训发展机会;安全、舒适、氛围融洽的工作环境以及全面、方便的配套设施;支持员工圆满完成工作、达成高绩效目标的工作氛围;直接主管对绩效表现优秀员工的书面或口头感谢。精神激励精神激励包括目标激励法、集体荣誉激励法、情感激励法、公平激励法、竞赛激励法等等。精神激励的方式有多种,例如:公司高层签署的表扬信,优秀南方基地测试人员评选活动的事迹宣传,让优秀人员参与管理和决策、在重大问题上发表意见等。物质激励最佳服务人员和飞跃进步奖的专项奖励;设立最佳服务团队奖励,鼓励团队合作与互帮互助;进行最佳员工排行榜的评选,对得票最多、上榜时间最长的员工给予奖励;参与公司每月一期的有奖技术征文活动;分时、按需奖励给通过培训即将上岗的员工举行毕业典礼,进行入职后的第一次正式激励;对推荐优秀新员工来组工作的员工给予相应奖励;把表现优秀的员工名单和事迹刊登到公司内部刊物;邀请家庭成员参加团队组织的聚会活动等;客户的表扬信在最醒目的地方给予张贴表扬。团队考核制度考核目的设定明确的服务指标,使员工清楚地知道公司和客户对服务水平和质量的要求。加强管理层和员工对服务质量的责任感。帮助管理层客观地评估运作表现,而不是靠主观的感觉判断。利用客观的数据分析问题所在并采取纠正及预防措施。降低运作成本考核对象中国电信湖北公司2016年核心业务系统压力测试、自动化功能测试及RUEI性能优化高级服务项目团队。收集信息的途径客户内部员工下级上级其他的接触部门人员内部评分办法中国电信湖北公司2016年核心业务系统压力测试、自动化功能测试及RUEI性能优化高级服务项目团队的内部考核将根据各个岗位职责要求进行考核,考核指标如下:岗位名称测试工程师所在部门应用管理部工作职责时间百分比发生频率职责任务职责一:日常工作40%0工作任务测试时,发现问题的数量及质量(界面错误或者是更深的业务错误),报告问题时,报告描述清晰、准确;12%日常测试用例的编写质量,用例描述和预期结果准确,需求覆盖率8%日常熟悉系统业务,掌握测试所需要的技术5%日常确保项目建设过程中的零失误及零投诉5%日常项目工作完成准时率达90%以上,确保项目工作客户满意度达100%10%日常职责二:推进工作效率提升 10%0工作任务提出个人、团队工作中发现的问题,并给出解决建议5%随机分享个人总结经验,为团队提供专业培训;流程化、规范化日常工作5%随机职责三:服务沟通(口头/会议/文档/方案/PPT/邮件等)30%0工作任务能与合作厂商良好交涉协调,善于合作和帮助别人,顺利完成工作15%随机保持每周与各系统负责人,开发商的一次以上沟通10%随机参加项目工作协调会、问题分析会、技术评审会等会议5%随机职责四:综合技术能力(完成工作量/综合能力评定)20%0工作任务综合技术完成工作:考核期内对IT系统的了解程度10%随机及时提交工作计划、周报及总结2%随机完成测试总结、测试过程报告等2%随机各种工作总结,项目总结,测试方案,测试报告等提交及时率90%以上2%随机技术文档、测试报告、测试案例等整理及分类汇总2%随机重大需求测试方案编写,负责需求测试及总结汇报2%随机岗位名称项目经理所在部门应用管理部工作职责时间百分比发生频率职责评分职责一:技术与项目管理工作30%0工作任务日常事务管理:协调资源按时完成需求测试管控工作及客户下达的各类服务需求。15%日常专题推进:组织、启动服务专题(及构思专题),专题项目工作完成准时率达90%以上,确保项目工作客户满意度达100%。5%日常工作审核:项目组文档方案审核,并做好日常工作量记录5%日常负责需求测试、自动化测试工作,为组内工程师提供技术培训和开发指导5%日常职责二:重大事件跟进及处理20%0工作任务组织协调:及时响应、组织人员处理各类重大事件,并按流程要求及时进行事件2%随机技术建议:全程跟进技术处理过程,为工程师提供处理建议2%随机沟通管理:并作为接口人做好客户、合作厂商沟通、解释工作,弱化故障影响面6%随机牵头处理测试环境相关的工程,帮助客户协调开发商,制定、评审工程方案10%随机职责三:服务沟通(口头/会议/文档/方案/PPT/邮件等)25%0工作任务项目接口人:负责与合作厂商、客户的沟通、协调工作安排;定期与客户或合作厂商沟通、了解客户服务需求、对项目组工作要求,并及时提供解决方案或提高服务质量的改进建议10%随机方案报告:及时提交工作计划、周报及总结;根据需求编写(测试、技术、系统)专题技术方案/测试报告;各种工作总结,项目总结,技术方案,测试案例等提交及时率90%以上15%随机职责四:团队管理(成长/满意度/经验总结)25%0工作任务团队管理:负责对组员下达任务,组织、监督日常维护工作;负责协调项目组的资源配置,提高团队工作质量和工作效率5%随机组织建设:对项目组成员进行考核,负责定期与项目组成员进行技术、管理与文化等方面的沟通,善于尊重及接受他人的建议,提高团队合作与战斗力5%随机团队培养:负责新员工培训,亲自及带领核心同仁负责对团队成员的技术指导;调查项目组成员的培训需求、组织实施培训,提高团队技术能力。

要求要有明确的新人培养计划、考核方式,并告知存在的缺点与改进方式。5%随机人员调休:根据团队员工情况,适当安排员工调休,使员工得到休息,做到劳逸结合。10%评分等级优秀良好一般较差很差>9595-8585-7575-65>65ABCDE一等二等三等四等五等等级说明优秀(A)能力才干超出现任职务的要求,能够承担更高更复杂的工作任务,具有卓越的才能;良好(B)具有的能力、才干满足现任职务要求,能够圆满解决和处理工作中的问题,胜任现职;一般(C)具有现职的要求和起码的能力和才干,基本胜任;较差(D)在现职需求必备能力和才干方面,稍有欠缺,需要在别人的扶持下胜任现职,需要努力;很差(E)不具备现职要求的能力,工作中经常出错,力不从心,不能胜任本职工作。绩效反馈绩效优异:成绩优异者推荐参加优秀员工评选,与职位的晋升和工资提升挂勾,方法如下:每两个月为一个考核期,由各团队按照25%的比例推荐人员参加公司述职;述职评委由4名公司管理层和现场20名大众评委组成,其中管理层每人20分,现场20名大众评委每人1分,总分100分;按最终个人总分得分由高到低排名,通过率控制在80-90%之间,述职通过成为公司当期“优秀员工”绩效不达标:及时与该员工沟通,友善地指出其需要努力的地方,帮助其提升绩效。团队后备制度及人员流失应对为了避免人员流动对于公司服务质量的影响,同时确保公司在不可预料的突发情况下有足够的人力资源投入,我们建立了人才危机管理计划及人才危机预警管理系统。人才危机管理计划,这一计划的作用在于一旦发生人才流失危机,公司能迅速根据事先拟定好的程序和计划对此做出反应。该计划应包括以下内容危机管理小组的构成、危机处理的基本原则、危机处理方案、危机管理程序等。人才危机管理计划应在工作分析的基础上因岗制订,依据各岗位的重要程度、可替代性强弱以及对任职者要求的高低进行权衡选择。为了使人才危机管理计划不留于形式、富有效率并具备可操作性,该计划针对公司内的核心技术岗位和重要管理岗位,目的在于确保企业核心员工安全。如某一部门核心员工离职后,危机管理小组如何实施沟通管理,如何启动人才储备寻找继任者,如何控制损失和影响等。由于涉及到核心员工的模拟替代,公司在培训过程也极力取得他们的理解和支持,让他们明白这些计划的制定和实施只是公司的一项管理制度,而不是怀疑某人即将离职。另人才危机预警管理系统是对公司人才安全状况进行识别、分析、判断,并做出警示和调控的管理活动,它是公司人才危机管理系统的一个子系统。建立人才流失危机预警管理系统,关键是在认真分析员工离职原因的基础上确定相应的预警指标,如工作满意度、工作压力感、员工对公司认同感等。预警系统建立后,实施对这些指标的日常监控,一旦它们偏离正常安全范围,系统立即发出预警信号,随后危机管理小组马上展开分析调查,弄清问题出现的原因并评估其影响程度,然后在此基础上做出相应的管理决策,是改善组织管理以化解危机还是正式启动危机管理程序。危机预警管理系统的目的在于及时发现企业日常人才安全方面的问题,从而为改进组织管理职能或实施人才流失危机管理赢得时间和主动。培训制度及方法培训内容中国电信湖北公司2016年核心业务系统压力测试、自动化功能测试及RUEI性能优化高级服务项目相关培训,培训的目标为:掌握各种基本的测试方法,测试人员懂得如何去测试一个需求业务培训,测试人员熟悉业务系统的业务流程自动化测试培训,熟练使用自动化脚本,会编写自动化测试脚本具备测试结果分析能力,了解测试测试结果分析的方法,具备结果分析能力,能够根据需求或者开发提供的设计文档,发现其中的逻辑错误或者其他错误。培训对象新员工培训方式现场培训:现场培训主要是针对工具使用、测试方法、测试环境等各阶段对使用人员的讲解。讲解的内容将在集中培训阶段再进行深化,帮助学员加深理解。另外,在现场将尽量安排使

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论