软件性能与性能测试精_第1页
软件性能与性能测试精_第2页
软件性能与性能测试精_第3页
软件性能与性能测试精_第4页
软件性能与性能测试精_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、软件性能与性能测试教程第1部分中国软件评测中心陈兵本系列教程对软件性能与性能测试这个主题进行了较为全面的介绍和分析。教程分为三个部分:在第1部分,讲解了软件性能的基本知识,介绍了常用的软件性能指 标,在分析影响软件性能因素的同时,以实例清晰讲解了如何提高软件的性能及性能 的可扩展性等问题;在第2部分,首先给出了性能测试的基础知识,然后侧重于从性能 工程的角度提出开展性能测试工作的流程,和进行性能测试工作的策略,以及如何分 析性能测试数据;在第3部分,从开发的(而不是第3方测试角度,以实例为引导,一步 一步地分析讲解在开发环境下进行性能测试的策略、方法和手段(采用的工具。本系列教程可以用作软件开

2、发人员、软件测试人员、软件项目经理、软件质量 人员和需要了解软件性能测试的各级软件管理人员的工作参考手册,也可作为有志 于软件开发和软件性能测试领域人员的参考资料。在20世纪60年代,计算机资源还十分有限,效率是被关心的最重要问题。到了70年代计算机迅速发展,程序员意识过分专注于性能会损害程序的可读性和维护 性。因而软件性能和代码调整受到的重视程度有所下降,随着80年代微型计算机的 革命,性能限制又把效率问题提出来。在整个 90年代中它被人们关注的程度则逐渐 下降。21世纪初,移动电话和PDA等设备上嵌入式软件受到的内存限制,以及解释 型代码的执行时间过长,使效率再度成为了一个热点话题。软件性

3、能什么是软件性能1.什么是系统的性能是个很大的概念,覆盖面非常广泛,对一个软件系统而言,包括执行效 率、资源占用、稳定性、安全性、兼容性、可扩展性、可靠性等等。一般来说,性能是一种指标,表明软件系统或构件对于其及时性要求的符合程度 ; 其次性能是软件产品的一种特性,可以用时间来进行度量。通常,对于软件性能的关注是多个层面,用户关注软件性能,系统管理员关注软件 性能,软件开发人员也关注软件性能,那么这些不同的关注者所关注的软件性能”的 具体内容是不是都完全相同呢?如过不同,那么不同点在哪里?下面我们从三个不同 的层面对软件性能做一个简要的介绍。(1用户视角的软件性能从用户角度来说,软件性能就是软

4、件对用户操作的响应时间。(2管理员视角的软件性能从系统管理员的角度来看,所重点关注的软件系统性能是:系统的响应时间;系统 运行时服务器的状态,如CPU利用情况、内存使用情况等;系统是否能够实现扩展; 系统支持多少用户访问;系统性能可能的瓶颈在哪里;系统是否支持7*24小时的业 务访问等。(3产品开发人员视角的软件性能这也是本文的视角,即本文从开发人员的角度来讨论软件性能与性能测试。从 开发人员的角度来说,会关心主要的用户感受一响应时间,因为这毕竟是用户的直接 体验;另外,开发人员也会关心系统的扩展性等系统管理员所关心的内容,这里指的是性能而不是功能的可扩展性,这个问题本文的后面讨论;但对开发人

5、员来说,最想知道 的是如何通过调整设计和代码等等方法来提高软件的性能表现”和如何发现并解 决软件设计和开发过程中产生的由于多用户访问引起的缺陷”等等,参见表1。表1给出了开发视角的软件性能关注内容。开发人员关心的问题问题所属环节架构设计是否合理?系统架构数据库设计是否合理?数据库设计代码是否存在性能方面的问题?代码系统中是否有不合理的内存使用方式?代码系统中是否存在不合理的线程同步方式?设计与代码系统中是否存在不合理的资源竞争?设计与代码从表1中可以看到,问题所属的 关键环节是在代码构建上面。从开发人员的角度来看,可以用如下五个方面来作为 评判性能的标准:1运算的性能一一哪一个算法的执行性能最

6、好?2内存的分配一一程序运行时需要耗费多少内存?3启动的时间一一程序启动需要多长时间?这在Web项目中的影响不大,但要注 意部分程序需要部署或运行在客户端时的情形 (比如Applet程序。4程序的可伸缩性 在压力负载的情况下,程序的性能如何?5性能的感知用户在什么情况下会觉得程序的性能不好 ?以上五个方面,在具体的使用场景可以有选择的去评判。关于如何提高系统性 能的问题,我们在下节进行讨论。2.如何提高程序的性能要提高软件的性能,我们可以从以下几个方面着手,使用高性能、速度快的硬件-$ =速度使用恰当的编程语言和进行编译器优化设计可扩展的应用程序架构设计方面选择正确的数据结构和算法代码调整避免

7、使用较慢的OS APIs调整、测量(注意是测量而不是测试、再调整、再测量(1从上面的几个方法来看,使用高性能、速度快的硬件很容易理解,也是决大多 数人在碰到性能问题的时候首先会想到的办法。采取这样的方法总是很有效的吗(2使用恰当的编程语言和进行编译器优化也是提高软件性能的方式之一。例如在使用In tel C+编译器时,编译器选项可以组合。每种优化各有其特点,尝试着各 种优化选项的效果,有时各种优化选项组合使用可能效果更好。使用时,这些选项加 到Project Setting对话框中。如图1所示。同样,在原则Java语言构建软件系统时,可以针对JDK进行调优。例如:选择合 适的JDK版本:不同版

8、本的JDK,甚至不同厂家的JDK可能都存在着很大的差异 对 于性能优化的程度不同。一般来说,尽可能选择最新发布的稳定的JDK版本。最新 的稳定的JDK版本相对以前的JDK版本都会做一些bug的修改和性能的优化工 作。垃圾收集:垃圾收集就是自动释放不再被程序所使用的对象的过程。当一个对 象不再被程序所引用时,它所引用的堆空间可以被回收,以便被后续的新对象所使 用。垃圾收集器必须能够断定哪些对象是不再被引用的,并且能够把它们所占据的堆空间释放出来。如果对象不再被使用,但还有被程序所引用,这时是不能被垃圾收 集器所回收的,此时就是所谓的 内存泄漏”监控应用程序是否发生了内存泄漏,有 一个非常优秀的监

9、控工具推荐给大家 Quest公司的JProbe工具(这样的工具非 常多,有许多是开源的,使用它来观察程序运行期的内存变化,并可产生内存快照,从而 分析并定位内存泄漏的确切位置,可以精确定位到源码内。这个工具的使用我在后 续的章节中还会做具体介绍。Java堆的优化:Java堆是指在程序运行时分配给对象生存的空间。通过-mx/-Xmx和-ms/-Xms来设置起始堆的大小和最大堆的大小。根据自己JDK的版本和厂家决定使用-mx和-ms或-Xmx和-Xms。Java堆大小决定了垃圾回收的频度和速度,Java堆越大,垃圾回收的频度越低,速度越慢。同理Java堆越小,垃圾回收的频度越高,速度越快。要想设置

10、比较理想的参数,还是需要了解一些基础知识的。Java堆的最大值不能太大,这样会造成系统内存被频繁的交换和分页。所以最大内存必须低于物理内存减去其他应用程序和进程需要的内存。而且堆设置的太大,造成垃圾回收的时间过长,这样将得不偿失,极大的影响程序的性在效率方面,程序的效率与详细设计阶段确定的算法的效率直接有关。在详细 设计翻译转换成源程序代码后,算法效率反映为程序的执行速度和存储容量的要 求。要从计算复杂性、内存的使用、数据依赖性等多方了解,使用如何实现算法指导起一个重要作用。而数据的依赖性与指令的选择密切相关,以Intel86x指令结构为例:选择指令需要实现一种算法的指令可能对性能有一个大的影

11、响。因此检测采用某个算法 中的某些指令,像整数加法可能执行两个/s,还执行其它指令;像整数除法,可能每23Clock才能执行一次。由于不同的指令有不同的延迟和吞吐量,指令的速度是一定的。指令输入准备好以后(预取来自内存,指令的延迟是要求执行开始并完成一条指 令的时钟数。例如:整数乘大约15-18 Clock。所有,乘法的响应在它开始执行以后有可利用的15-18 Clock。指令的吞吐量是开始执行相同的指令之前处理器要求等待的时钟数。指令的吞 吐量总是少于或等于指令的延迟。乘法的吞吐量是5Clock,意味着新的乘法可能开始执行每 5Clock,即使它花费15-18Clock去响应任何指定的乘法。

12、指令流水线引起吞吐量和延迟的Clock数是不同的。数据的依赖性和指令的平行性数据的依赖性影响处理器的同步执行指令的能力,它能提高算法的性能Pentium处理器是能够每个Clock执行六条指令,但由于指令流的问题,同步执行 指令数经常是较低的。理想的情况如图2所示:SCIock图2图2这是假设这些指令之间没有数据依赖性存在,允许它们同时进行,只有指令 的延迟和吞吐量的限定。在实际情况下,数据依赖性往往存在,并且这会使结局有巨大的不同,如图3所示:在图3中,数据的依赖性和延迟限制指令的平行性对算法性能来说是关键的限 制因素。补充指令平行性规则对各个已存在的处理器家族已有说明,但用数据依赖性和延迟解

13、释能产生一个稍微好些的执行指令,可以忽略补充指令平行性规则。图3对于线程的监控可以借助很多工具来完成,图4是采用JProfiler对线程进行的监控例子。乘法:a=u*v b=w*x c=y*z a=u*v b=w*x c=y*z延迟乘法:a=w*x*y*z w*xy*z wx*yz图4(3设计可扩展的应用程序:指的是软件性能上的可扩展。这点可能会使很多读 者感到很困惑,难道还有哪些设计会造成使用更高速度的硬件不能提高软件的性能 吗?答案是肯定的,如果一个软件设计的不具备可以扩展性,那么在4个、8个CPU的 机器上运行会比在1个CPU的机器上运行的速度快不了多少。让我们用一个例子 来说明这个问题

14、。这是一个SMPT服务器的例子,为了说明问题,我们将该邮件服务器的实现进行 高度抽象(实际要复杂的多。这个服务器的基本功能就是:发邮件,来邮件后进行处理 分析邮件发给谁,如果发给是本机的邮箱的人员就给把它直接拷贝到一个邮箱中 去。如果是传送的另外一个 SMPT服务器的,就通过TCPIP把它给转发出去。高度抽象后的抽象SMPT服务器/ Read SMTP commands/data from sockets首先把邮件从 sockets读进来If (ReadFile( / various housekeep ing removed / Parse SMTP recipients and other

15、 headers分析读进来的邮件,先分析头文件(地 址,来源的信息If (!ParseSMTPHeaders(/ han dle errors/ Parse bodies-然后分析文件的 bodiesIf (!ParseSMTPBodies(/ han dle errors/ Local delivery or routing -故判断If (LocalDelivery(-本机Deliver(拷到一个目录下 else 下一极SMTP服务器Route(转发到另外的SMTP服务器/ Send SMTP respo nse through SocketIf (WriteFile( / various

16、 housekeeping skips 写文件或Socket穿到另外的服务器传统的线程的设计方法是这样做的:1 thread to receive and dispatch SMTP request64 worker threads doing:(64个工作线程去做剩余的 4个步骤Parse SMTP headersParse SMTP bodiesLocal deliveryRout ing每一个线程都一步一步的依次做这 4个步骤,然后在做下一个,不断的重复。这样的设计其性能就不具备可扩展性,如果感到邮件服务器的处理能力不够,通 过增加CPU是无法提高其处理能力的,为什么呢?前面在讲到效率的

17、时候,我们说要 从内存的使用等方面进行考虑。下面我们看看相关硬件对这个设计的影响。我们都知道,对于存储来说,存取速度的快慢从高到低的顺序是:L1 cache ->L2 cache -> RAM ->。因此,如果我们的代码从硬盘上读入进入 cache后能够很好的在 cache存放,你的程序的不断的被重用,不断的被执行的运行,你的效率就会非常的 高。而如果你的大不分程序都要经常从硬盘、从内存读入后执行,那么你的程序效率当然就会很低了。而且你也知道,虽然这些年CPU、内存的速度增长很快但是硬盘的读写速度并没有多大的提高。这里有个比喻:如果1秒钟可以清零一个寄存器 这样的简单操作,那

18、么:在L1 cache中操作-只需要1秒(1倍在L2 cache中操作 -需要 4 秒(plus 3 sec onds extra work - 7倍在RAM中操作-需要25-150秒(24倍-150倍在磁盘中操作-则需要3个周(2,000,000倍因此我们的设计应该充分的利用 cache或内存,这样程序的效率才能够得到高性能。SMPT服务器的全新设计是:1 thread to receive and dispatch SMTP reques与原来的设计一样2 worker thread per CPU剩余的4个步骤,每个步骤对应一个队列,线程每一次都把一个队列的全部工作 都做完后,才做其它的

19、步骤。Parse SMTP headers/bodiesLocal deliveryRout ingSocket send and file I/O这样一来,有什么好处呢?很显然,对于每一个步骤来说,数据是不一样的,但是程序是相同的,每次都处理一个队列中的所有内容,因此程序得到了不断 的重用。图5给出了两个设计的效果比较Overall PerformanceSMTP Server ThreadsTraditional ThreadsNumber of CPUs(4代码的调整:代码优化的方法有许多,针对不同的环境、编程语言等都有特定的有关优化方法,可以参照相关资料,例如在Java编程方面可以看看

20、Java PerformaneeTuning(O'Reilly 这本书。代码是要在个编程过程中不断进行调整的,因此调整、测量、再调整、再测 量。通过不断的测量找出需要进行性能优化的部位 ,那么在开发中如何进行测量 采用怎样样的方法、工具就显得极为重要了 ,这方面的问题我们将在本文的后面详 细讲述。持续性能检测、监视和改进代码,这样容易做到性能优化,而且还可以有效 的发现和改进性能。而等到最后才开始优化性能 ,会变得更困难和费时。3.有关软件性能的基础知识(1多进程多进程是在同一个系统中执行多个进程或程序的能力,多进程的主要好处是提 高系统的吞吐量。某些应用依赖多进程去优化吞吐量。如 :

21、同时有许多用户登录系 统。从硬件的角度,提高性能最容易的方法是在主板上放入多于一个的CPU,这样不同的CPU既可以承担不同的工作,又可以使它们平行运行,做相同的工作。在一个对称多进程环境中,CPU共享相同的内存,在一个CPU中运行的代码可 能影响另一个CPU使用内存,其结果会受影响。如:你不能确定早先你给变量设定的 值仍是原值,因另一个CPU可能对它做了操作。(2多线程多线程是一个进程在相同的地址空间里同时执行多道线程,这些线程有不同的执行路径和独立的堆栈,也可能线程有相同的执行路径而操作不同的数据。如:一个线程打印,一个线程计算并存或同一个应用计算用多个线程,各自有不同的数据等。 系统支持多

22、线程可以改进各个应用的性能。(3加速加速是调整后的性能与原性能之比,或它是基线的测量性能和优化后的性能的 典型计算之比。当你设置调整目标和测量改进性能时,它是有用的。加速通常有两种表示方法:(4可测量性可测量性是隐藏在应用和系统中的一种能力,由增加资源数量来提高性能。 如: 向系统中加入更多的处理器、更多的 RAIDs、或更多的磁盘组成RAID ,应用程序 性能会更好。两种可能的方法检验是否应用是可计量的:固定负载,用增加CPU提高性能增加CPU,增加负载来维持性能(5 “ Amdahl”律的图形表示和公式图6Time =Baseli neTime OptimizedTime Rate= Op

23、timizedTime Baseli neTimeSpeed-Up of Fract ion Enhan ced(1- Fracti on Enhan ced + Fracti on Enhan ced Speed-Up = 1如果仅有一半的执行时间被优化,2倍的加速是不可能的。4.主要主要性能指标性能指标性能指标种类种类(1 并发用户数(Concurrent users supported并发用户数是指在某一给定时间内,某个特定点上进行会话操作的用户数。网 站的公式网站并发用户数公式如下网站并发用户数 =RPS + SBC + Thi nki ng Time这里:RPS (Request P

24、er Secon每秒请求数(吞吐量SBC (Simulta neous Browser conn ectio ns并发连接数Thi nki ng Time平均用户思考时间(2 响应时间(Response time or latency响应时间指的是客户端发出请求到得到响应的整个过程所经历的时间。例如从 初始的请求到回应下载的完成(刷新整个网页之间的时间,参见图7。图7Internet你可以测试在服务器上和在客户端上的响应时间:服务器端的响应时间(Latency measured at the serve这个时间指的是服务器完成请求执行的时间,不包括客户端到服务器端的反应(请求和反应在网络上的通

25、讯时 间客户端的响应时间(Latency measured at the clien这个反应时间等于客户端的请 求队列加上服务器的反应时间和网络的反应时间。你可以用各种各样的方法来测试反应时间。常用的有两种方法:首字节响应时间(度量首字节的响应时间,指向服务器发送请求与接收到响应的第一个字节之间的时间和末字节响应时间 (度量末字节的响应时间,指向服务器发送请求与接收到响应的最后一个字节之间的时间。通过测 量响应时间,您能知道您的应用程序是否因为响应时间太久以至于不能响应请求。(3 吞吐量(Throughput吞吐量是指单位时间内系统处理的客户请求的数量,直接体现软件系统的性能 承载能力。一般来

26、说,吞吐量由负载(如用户的数量或使用什么类型的应用程序来决定 (举个 例子,下载文件比浏览网页需要更高的吞吐量。如吞吐量用请求数 /秒或页面数/秒来 衡量,从业务的角度,吞吐量也可以用访问人数/天或处理的业务数/小时等单位来衡 量。从网络的角度来说,也可以用字节数/天等单位来考察网络流量。(4资源利用率资源利用率是指系统资源的使用程度,比如服务器的CPU利用率、内存利用 率、磁盘利用率、网络带宽利用率等。1 内存(Memory内存使用情况可能是系统性能中最重要的因素。如果系统页交换”频繁,说明内存不足。页交换”是使用称为 页面”的单位,将固定大小的代码和数据块从 RAM 移动到磁盘的过程,其目

27、的是为了释放内存空间。尽管某些页交换使操作系统能够 使用比实际更多的内存,也是可以接受的,但频繁的页交换将降低系统性能。减少页 交换将显著提高系统响应速度。要监视内存不足的状况,请从以下的参数指标开始:Comm i tte d B yte s in U s e正在使用的字节的百分比:是Memory_Comm i tte d B yte s与Memory_Comm i t Li m i t之间的百分比比值,即已分配给物理RAM用于存储或分配给页面文件的虚拟内存A vailabl eB yte s可用物理内存数:显示了物理内存的剩余量。该值低于4M B,并且达到分钟级时,表明内存不足P a ge

28、Fa u l t s/s e (每秒钟的缺页数:该数值反映了有多少个请求的信息不在物 理内存中对应的位置上。该值偶尔高时,表明有线程竞争,持续走高时,表示可能有内存瓶颈。P a ge s/s e (显示 p a ge in put/s e c和 p a ge output/s e c的总和:p a ge in put/s e c 反映的是物理内存的短缺情况;p a ge output/s e(显示从物理内存中调出的信息量,反映了计算机的繁忙程度。一般如果P a ge /s e c持续高于几百,那么您应该进一步研究页交换活动。有可能需要增加内存,以减少换页的需求(你可以把这个数字乘以4k就得到由此引起的硬盘数据流量。P a ge /s e(:的值很大也不一定就表明内存有问题,而可能是运行使用内存映射文件的程序所致。由于过多的页交换要使用大量的硬盘空间,因此有可能将导致将页交换内存不足与导致页交换的磁盘瓶径混淆。因此,在研究内存不足不太明显的页交换的原因时,您必须跟踪磁盘使用情况(在下面介绍计数器和内存计数器:P a ge Fa u l t s/s e包 括有些可以直接在内存中满足而有些需要从硬盘读取 ,而p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论