软件工程(第3版)第5章人民邮电出版社.ppt

资源描述

第5章结构化实现通常把编码和测试统称为实现所谓编码就是把软件设计翻译成计算机可以理解的形式用某种程序设计语言书写的程序作为软件工程过程的一个阶段编码是设计的自然结果因此程序的质量主要取决于软件设计的质量但是所选用的程序设计语言的特点和编码风格也会对程序的可靠性可读性可测试性和可维护性产生深远的影响无论怎样强调软件测试的重要性和它对软件可靠性的影响都不过分在开发大型软件系统的漫长过程中面对着极其错综复杂的问题人的主观认识不可能完全符合客观现实与工程密切相关的各类人员之间的通信和配合也不可能完美无缺因此在软件生命周期的每个阶段都不可避免地会产生差错我们力求在每个阶段结束之前通过严格的技术审查尽可能早地发现并纠正差错但是经验表明审查并不能发现所有差错此外在编码过程中还不可避免地会引入新的错误如果在软件投入生产性运行之前没有发现并纠正软件中的大部分差错则这些差错迟早会在生产过程中暴露出来那时不仅改正这些错误的代价更高而且往往会造成很恶劣的后果测试的目的就是在软件投入生产性运行之前尽可能多地发现软件中的错误目前软件测试仍然是保证软件质量的关键步骤它是对软件规格说明设计和编码的最后复审软件测试在软件生命周期中横跨两个阶段通常在编写出每个模块之后就对它做必要的测试称为单元测试模块的编写者和测试者是同一个人编码和单元测试属于软件生命周期的同一个阶段在这个阶段结束之后对软件系统还应该进行各种综合测试这是软件生命周期中的另一个独立的阶段通常由专门的测试人员承担这项工作大量统计资料表明软件测试的工作量往往占软件开发总工作量的40 以上在极端情况测试那种关系人的生命安全的软件所花费的成本可能相当于软件工程其他步骤总成本的3 5倍因此必须高度重视软件测试工作绝不要以为写出程序之后软件开发工作就接近完成了实际上大约还有同样多的开发工作量需要完成仅就测试而言它的目标是发现软件中的错误但是发现错误并不是我们的最终目的软件工程的根本目标是开发出高质量的完全符合用户需要的软件因此通过测试发现错误之后还必须诊断并改正错误这就是调试的目的调试是测试阶段最困难的工作在对测试结果进行收集和评价的时候软件所达到的可靠性也开始明朗了软件可靠性模型使用故障率数据估计软件将来出现故障的情况并预测软件的可靠性 5 1编码 5 1 1选择程序设计语言总的说来高级语言明显优于汇编语言因此除了在很特殊的应用领域例如对程度执行时间和使用的空间都有很严格限制的情况需要产生任意的甚至非法的指令序列体系结构特殊的微处理机以致在这类机器上通常不能实现高级语言编译程序或者大型系统中执行时间非常关键的或直接依赖于硬件的一小部分代码需要用汇编语言书写之外其他程序应该一律用高级语言书写为了使程序容易测试和维护以减少生命周期的总成本选用的高级语言应该有理想的模块化机制以及可读性好的控制结构和数据结构为了便于调试和提高软件可靠性语言特点应该使编译程序能够尽可能多地发现程序中的错误为了降低软件开发和维护的成本选用的语言应该有良好的独立编译机制上述这些要求是选择语言的理想标准但是在实际选用语言时不能仅仅考虑理论上的标准还必须同时考虑实用方面的各种限制 5 1 2编码风格源程序代码的逻辑简明清晰易读易懂是好程序的一个重要标准为了做到这一点应该遵循下述规则 1 程序内部的文档所谓程序内部的文档包括恰当的标识符适当的注解和程序的视觉组织等等 2 数据说明虽然在设计期间已经确定了数据结构的组织和复杂程度然而数据说明的风格却是在写程序时确定的为了使数据更容易理解和维护有一些比较简单的原则应该遵循 3 语句构造构造语句时应该遵循的原则是每个语句都应该简单而直接不能为了提高效率而使程序变得过分复杂 4 输入输出在设计和编写程序时应该考虑下述有关输入输出风格的规则对所有输入数据都进行检验检查输入项重要组合的合法性保持输入格式简单使用数据结束标记不要要求用户指定数据的数目明确提示交互式输入的请求详细说明可用的选择或边界数值当程序设计语言对格式有严格要求时应保持输入格式一致设计良好的输出报表给所有输出数据加标志 5 效率效率主要指处理机时间和存储器容量两个方面虽然值得提出提高效率的要求但是在进一步讨论这个问题之前应该记住三条原则首先效率是性能要求因此应该在需求分析阶段确定效率方面的要求软件应该像对它要求的那样有效而不应该如同人类可能做到的那样有效其次效率是靠好设计来提高的第三程序的效率和程序的简单程度是一致的不要牺牲程序的清晰性和可读性来不必要地提高效率 5 2软件测试基础 5 2 1测试目标 G Myers给出了关于测试的一些规则这些规则也可以看作是测试的目标或定义测试是为了发现程序中的错误而执行程序的过程好的测试方案是极可能发现迄今为止尚未发现的错误的测试方案成功的测试是发现了至今为止尚未发现的错误的测试由于测试的目标是暴露程序中的错误从心理学角度看由程序的编写者自己进行测试是不恰当的因此在综合测试阶段通常由其他人员组成测试小组来完成测试工作 5 2 2黑盒测试和白盒测试对于软件测试而言黑盒测试法把程序看成一个黑盒子完全不考虑程序的内部结构和处理过程也就是说黑盒测试是在程序接口进行的测试它只检查程序功能是否能按照规格说明书的规定正常使用程序是否能适当地接收输入数据产生正确的输出信息并且保持外部信息如数据库或文件的完整性黑盒测试又称为功能测试与黑盒测试法相反白盒测试法的前提是可以把程序看成装在一个透明的白盒子里也就是完全了解程序的结构和处理过程这种方法按照程序内部的逻辑测试程序检验程序中的每条通路是否都能按预定要求正确工作白盒测试又称为结构测试 5 2 3测试准则为了能设计出有效的测试方案软件工程师必须充分理解并正确运用指导软件测试的基本准则主要的测试准则如下所述所有的测试都应该能追溯到用户需求应该在测试开始之前的相当长时间就制定出测试计划把Pareto原理应用于软件测试 Pareto原理告诉我们测试发现的错误中的80 很可能是由程序中20 的模块造成的测试应该从小规模开始并逐步进行大规模测试穷举测试是不可能的为了达到最佳的测试效果应该由独立的第三方来从事测试工作 5 2 4流图在设计测试方案时往往需要仔细分析程序的控制流为了突出表示程序的控制流可以使用流图也称为程序图流图仅仅描绘程序的控制流程它完全不表现对数据的具体操作以及分支或循环的具体条件在流图中用圆表示节点一个圆代表一条或多条语句程序流程图中的一个处理框序列和一个菱形判定框可以映射成流图中的一个节点流图中的箭头线称为边它和程序流程图中的箭头线类似代表控制流在流图中一条边必须终止于一个节点即使这个节点并不代表任何语句实际上相当于一个空语句由边和节点围成的面积称为区域当计算区域数时应该包括图外部未被围起来的那个区域图5 1举例说明把程序流程图映射成流图的方法图5 1把程序流程图映射成流图 a 程序流程图 b 流图 PDL procedure sort 1 dowhilerecordsremain readrecord 2 ifrecordfield1 0 3 thenprocessrecord storeinbuffer incremertcounter 4 elseifrecardfield2 0 5 thenresetcounter 6 elseprocessrecord storeinfile 7a endif endif 7b enddo 8 end 图5 2由PDL翻译成的流图图5 3由包含复合条件的PDL映射成的流图 5 3逻辑覆盖逻辑覆盖是设计白盒测试方案的一种技术设计测试方案是测试阶段的关键技术问题所谓测试方案包括具体的测试目的例如要测试的具体功能应该输入的测试数据和预期的输出结果通常又把测试数据和预期的输出结果称为测试用例不同的测试数据发现程序错误的能力差别很大为了提高测试效率降低测试成本应该选用高效的测试数据因为不可能进行穷尽的测试选用少量最有效的测试数据做到尽可能完备的测试就更重要了有选择地执行程序中某些最有代表性的通路是对穷尽测试的唯一可行的替代办法所谓逻辑覆盖是对一系列测试过程的总称这组测试过程逐渐进行越来越完整的通路测试测试数据执行或叫覆盖程序逻辑的程度可以划分成哪些不同的等级从覆盖源程序语句的详尽程度分析大致有以下一些不同的覆盖标准 1 语句覆盖为了暴露程序中的错误至少每个语句应该执行一次语句覆盖的含义是选择足够多的测试数据使被测程序中每个语句至少执行一次图5 4被测试模块的流程图 2 判定覆盖判定覆盖又叫分支覆盖它的含义是不仅每个语句必须至少执行一次而且每个判定的每种可能的结果都应该至少执行一次也就是每个判定的每个分支都至少执行一次 3 条件覆盖条件覆盖的含义是不仅每个语句至少执行一次而且使判定表达式中的每个条件都取到各种可能的结果 4 判定条件覆盖既然判定覆盖不一定包含条件覆盖条件覆盖也不一定包含判定覆盖自然会提出一种能同时满足这两种覆盖标准的逻辑覆盖这就是判定条件覆盖它的含义是选取足够多的测试数据使得判定表达式中的每个条件都取到各种可能的值而且每个判定表达式也都取到各种可能的结果 5 条件组合覆盖条件组合覆盖是更强的逻辑覆盖标准它要求选取足够多的测试数据使得每个判定表达式中条件的各种可能组合都至少出现一次 5 4控制结构测试 5 4 1基本路径测试基本路径测试是TomMcCabe提出的一种白盒测试技术使用这种技术设计测试用例时首先计算过程设计结果的逻辑复杂度并以该复杂度为指南定义执行路径的基本集合从该基本集合导出的测试用例可以保证程序中的每条语句至少执行一次而且每个条件在执行时都将分别取true 真和false 假值使用基本路径测试技术设计测试用例的步骤如下 1 根据过程设计结果画出相应的流图图5 5求平均值过程的流图 PROCEDUREaverage 这个过程计算不超过100个在规定值域内的有效数字的平均值同时计算有效数字的总和及个数 INTERFACERETURNSaverage total input total valid INTERFACECCEPTSvalue minimum maximum TYPEvalue 1 100 ISSCALARARRAY TYPEaverage total input total valid minimum maximum sumISSCALAR TYPEiISINTEGER 1 i 1 total input total valid 0 sum 0 2 DOWHILEvalue i 999 3 ANDtotal input 100 4 incrementtotal inputby1 5 IFvalue i minimum 6 ANDvalue i maximum 7 THENincrementtotal validby1 sum sum value i 8 ENDIF incrementiby1 9 ENDDO 10 IFtotal valid 0 11 THENaverage sum total valid 12 ELSEaverage 999 13 ENDIF ENDaverage 2 计算流图的环形复杂度用环形复杂度来定量度量程序的逻辑复杂性有了描绘程序控制流的流图之后可以用下述三种方法之一来计算环形复杂度流图中的区域数等于环形复杂度流图G的环形复杂度V G E N 2 其中E是流图中边的条数 N是流图中节点数流图G的环形复杂度V G P 1 其中P是流图中判定节点的数目使用上述任何一种方法都可以计算出图5 5所示流图的环形复杂度为6 3 确定线性独立路径的基本集合所谓独立路径是指至少引入程序的一个新处理语句集合或一个新条件的路径用流图术语描述独立路径至少包含一条在定义该路径之前不曾用过的边使用基本路径测试法设计测试用例时程序的环形复杂度决定了程序中独立路径的数量而且这个数是确保程序中所有语句至少被执行一次所需的测试数量的上界对于图5 5所描述的求平均值过程来说由于环形复杂度为6 因此共有6条独立路径例如下面列出了6条独立路径路径1 1 2 10 11 13 路径2 1 2 10 12 13 路径3 1 2 3 10 11 13 路径4 1 2 3 4 5 8 9 2 路径5 1 2 3 4 5 6 8 9 2 路径6 1 2 3 4 5 6 7 8 9 2 路径4 5 6后面的省略号表示可以后接通过控制结构其余部分的任意路径例如 10 11 13 通常在导出测试用例时识别出判定节点是很有必要的本例中节点2 3 5 6和10是判定节点 4 设计可强制执行基本集合中每条路径的测试用例应该选取数据使得在测试每条路径时都适当地设置好了各个判定节点的条件可以测试上述基本集合的测试用例如下路径1的测试用例 Value k 有效输入值其中k i i的定义在下面 value i 999 其中2 i 100 预期结果基于k的正确平均值和总数注意路径1无法独立测试必须作为路径4 5和6的一部分来测试路径2的测试用例 value 1 999 预期结果 average 999 其他都保持初始值路径5的测试用例 value i 有效输入值其中i 100 value k maximum 其中k I预期结果其于k的正确平均值和总数路径6的测试用例 value i 有效输入值其中i 100预期结果正确的平均值和总数 5 4 2条件测试尽管基本路径测试技术简单而且高效但是仅有这种技术还不够还需要使用其他控制结构测试技术才能进一步提高白盒测试的质量用条件测试技术设计出的测试用例能够检查程序模块中包含的逻辑条件一个简单条件是一个布尔变量或一个关系表达式在布尔变量或关系表达式之前还可能有一个NOT 算符关系表达式的形式如下 E1 关系算符 E2 其中 E1和E2是算术表达式而关系算符是下列算符之一或复合条件由两个或多个简单条件布尔算符和括弧组成布尔算符有OR AND 和NOT 不包含关系表达式的条件称为布尔表达式在上述种种条件测试技术的基础上 K C Tai提出了一种被称为BRO BranchandRelationalOperalor 测试的条件测试策略如果在条件中所有布尔变量和关系算符都只出现一次而且没有公共变量则BRO测试保证能发现该条件中的分支错和关系算符错 BRO测试利用条件C的条件约束来设计测试用例包含n个简单条件的条件C的条件约束定义为 D1 D2 Dn 其中D i 0 i n 表示条件C中第i个简单条件的输出约束如果在条件C的一次执行过程中 C中每个简单条件的输出都满足D中对应的约束则称C的这次执行覆盖了C的条件约束D 对于布尔变量B来说 B的输出约束指出 B必须是真 t 或假 f 类似地对于关系表达式来说用符号和指定表达式的输出约束作为一个例子考虑下列条件 C1 B1 B2 其中 B1和B2是布尔变量 C1的条件约束形式为 D1 D2 其中D1和D2中的每一个都是 t 或 f 值 t f 是C1的一个条件约束并由使B1值为真B2值为假的测试所覆盖 BRO测试策略要求约束集 t t f t t f 被C1的执行所覆盖如果C1因布尔算符错误而不正确则至少上述约束集中的一个约束将迫使C1失败 5 4 3数据流测试数据流测试方法根据程序中变量定义和使用的位置选择程序的测试路径为了说明数据流测试方法假设已赋予程序每条语句一个唯一的语句号而且每个函数都不修改它的参数或全局变量对于语句号为S的语句 DEF S X 语句S包含变量X的定义 USE S X 语句S使用变量X 如果S是if或循环语句则它的DEF集为空而它的USE集取决于S的条件如果存在从语句S到语句S 的路径而且在该路径中不包含X的任何其他定义则称变量X在语句S中的定义在语句S 仍然有效变量X的定义使用链或称为DU链的形式为 X S S 其中S和S 是语句号 X在集合DEF S 和USE S 中而且在语句S中对X的定义在语句S 仍然有效一种简单的数据流测试策略要求每个DU链至少被覆盖一次这种策略称为DU测试策略 5 4 4循环测试循环测试是一种白盒测试技术它专注于测试循环结构的有效性在结构化的程序中通常只有三种循环分别是简单循环串接循环和嵌套循环如图5 6所示下面分别讨论不同类型循环的测试方法 1 简单循环应该使用下列测试集来测试简单循环其中n是允许通过循环的最大次数跳过循环只通过循环一次通过循环两次通过循环m次其中m n 1 通过循环n 1 n n 1次 2 嵌套循环如果把简单循环的测试方法直接应用到嵌套循环可能的测试数就会随嵌套层数的增加按几何级数增长这会导致不切实际的测试数目 B Beizer提出了一种能减少测试数的方法从最内层循环开始测试把所有其他循环都设置为最小值对最内层循环使用简单循环测试方法而使外层循环的迭代参数例如循环计数器取最小值并为越界值或非法值增加一些额外的测试由内向外对下一个循环进行测试但保持所有其他外层循环为最小值其他嵌套循环为典型值继续进行下去直到测试完所有循环 3 串接循环如果串接循环的各个循环都彼此独立则可以使用前述的测试简单循环的方法来测试串接循环但是如果两个循环串接而且第一个循环的循环计数器值是第二个循环的初始值则这两个循环并不是独立的当循环不独立时建议使用测试嵌套循环的方法来测试串接循环图5 6三种循环 5 5黑盒测试技术黑盒测试着重测试软件的功能需求也就是说黑盒测试让软件工程师设计出能充分检查程序所有功能需求的输入条件集黑盒测试并不能取代白盒测试技术它是与白盒测试互补的方法它很可能发现白盒测试不易发现的其他不同类型的错误黑盒测试力图发现下述类型的错误功能不正确或遗漏了功能界面错误数据结构错误或外部数据库访问错误性能错误初始化和终止错误白盒测试在测试过程的早期阶段进行而黑盒测试主要用于测试过程的后期黑盒测试故意不考虑程序的控制结构而把注意力集中于信息域 5 5 1等价划分等价划分是一种黑盒测试方法这种方法把程序的输入域划分成数据类据此可以导出测试用例一个理想的测试用例能独自发现一类错误例如对所有字符数据的处理都不正确如果把所有可能的输入数据有效的和无效的划分成若干个等价类则可以合理地做出下述假定每类中的一个典型值在测试中的作用与这一类中所有其他值的作用相同因此可以从每个等价类中只取一组数据作为测试数据这样选取的测试数据最有代表性最可能发现程序中的错误使用等价划分法设计测试方案首先需要划分输入数据的等价类为此需要研究程序的功能说明从而确定输入数据的有效等价类和无效等价类在确定输入数据的等价类时常常还需要分析输出数据的等价类以便根据输出数据的等价类导出对应的输入数据等价类划分等价类需要经验下述几条启发式规则可能有助于等价类的划分如果规定了输入值的范围则可划分出一个有效的等价类输入值在此范围内两个无效的等价类输入值小于最小值或大于最大值如果规定了输入数据的个数则类似地也可以划分出一个有效的等价类和两个无效的等价类如果规定了输入数据的一组值而且程序对不同输入值做不同处理则每个允许的输入值是一个有效的等价类此外还有一个无效的等价类任一个不允许的输入值如果规定了输入数据必须遵循的规则则可以划分出一个有效的等价类符合规则和若干个无效的等价类从各种不同角度违反规则如果规定了输入数据为整型则可以划分出正整数零和负整数等三个有效类如果程序的处理对象是表格则应该使用空表以及含一项或多项的表划分出等价类以后等价类设计测试方案时主要使用下面两个步骤设计一个新的测试方案以尽可能多地覆盖尚未被覆盖的有效等价类复重这一步骤直到所有有效等价类都被覆盖为止设计一个新的测试方案使它覆盖一个而且只覆盖一个尚未被覆盖的无效等价类重复这一步骤直到所有无效等价类都被覆盖为止下面用等价划分法设计一个简单程序的测试方案假设有一个把数字串转变成整数的函数运行程序的计算机字长16位用二进制补码表示整数这个函数是用PASCAL语言编写的它的说明如下 functionstrtoint dstr shortstr integer 函数的参数类型是shortstr 它的说明是 typeshortstr array 1 6 ofchar 被处理的数字串是右对齐的也就是说如果数字串比六个字符短则在它的左边补空格如果数字串是负的则负号和最高位数字紧相邻负号在最高位数字左边一位考虑到PASCAL编译程序固有的检错功能测试时不需要使用长度不等于6的数组做实在参数更不需要使用任何非字符数组类型的实在参数分析这个程序的规格说明可以划分出如下等价类 1 有效输入的等价类有 1 6个数字字符组成的数字串最高位数字不是零最高位数字是零的数字串最高位数字左邻是负号的数字串 2 无效输入的等价类有空字符串全是空格左部填充的字符既不是零也不是空格最高位数字右面由数字和空格混合组成最高位数字右面由数字和其他字符混合组成负号与最高位数字之间有空格 3 合法输出的等价类有在计算机能表示的最小负整数和零之间的负整数零在零和计算机能表示的最大正整数之间的正整数 4 非法输出的等价类有比计算机能表示的最小负整数还小的负整数比计算机能表示的最大正整数还大的正整数因为所用的计算机字长16位用二进制补码表示整数所以能表示的最小负整数是 32768 能表示的最大正整数是32767 根据上面划分出的等价类可以设计出下述测试方案注意每个测试方案由三部分内容组成 1 6个数字组成的数字串输出是合法的正整数输入 1 预期的输出 1 最高位数字是零的数字串输出是合法的正整数输入 000001 预期的输出 1 负号与最高位数字紧相邻输出合法的负整数输入 00001 预期的输出 1 最高位数字是零输出也是零输入 000000 预期的输出 0 太小的负整数输入 47561 预期的输出错误无效输入太大的正整数输入 132767 预期的输出错误无效输入空字符串输入预期的输出错误没有数字字符串左部字符既不是零也不是空格输入 1 预期的输出错误填充错最高位数字后面有空格输入 12 预期的输出错误无效输入最高位数字后面有其他字符输入 1 2 预期的输出错误无效输入负号和最高位数字之间有空格输入 12 预期的输出错误负号位置错 5 5 2边界值分析经验表明处理边界情况时程序最容易发生错误例如许多程序错误出现在下标纯量数据结构和循环等的边界附近因此设计使程序运行在边界情况附近的测试方案暴露出程序错误的可能性更大一些使用边界值分析方法设计测试方案首先应该确定边界情况这需要经验和创造性通常输入等价类和输出等价类的边界就是应该着重测试的程序边界情况选取的测试数据应该刚好等于刚刚小于和刚刚大于边界值也就是说按照边界值分析法应该选取刚好等于稍小于和稍大于等价类边界值的数据作为测试数据而不是选取每个等价类内的典型值或任意值作为测试数据 5 5 3错误推测错误推测法在很大程度上靠直觉和经验进行它的基本想法是列举出程序中可能有的错误和容易发生错误的特殊情况并且根据它们选择测试方案 5 6测试策略 5 6 1测试步骤从过程的观点考虑测试在软件工程环境中的测试过程实际上是顺序进行的四个步骤的序列最开始着重测试每个单独的模块以确保它作为一个单元来说功能是正确的因些这种测试称为单元测试单元测试大量使用白盒测试技术检查模块控制结构中的特定路径以确保做到完全覆盖并发现最大数量的错误接下来必须把模块装配即集成在一起形成完整的软件包在装配的同时进行测试因此称为集成测试集成测试同时解决程序验证和程序构造这两个问题在集成过程中最常用的是黑盒测试用例设计技术当然为了保证覆盖主要的控制路径也可能使用一定数量的白盒测试在软件集成完成之后还需要进行一系列高级测试必须测试在需求分析阶段确定下来的确认标准确认测试是对软件满足所有功能的行为的和性能的需求的最终保证在确认测试过程中仅使用黑盒测试技术 5 6 2单元测试通常单元测试和编码属于软件工程过程的同一个阶段在编写出源程序代码并通过了编译程序的语法检查之后可以应用人工测试和计算机测试这样两种类型的测试完成单元测试工作这两种类型的测试各有所长互相补充下面分别讨论人工测试和计算机测试的问题 1 代码审查人工测试源程序可以由编写者本人非正式地进行也可以由审查小组正式进行后者称为代码审查它是一种非常有效的程序验证技术对于典型的程序来说可以查出30 70 的逻辑设计错误和编码错误审查小组最好由下述四人组成组长他应该是一个很有能力的程序员而且没有直接参与这项工程程序的设计者程序的编写者程序的测试者实践表明对于查找某些类型的错误来说人工测试比计算机测试更有效对于其他类型的错误来说则刚好相反因此人工测试和计算机测试是互相补充相辅相成的缺少其中任何一种方法都会使查找错误的效率降低 2 测试软件模块并不是一个独立的程序因此必须为每个单元测试开发驱动软件和或存根软件通常驱动程序也就是一个主程序它接收测试数据把这些数据传送给被测试的模块并且印出有关的结果存根程序代替被测试的模块所调用的模块因此存根程序也可以称为虚拟子程序它使用被它代替的模块的接口可能做最少量的数据操作印出对入口的检验或操作结果并且把控制归还给调用它的模块图5 7正文加工系统的层次图 I TESTSTUB 测试正文编辑模块用的存根程序初始化输出信息进入了正文编辑程序输出输入的控制信息是 CFUNCT 输出缓冲区中的字符串 IFCFUNCT CHANGE THEN 把缓冲区中第二个字改为 ELSE 在缓冲区的尾部加 ENDIF 输出缓冲区中的新字符串 ENDTESTSTUB TESTDRIVER 测试正文编辑模块用的驱动程序说明长度为2500个字符的一个缓冲区把CFUNCT置为希望测试的状态输入字符串调用正文编辑模块停止或再次初启 ENDTESTDRIVER 5 6 3集成测试集成测试是测试和组装软件的系统化技术在把模块按照设计要求组装起来的同时进行测试主要目标是发现与接口有关的问题由模块组装成程序时有两种方法一种方法是先分别测试每个模块再把所有模块按设计要求放在一起结合成所要的程序这种方法称为非渐增式测试方法另一种方法是把下一个要测试的模块同已经测试好的那些模块结合起来进行测试测试完以后再把下一个应该测试的模块结合进来测试这种每次增加一个模块的方法称为渐增式测试 1 自顶向下集成自顶向下的集成结合方法是一个日益为人们广泛采用的组装软件的途径从主控制模块主程序开始沿着软件的控制层次向下移动从而逐渐把各个模块结合起来在把附属于以及最终附属于主控制模块的那些模块组装到软件结构中去时或者使用深度优先的策略或者使用宽度优先的策略把模块结合进软件结构的具体过程由下述四个步骤完成对主控制模块进行测试测试时用存根程序代替所有直接附属于主控制模块的模块根据选定的结合策略深度优先或宽度优先每次用一个实际模块代换一个存根程序新结合进来的模块往往又需要新的存根程序在结合进一个模块的同时进行测试为了保证加入模块没有引进新的错误可能需要进行回归测试即全部或部分地重复以前做过的测试从第二步开始不断地重复进行上述过程直到构造起完整的软件结构为止图5 8自顶向下结合 2 自底向上集成自底向上测试从原子模块即在软件结构最低层的模块开始组装和测试因为是从底部向上结合模块总能得到需要的下层模块处理功能所以不需要存根程序用下述步骤可以实现自底向上的结合策略把低层模块组合成实现某个特定的软件子功能的簇写一个驱动程序用于测试的控制程序协调测试数据的输入和输出对由模块组成的子功能簇进行测试去掉驱动程序沿软件结构自下向上移动把子功能簇组合起来形成更大的子功能簇上述第2步到第4步实质上构成了一个循环图5 9自底向上结合 3 回归测试每当一个新模块作为集成测试的一部分加进来的时候软件就发生了变化建立了新的数据流路径可能出现了新的I O操作激活了新的控制逻辑这些变化可能使原来工作正常的功能出现问题在集成测试的范畴中所谓回归测试是指重新执行已经做过的测试的某个子集以保证上述这些变化没有带来非预期的副作用回归测试集已执行过的测试用例的子集包括下述三种不同的测试用例检测软件全部功能的代表性测试用例专门针对可能受修改影响的软件功能的附加测试针对被修改过的软件成分的测试 4 不同集成测试策略的比较自顶向下测试方法的主要优点是不需要测试驱动程序能够在测试阶段的早期实现并验证系统的主要功能而且能在早期发现上层模块的接口错误自顶向下测试方法的主要缺点是需要存根程序可能遇到与此相联系的测试困难低层关键模块中的错误发现较晚而且用这种方法在早期不能充分展开人力可以看出自底向上测试方法的优缺点与上述自顶向下测试方法的优缺点刚好相反在测试实际的软件系统时应该根据软件的特点以及工程进度安排选用适当的测试策略一般说来纯粹自顶向下或纯粹自底向上的策略可能都不实用人们在实践中创造出许多混合策略 5 6 4确认测试确认测试也称为验收测试它的目标是验证软件的有效性上面我们使用了确认 Validation 和验证 Verification 这样两个不同的术语为了避免混淆首先扼要地解释一下这两个术语的含义通常验证指的是保证软件正确地实现了某一特定要求的一系列活动而确认指的是保证软件的实现满足了用户需求的一系列活动 1 确认测试的范围确认测试必须有用户积极参与或者以用户为主进行 2 软件配置复查确认测试的一个重要内容是复查软件配置 3 Alpha和Beta测试如果一个软件是为许多客户开发的例如向大众出售的盒装软件产品那么让每个客户都进行正式的验收测试是不现实的在这种情况下绝大多数软件开发商都使用被称为Alpha测试和Beta测试的过程来发现那些看起来只有最终用户才能发现的错误 Alpha测试由用户在开发者的场所进行并且在开发者对用户的指导下进行测试开发者负责记录错误和使用中遇到的问题总之 Alpha测试是在受控的环境中进行的 Beta测试由软件的最终用户们在一个或多个客户场所进行与Alpha测试不同开发者通常不在Beta测试的现场因此 Beta测试是软件在开发者不能控制的环境中的真实应用用户记录下在Beta测试过程中遇到的一切问题真实的或想像的并且定期把这些问题报告给开发者接收到Beta测试期间报告的问题之后软件开发者对产品进行修改并准备向全体客户发布最终的软件产品 5 7调试调试也称为纠错作为成功的测试的后果而出现也就是说调试是在测试发现错误之后排除错误的过程 5 7 1调试过程调试不是测试但是它总是发生在测试之后如图5 10所示调试过程从执行一个测试用例开始评估测试结果如果发现实际结果与预期结果不一致则这种不一致就是一个症状它表明在软件中存在着隐藏的问题调试过程试图找出产生症状的原因以便改正错误图5 10调试过程 5 7 2调试途径无论采用什么方法调试的根本目标都是寻找软件错误的原因并改正之这个目标是通过把系统地评估直觉和运气组合起来实现的一般来说有下列三种调试途径可以采用蛮干法回溯法原因排除法 5 8软件可靠性 5 8 1基本概念 1 软件可靠性的定义对于软件可靠性有许多不同的定义其中多数人承认的一个定义是软件可靠性是程序在给定的时间间隔内按照规格说明书的规定成功地运行的概率 2 软件的可用性通常用户也很关注软件系统可以使用的程度一般来说对于任何其故障是可以修复的系统都应该同时使用可靠性和可用性衡量它的优劣程度软件可用性的一个定义是软件可用性是程序在给定的时间点按照规格说明书的规定成功地运行的概率如果在一段时间内软件系统故障停机时间分别为td1 td2 正常运行时间分别为tu1 tu2 则系统的稳态可用性为其中Tup tui Tdown tdi 如果引入系统平均无故障时间MTTF和平均维修时间MTTR的概念则 5 1 式可以变成平均维修时间MTTR是修复一个故障平均需要用的时间它取决于维护人员的技术水平和对系统的熟悉程度也和系统的可维护性有重要关系平均无故障时间MTTF是系统按规格说明书规定成功地运行的平均时间它主要取决于系统中潜伏的错误的数目因此和测试的关系十分密切 5 8 2估算平均无故障时间的方法软件的平均无故障时间MTTF是一个重要的质量指标往往作为对软件的一项要求由用户提出来为了估算MTTF 首先引入一些有关的量 1 符号在估算MTTF的过程中使用下述符号表示有关的数量 ET 测试之前程序中错误总数 IT 程序长度机器指令总数测试包括调试时间 Ed 在0至期间发现的错误数 Ec 在0至期间改正的错误数 2 基本假定根据经验数据可以作出下述假定在类似的程序中单位长度里的错误数ET IT近似为常数美国的一些统计数字表明通常 0 5 10 2 ET IT 2 10 2 也就是说在测试之前每1000条指令中大约有5 20个错误失效率正比于软件中剩余的潜藏的错误数而平均无故障时间MTTF与剩余的错误数成反比此外为了简化讨论假设发现的每一个错误都立即正确地改正了即调试过程没有引入新的错误因此 Ec Ed 剩余的错误数为 Er ET Ec 单位长度程序中剩余的错误数为 r ET Ir Ec IT 3 估算平均无故障时间经验表明平均无故障时间与单位长度程序中剩余的错误数成反比即其中K为常数它的值应该根据经验选取美国的一些统计数字表明 K的典型值是200 估算平均无故障时间的公式可以评价软件测试的进展情况此外由 5 5 式可得因此也可以根据对软件平均无故障时间的要求估计需要改正多少个错误之后测试工作才能结束 4 估计错误总数的方法 1 植入错误法使用这种估计方法在测试之前由专人在程序中随机地植入一些错误测试之后根据测试小组发现的错误中原有的和植入的两种错误的比例来估计程序中原有错误的总数ET 假设人为地植入的错误数为Ns 经过一段时间的测试之后发现ns个植入的错误此外还发现了n个原有的错误如果可以认为测试方案发现植入错误和发现原有错误的能力相同则能够估计出程序中原有错误的总数为其中即是错误总数E T的估计值 2 分别测试法为了随机地给一部分错误加标记分别测试法使用两个测试员或测试小组彼此独立地测试同一个程序的两个副本把其中一个测试员发现的错误作为有标记的错误具体做法是在测试过程的早期阶段由测试员甲和测试员乙分别测试同一个程序的两个副本由另一名分析员分析他们的测试结果用表示测试时间假设 0时错误总数为B0 1时测试员甲发现的错误数为B1 1时测试员乙发现的错误数为B2 1时两个测试员发现的相同错误数为bc 如果认为测试员甲发现的错误是有标记的即程序中有标记的错误总数为B1 则测试员乙发现的B2个错误中有bc个是有标记的假定测试员乙发现有标记错误和发现无标记错误的概率相同则可以估计出测试前程序中的错误总数为使用分别测试法在测试阶段的早期每隔一段时间分析员分析两名测试员的测试结果并且用 5 8 式计算B0 如果几次估算的结果相差不多则可用B0的平均值作为ET的估计值此后一名测试员可以改做其他工作由余下的一名测试员继续完成测试工作因为他可以继承另一名测试员的测试结果所以分别测试法增加的测试成本并不太多 5 9小结实现包括编码和测试两个阶段按照传统的软件工程方法学编码是在对软件进行了概要设计和详细设计之后进行的编码不过是把软件设计的结果翻译成用某种程序设计语言书写的程序因此程序的质量基本上由设计的质量决定但是编码使用的语言特别是写程序的风格也对程序质量有相当大的影响大量实践结果表明高级程序设计语言较汇编语言有很多优点因此除非在非常必要的场合一般不要使用汇编语言写程序至于具体选用哪种高级程序设计语言则不仅要考虑语言本身的特点还应该考虑使用环境等一系列实际因素程序内部的良好文档资料有规律的数据说明格式简单清晰的语句构造和输入输出格式等都对提高程序的可读性有很大作用也在相当大的程度上改进了程序的可维护性目前软件测试仍然是保证软件可靠性的主要手段测试阶段的根本任务是发现并改正软件中的错误设计测试方案是测试阶段的关键技术问题其基本目标是选用尽可能少的高效测试数据做到尽可能完善的测试从而尽可能多地发现软件中的错误白盒测试和黑盒测试是软件测试的两类不同方法这两类方法各有所长相互补充在测试过程中应该联合使用这两类方法通常在测试过程的早期阶段主要使用白盒测试技术而在测试的后期主要使用黑盒测试技术为了设计出有效的测试方案软件工程师必须深入理解并应用指导软件测试的基本准则设计白盒测试方案的技术主要有逻辑覆盖和控制结构测试设计黑盒测试方案的技术主要有等价划分边界值分析和错误推测大型软件的测试应该分阶段进行通常分为单元测试集成测试确认测试和系统测试如果软件是新开发的计算机系统的一部分第四个阶段在测试过程中发现的软件错误必须及时改正这就是调试的任务为了改正错误首先必须确定错误的准确位置这是调试过程中最困难的任务需要审慎周密的思考和推理改正错误往往需要修正原来的设计必须通盘考虑而不能头疼医头脚疼医脚应该尽量避免在调试过程中引进新的错误测试和调试是软件测试阶段中的两个关系极端密切的过程它们常常交替进行程序中潜藏的错误的数目直接决定了软件的可靠性通过测试可以估计出程序中剩余的错误数根据测试和调试过程中已经发现和改正的错误数可以估计软件的平均无故障时间反之根据要求达到的软件平均无故障时间可以估计应该发现和改正的错误数从而能够判断测试阶段何时可以结束

展开阅读全文

软件工程(第3版)第5章人民邮电出版社.ppt

最新文档