软件缺陷集成预测模型研究

合集下载

偏相关方法在软件缺陷预测中的应用

ห้องสมุดไป่ตู้
因素的结论。该结论有助于建立更加稳定可靠的软件缺陷预测模型。
关键词：软件缺陷预测；代码静态属性；实证；复杂度；器学习；相关机偏中图分类号：Ｔ３１５Ｐ０．文献标志码：Ａ文章编号：１０ — ６５２１）２０９ — ３０１３９（０２０ — ５４０
Ａｂｓｒｃｔａｔ：Ｉｒｅｏｉｐｏｅｔｅｐｒｏｍａｎｅｏｅｉｔｒｎｏｄｒｔｍｒｖｈｅｒｆｃｆｐｒｄｃｏｓ，ａｅｕｃｈｄｓｅｔｏｎｄｒｄｅｔｅｉｓｎｉｎ，ｔｓｐａｅｒｐｅａｎｅｐｅｃｈｉｐｒｐｏｓｄｗｒｄｉｔｍｏｅａｅｎｐａｔａｏｒｌｔｏｎａｙｉ．Ｆｉｓｌｄｌｂｓｄｏｒｉｌｃｒｅａｉｎａｌｓｓｒｔｙ．ｄｉｅｅｔｔｒｏｒｓ．ａａｙｅｈｏｅａｉｎｂｅｗｅｔｒｂｕｅｎｆｒｎｏｐｉｒｗｏｋｆｎｌｚｄｔｅｃｒｌｔｏｔｅｎａｔｉｔｓａｄ
ｄｆｃｓｈｎｃｍｐｔｄｃｄｏｌｘｔｅｓｔａｕｓｅｅｔ．Ｔｅｏｕｅｏｅｃｍｐｅｉｄｎｉｖｌｅ．Ｂａｅｎｔｅｅｖｌｅ．ｂｉｅｒｄｃｏ．Ｅｐｒｍｅｔｅｅｐｒｙｙｓｄｏｈｓａｕｓｕｌａｎｗｐｅｉｔｒｘｅｉｎｓｗｒｅ — ｔｆｒｅｎｔｅｐｂｉｃｉｓａａｅ．ＩｉｐｅｉｔｒｈｄａｇｏｅｏｍａｃｉｈｒｃｌｒｔｓａｄｓｂｔｎｉｌｉｈＦｏｍｄｏｈｕｌＥｌｅｄｔｓｔ１ｓｒｄｃｏａｏｄｐｒｒｎｅｗｔｈｇｅａｌａｅｎｕｓｔｌｈｇ — ｃｐｈｆｈＪａａｙ

软件工程的毕业论文题目

软件工程的毕业论文题目软件工程的毕业论文题目软件工程是一门涵盖软件开发、测试、维护和管理等方面的学科，对于计算机科学专业的学生而言，毕业论文是他们学习和研究的重要成果之一。

选择一个合适的毕业论文题目不仅要考虑到自身的兴趣和专业知识，还需要关注当前的技术趋势和实际需求。

本文将探讨一些适合软件工程毕业论文的题目，希望能给即将毕业的学生一些启发和参考。

1. 软件开发过程中的敏捷方法比瀑布模型更有效吗？敏捷开发方法和传统的瀑布模型是软件开发领域常见的两种方法。

本论文可以通过对比两种方法在实际项目中的应用效果，分析敏捷方法的优势和局限性，探讨其在不同项目中的适用性。

2. 基于机器学习的软件缺陷预测模型研究随着软件规模的不断扩大，软件缺陷的预测和修复变得尤为重要。

本论文可以通过收集和分析大量的软件缺陷数据，利用机器学习算法构建预测模型，并评估其准确性和实用性。

3. 软件工程中的自动化测试技术研究与应用自动化测试可以提高软件开发过程中的效率和质量。

本论文可以研究不同的自动化测试技术，如单元测试、集成测试和系统测试等，探讨其在不同项目中的应用效果，并提出改进和优化的方法。

4. 基于云计算的软件开发与部署研究云计算技术的兴起为软件开发和部署带来了新的机遇和挑战。

本论文可以研究云计算环境下的软件开发和部署流程，探讨其优势和不足，并提出相应的解决方案。

5. 软件工程中的用户体验设计研究用户体验设计在软件开发过程中起着至关重要的作用。

本论文可以研究用户体验设计的原理和方法，通过实际案例分析不同设计策略的效果，提出改进和优化的方案。

6. 软件工程中的安全性和隐私保护研究随着互联网的发展，软件安全性和隐私保护变得越来越重要。

本论文可以研究软件工程中的安全性和隐私保护问题，分析现有的安全技术和隐私保护方法，并提出新的解决方案。

7. 基于区块链的软件开发和应用研究区块链技术作为一种分布式、安全和可信的技术，正在逐渐应用于软件开发领域。

软件缺陷分析的几种方法

软件缺陷分析的⼏种⽅法 1、ODC缺陷分析：由IBM 的waston中⼼推出。

将⼀个缺陷在⽣命周期的各环节的属性组织起来，从单维度、多维度来对缺陷进⾏分析，从不同⾓度得到各类缺陷的缺陷密度和缺陷⽐率，从⽽积累得到各类缺陷的基线值，⽤于评估测试活动、指导测试改进和整个研发流程的改进；同时根据各阶段缺陷分布得到缺陷去除过程特征模型，⽤于对测试活动进⾏评估和预测。

上⾯回答中涉及到的缺陷分布、缺陷趋势等都属于这个⽅法中的⼀个⾓度⽽已。

2、Gompertz分析：根据测试的累积投⼊时间和累积缺陷增长情况，拟合得到符合⾃⼰过程能⼒的缺陷增长Gompertz曲线，⽤来评估软件测试的充分性、预测软件极限缺陷数和退出测试所需时间、作为测试退出的判断依据、指导测试计划和策略的调整； 3、Rayleigh分析：通过⽣命周期各阶段缺陷发现情况得到缺陷Rayleigh曲线，⽤于评估软件质量、预测软件现场质量； 4、四象限分析：根据软件内部各模块、⼦系统、特性测试所累积时间和缺陷去除情况，和累积时间和缺陷去除情况的基线进⾏⽐较，得到各个模块、⼦系统、特性测试分别所位于的区间，从⽽判断哪些部分测试可以退出、哪些测试还需加强，⽤于指导测试计划和策略的调整； 5、根本原因分析：利⽤鱼⾻图、柏拉图等分析缺陷产⽣的根本原因，根据这些根本原因采取措施，改进开发和测试过程； 6、缺陷注⼊分析：对被测软件注⼊⼀些缺陷，通过已有⽤例进⾏测试，根据这些刻意注⼊缺陷的发现情况，判断测试的有效性、充分性，预测软件残留缺陷数。

在06年软件评测师考试中有⼀题就是考这个思路，参见这个帖⼦我的回复： 7、DRE/DRM分析：通过已有项⽬历史数据，得到软件⽣命周期各阶段缺陷注⼊和排除的模型，⽤于设定各阶段质量⽬标，评估测试活动。

⾄于缺陷预防，基本上是两个⽅⾯： 1、测试活动尽量提前，通过及时消除开发前期阶段引⼊的缺陷，防⽌这些缺陷遗留并放⼤到后续环节； 2、通过对已有缺陷进⾏分析（例如上⾯的ODC分析等），找出产⽣这些缺陷的技术上不⾜和流程上不⾜，通过对这些不⾜进⾏改进，防⽌类似缺陷再次发⽣。

基于软件测试的缺陷分析及度量方法

基于软件测试的缺陷分析及度量方法摘要：随着用户需求的不断增加，许多软件产品被开发出来。

为了满足用户的需求，在源代码中添加了许多新的接口和类。

然而，软件维护和代码重构的任务非常复杂。

因此，在源代码中找到缺陷并纠正这些缺陷是很重要的。

挑战在于开发工具和技术来自动提取错误信息。

最近，计算机科学家致力于使用静态分析技术从源代码中发现缺陷。

静态分析，也称为静态代码分析，是一种通过检查代码而不执行程序来完成计算机程序调试的方法。

通常，静态分析用于检查源代码文件是否存在问题和不一致。

关键词：软件缺陷数据；软件测试；缺陷分类；分析方法引言目前，软件测试是一种检验软件产品或阶段性工作成果的手段，通过它可以验证软件是否符合事先的需求定义、设计要求以及代码规范等。

不管测试的定义如何，它都只能证明软件存在缺陷，不能证明软件不存在缺陷。

测试与质量密不可分，我国的软件质量标准体系以GB/T25000系列为主，根据现代系统论的思想，结合国际标准相关经验和国内实践情况，将标准体系分为测试过程管理、测试技术、测试工具以及测试文档4个方面。

软件测试人员需要结合软件的具体特点选择测试方法和类型，选择的结果应该在软件测试计划中予以明确，并通过测评项目组评审认可。

1软件测试技术概述软件测试是指通过人工或自动的方式对软件系统进行运行或检测，根据所得的数据来判断并验证其是否满足相关的标准，同时对其偏差进行评价，并进行改进的过程。

软件测试的概念包含了以下几点核心内涵：第一，软件测试的方式包含人工测试和自动化测试；第二，软件测试的主要内容就是通过测试数据来验证产品是否满足设计指标或用户需求；第三，软件测试的最终目标是要发现软件缺陷，并对其进行完善，提高软件质量。

可见，软件测试是防止软件缺陷流入使用环节的重要手段，在软件工程中发挥着极为关键的作用。

2软件测试的缺陷分析及度量方法2.1缺陷检测方法缺陷检测的改良可以通过更精准的对缺陷进行分类，并且依据用户反馈进行调整改良。

基于聚类分析与Box-Cox转换的跨项目缺陷预测方法

基于聚类分析与Box-Cox转换的跨项目缺陷预测方法跨项目缺陷预测是软件工程领域的一个重要研究课题，对于提高软件质量、减少软件维护成本具有重要的意义。

随着软件开发过程的不断演化，跨项目缺陷预测方法也在不断发展。

本文将介绍一种基于聚类分析与Box-Cox转换的跨项目缺陷预测方法，通过将两种技术相结合，提高缺陷预测的准确性与实用性。

1. 跨项目缺陷预测的背景和意义跨项目缺陷预测是指利用已有的软件项目数据对新项目的缺陷进行预测。

在软件开发过程中，缺陷预测可以帮助开发人员在早期识别潜在的缺陷，从而及时采取措施进行修复，降低软件开发与维护成本，提高软件质量。

而跨项目缺陷预测则是将已有的项目数据应用到新项目中，可以帮助新项目的开发人员充分利用已有的数据，提高预测的准确性，降低预测成本。

2. 跨项目缺陷预测方法的研究现状目前，跨项目缺陷预测方法主要包括基于相似度度量的方法、基于特征选择的方法、基于实例选择的方法等。

基于聚类分析的方法是一种常用的跨项目缺陷预测技术，通过对项目进行聚类，找到与新项目相似的项目，从而进行缺陷预测。

而Box-Cox转换是一种用于数据转换的技术，可以将非正态分布的数据转换为正态分布，提高数据的稳定性与可靠性。

3. 基于聚类分析与Box-Cox转换的跨项目缺陷预测方法本文提出的基于聚类分析与Box-Cox转换的跨项目缺陷预测方法主要包括以下几个步骤：3.1 数据预处理需要对已有的软件项目数据进行预处理，包括数据清洗、数据集成与数据变换等操作。

在数据变换的过程中，可以利用Box-Cox转换将非正态分布的数据转换为正态分布，提高数据的稳定性与可靠性。

3.2 聚类分析接下来，利用聚类分析的方法对项目进行分组，找出与新项目相似的项目。

聚类分析是一种无监督学习方法，通过对项目进行聚类，可以发现不同项目之间的相似性，并将相似的项目进行分组。

在本方法中，可以利用欧氏距离、曼哈顿距离等相似度度量方法对项目进行聚类。

软件工程中的缺陷挖掘与预测

软件工程中的缺陷挖掘与预测软件工程是一门复杂的学科，其中有很多的知识点需要掌握，例如软件的设计、开发、测试、部署、维护等等。

其中在软件测试的过程中，有一个非常重要的环节，那就是缺陷挖掘与预测。

这个过程可以帮助开发人员在软件开发的过程中，尽早的发现、跟踪和修复潜在的缺陷。

下面我们就来具体的探讨一下什么是缺陷挖掘与预测、它的作用以及如何实现。

一、缺陷挖掘与预测的概念缺陷挖掘与预测是指在软件测试的过程中，使用各种技术手段来发现软件中的潜在缺陷，并对这些缺陷进行分类、跟踪和预测。

这个过程主要是利用统计学、数据挖掘、人工智能等技术手段，来分析软件测试过程中所收集到的数据，以发现软件缺陷出现的模式和趋势。

通过分析这些模式和趋势，可以帮助开发人员更加准确地定位缺陷的来源，以及优化软件的设计和测试过程，从而减少缺陷的出现。

二、缺陷挖掘与预测的作用1. 提高软件质量：缺陷挖掘与预测可帮助开发人员更早的发现潜在的缺陷，从而解决问题并提高软件质量。

2. 优化测试策略：通过缺陷挖掘与预测，可以更好地理解软件测试过程并优化相应的测试策略。

3. 缩短开发周期：缺陷挖掘与预测可帮助开发人员更早地发现并解决问题，从而减少了返工时间和成本，以及缩短了开发周期。

4. 提高客户满意度：通过提高软件质量和减少缺陷次数，可提高客户满意度和用户忠诚度。

三、缺陷挖掘与预测的实现过程在实施缺陷挖掘与预测的过程中，需要根据实际需求选择合适的技术手段来进行数据分析和处理。

下面是一个基本的实现过程：1. 数据采集：需要收集测试数据、缺陷报告、代码贡献、版本控制、代码审查结果等数据，并对这些数据进行清洗和整理。

2. 数据探索：使用可视化手段来探索测试数据中的模式和趋势，以发现潜在的缺陷。

3. 特征提取：根据数据探索的结果，提取一些重要的特征信息，例如缺陷出现的时间、类型、位置、影响范围等，以便后续的分析处理。

4. 数据分析：利用数据挖掘、机器学习等技术手段，对缺陷数据进行分析，寻找缺陷的关联和规律。

软件缺陷预测中常用的算法评价指标

软件缺陷预测结果评价软件缺陷的预测结果需要合理的指标来进行评价和评估，软件缺陷预测实际上解决软件模块是否包含缺陷的分类问题和包含多少缺陷数的排序问题，通常采用机器学习模型的评估指标对预测模型进行评估。

1. 缺陷分类模型评估指标在软件缺陷分类预测中，通常将有缺陷模块设为正例，无缺陷为反例，那么预测将会出现的四种不同的结果，这些结果的混淆矩阵如表1所示：表 1 混淆矩阵Table 1 Confusion Matrix实际标签预测标签有缺陷无缺陷有缺陷TP （True Positive ） FN （False Negative ）无缺陷 FP （False Positive ） TN （True Negative ）TP 代表真正例，表示有缺陷模块被预测为有缺陷的模块数量；FN 代表假反例，表示有缺陷模块被预测为无缺陷的模块数量；FP 代表假正例，表示无缺陷模块被预测为有缺陷的模块数量；TN 代表真反例，表示无缺陷模块被预测为无缺陷的模块数量。

基于上述的混淆矩阵，本文选用的软件缺陷分类预测的性能指标包括查准率（Precision ）、查全率（Pd ）、F 度量值（F-measure ）、ROC 曲线下的面积（The area under the ROC curve , AUC ）：Precision 指的是预测为有缺陷的模块占所有被预测为有缺陷模块的比例，查准率越高表示模型预测有缺陷模块的准确度越好，公式如下；TP Precision TP FP=+ （1） Recall ,也叫真正例率（True Positive Rate, TPR ），通常使用简写为Pd 表示，指的是被正确预测为有缺陷模块占实际有缺陷模块的比例，查全率越高，表示预测出有缺陷的模块越多，公式如下：TP Recall TPR Pd TP FN===+ （2） F-measure 指的是查全率和查准率的调和平均数，此值越高代表模型能够把有缺陷模块预测正确，公式如下：2Recall Precision F measure Recall Precision⨯⨯-=+ （3）上述的三个指标中，Pd 与Precision 是一对相互对立的评价指标，一个好的软件缺陷预测模型，应该同时具有较高的Pd 与Precision ，既希望预测模型能够尽可能多地找出有缺陷模块，又希望它能够尽可能地准确地把有缺陷模块预测正确。

软件缺陷分析方法

软件缺陷分析⽅法ODC分析法ODC（正交缺陷分类）分析⽅法最早由IBM的waston中⼼推出，是将⼀个缺陷在⽣命周期的各环节的属性组织起来，从单维度、多维度来对缺陷进⾏分析，从不同⾓度得到各类缺陷的缺陷密度和缺陷⽐率，从⽽积累得到各类缺陷的基线值，⽤于评估测试活动，指导测试改进和整个研发流程的改进；同时根据各阶段缺陷分布得到缺陷去除过程特征模型，⽤于对测试活动进⾏评估和预测。

详细参见：ODC适⽤于缺陷的定位、排除、原因分析以及预防活动，它也可以⽤于改进软件的开发过程。

ODC的缺点在于：分类过程复杂，难以把握分类标准，缺陷分析⼈员的主管意见会影响属性的缺点。

Gompertz分析法资料：根据测试累积投⼊时间和累积缺陷增长情况，拟合得到符合⾃⼰过程能⼒缺陷增长的Gompertz曲线，⽤来评估软件测试充分性、预测软件极限缺陷数量和退出测试所需时间、作为测试退出判断依据、指导测试计划和策略调整。

缺点：这个⽅法的前提是产品的整个测试活动中测试能⼒保持相对稳定，同时对测试过程中发现的缺陷只做数量上的处理，不做等级上的划分。

四象限分析法按照严重程度和优先级，划分出来四个象限。

优先级⾼的尽快解决，最⼤程度可降低整个项⽬的周期。

如果严重的缺陷没有修复，随着时间的推移第⼀象限严重的缺陷的密度越来越⼤，变得越发不可控制，风险就越⼤。

根据软件内部各模块、⼦系统、特性测试所累积时间和缺陷去除情况，和累积时间和缺陷去除情况的基线进⾏⽐较，得到各个模块、⼦系统、特性测试分别所位于的区间，从⽽判断哪些部分测试可以退出、哪些测试还需加强，⽤于指导测试计划和策略的调整。

根本原因分析参考资料：RCA（Root Cause Analysis）根本原因分析是⼀项结构化的问题处理法，⽤以逐步找出问题的根本原因并加以解决，⽽不是仅仅关注问题的表征。

根本原因分析是⼀个系统化的问题处理过程，包括确定和分析问题原因，找出问题解决办法，并制定问题预防措施。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第３０卷第６期　２０１３年６月　计算机应用研究　Ａｐｐｌｉｃａｔｉｏｎ　Ｒｅｓｅａｒｃｈ　ｏｆ　Ｃｏｍｐｕｔｅｒｓ　Ｖ０ｌＪ　３０　Ｎｏ．６　

Ｊｕｎ．２０１３　

软件缺陷集成预测模型研究术　刘小花，王涛，吴振强　（陕西师范大学计算机科学学院，西安７１００６２）　

摘要：利用单一分类器构造的缺陷预测模型已经遇到了性能瓶颈，而集成分类器相比单一分类器往往具有显　著的性能优势。以构造高效的集成缺陷预测模型为出发点，比较了七种不同类型集成分类器的算法和特点。在　１４个基准数据集上的实验显示，部分集成预测模型的性能优于基于朴素贝叶斯的单一预测模型。其中，基于投　票的集成分类框架具有最优的预测性能以及统计学意义上的性能优势显著性，随机森林算法次之。Ｓｔａｃｋｉｎｇ集　成框架也具有较强的泛化能力。　关键词：软件缺陷预测；集成分类；投票；随机森林　中图分类号：ＴＰ３１１．５　文献标志码：Ａ　文章编号：１００１—３６９５（２０１３）０６—１７３４．０５　ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１００１—３６９５．２０１３．０６．０３５　

Ｓｏｆｔｗａｒｅ　ｄｅｆｅｃｔ　ｐｒｅｄｉｃｔｉｏｎ　ｂａｓｅｄ　ｏｎ　ｃｌａｓｓｉｆｉｅｒｓ　ｅｎｓｅｍｂｌｅ　ＬＩＵ　Ｘｉａｏ—ｈｕａ．ＷＡＮＧ　Ｔａｏ．ＷＵ　Ｚｈｅｎ—ｑｉａｎｇ　（Ｓｃｈｏｏｌ　ｏｆＣｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ，Ｓｈａａｎｘｉ　Ｎｏｒｍａｌ　Ｕｎｉｖｅｒｓｉｔｙ，Ｘｉ’ａｎ　７１００６２，Ｃｈｉｎａ）　

Ａｂｓｔｒａｃｔ：Ｓｏｆｔｗａｒｅ　ｄｅｆｅｃｔ　ｐｒｅｄｉｃｔｉｏｎ　ｕｓｉｎｇ　ｃｌａｓｓｉｆｉｃａｔｉｏｎ　ａｌｇｏｒｉｔｈｍｓ　ｗａｓ　ａｄｖｏｃａｔｅｄ　ｂｙ　ｍａｎｙ　ｒｅｓｅａｒｃｈｅｒｓ．Ｈｏｗｅｖｅｒ．ｓｅｖｅｒａｌ　

ｎｅｗ　ｌｉｔｅｒａｔｕｒｅｓ　ｓｈｏｗ　ｔｈｅ　ｐｅｒｆｏｒｍａｎｃｅ　ｂｏｔｔｌｅｎｅｃｋ　ｂｙ　ａｐｐｌｙｉｎｇ　ａ　ｓｉｎｇｌｅ　ｃｌａｓｓｉｆｉｅｒ　ｒｅｃｅｎｔ　ｙｅａｒｓ．Ｏｎ　ｔｈｅ　ｏｔｈｅｒ　ｈａｎｄ．ｃｌａｓｓｉｆｉｅｒｓ　ｅｎ—　ｓｅｍｂｌｅ　ｃａｎ　ｅｆｆｅｃｔｉｖｅｌｙ　ｉｍｐｒｏｖｅ　ｃｌａｓｓｉｆｉｃａｔｉｏｎ　ｐｅｒｆｅｌｒｍａｎｃｅ　ｔｈａｎ　ａ　ｓｉｎｇｌｅ　ｃｌａｓｓｉｆｉｅｒ．Ｔｈｉｓ　ｐａｐｅｒ　ｃｏｎｄｕｃｔｅｄ　ａ　ｃｏｍｐａｒａｔｉｖｅ　ｓｔｕｄｙ　ｏｆ　ｖａｒｉｏｕｓ　ｅｎｓｅｍｂｌｅ　ｍｅｔｈｏｄｓ　ｗｉｔｈ　ｐｅｒｓｐｅｃｔｉｖｅ　ｏｆ　ｔａｘｏｎｏｍｙ．Ａ　ｓｅｒｉｅｓ　ｏｆ　ｂｅｎｃｈｍａｒｋｉｎｇ　ｅｘｐｅｒｉｍｅｎｔｓ　ｏｎ　ｐｕｂｌｉｃ—ｄｏｍａｉｎ　ｄａｔａｓｅｔｓ　ＭＤＰ　ｓｈｏｗ　ｔｈａｔ　ａｐｐｌｙｉｎｇ　ｃｌａｓｓｉｆｉｅｒｓ　ｅｎｓｅｍｂｌｅ　ｍｅｔｈｏｄｓ　ｔｏ　ｐｒｅｄｉｃｔ　ｄｅｆｅｃｔ　ｃｏｕｌｄ　ａｃｈｉｅｖｅ　ｂｅｔｔｅｒ　ｐｅｒｆｏｒｍａｎｃｅ　ｔｈａｎ　ｕｓｉｎｇ　ａ　ｓｉｎｇｌｅ　ｃｌａｓｓｉｆｉ—　ｅｒ．Ｓｐｅｃｉａｌｌｙ．ｉｎ　ａｌｌ　ｓｅｖｅｎ　ｅｎｓｅｍｂｌｅ　ｍｅｔｈｏｄｓ　ｅｖｏｌｖｅｄ　ｂｙ　ｔｈｉｓ　ｅｘｐｅｒｉｍｅｎｔｓ．ｖｏｔｉｎｇ　ａｎｄ　ｒａｎｄｏｍ　ｆｏｒｅｓｔ　ｈａｖｅ　ｏｂｖｉｏｕｓ　ｐｅｒｆｏｒｍａｎｃｅ　ｓｕｐｅｒｉｏｒｉｔｙ　ｔｈａｎ　ｏｔｈｅｒｓ，ａｎｄ　Ｓｔａｃｋｉｎｇ　ａｌＳＯ　ｈａｓ　ｂｅｔｔｅｒ　ｇｅｎｅｒａｌｉｚａｔｉｏｎ　ａｂｉｌｉｔｙ．　Ｋｅｙ　ｗｏｒｄｓ：ｓｏｆｔｗａｒｅ　ｄｅｆｅｃｔ　ｐｒｅｄｉｃｔｉｏｎ；ｃｌａｓｓｉｆｉｅｒｓ　ｅｎｓｅｍｂｌｅ；ｖｏｔｅ；ｒａｎｄｏｍ　ｆｏｒｅｓｔ　

０引言　软件缺陷预测的目的是在软件生命周期的各个阶段为缺　陷检测提供指导，将有限的测试资源和时间进行合理的分　配。因此，研究构造有效的缺陷预测模型具有极为重要的意　义。应用包括遗传算法、回归方法、神经网络、关联规则、决　策树等数据挖据或机器学习方法进行缺陷预测取得了不错　的效果。然而，研究者已经发现了缺陷预测模型的性能瓶　颈　“　。这些结果显示单纯依靠更强的数据挖掘技术已不足　以得到更好的分类效果。基于软件度量的缺陷预测研究似　乎已经遇到了瓶颈。　许多理论和实验研究证明，将多个分类器集成在一起，然　后用于分类或预测将会使决策更为准确　。然而，将集成分　类器（ｃｌａｓｓｉｆｉｅｒｓ　ｅｎｓｅｍｂｌｅ）技术应用于缺陷预测的研究却鲜有　报道。Ｔｏｓｕｎ等人　提出了集成朴素贝叶斯、人工神经网络以　及特征问隔投票（ｖｏｔｉｎｇ　ｆｅａｔｕｒｅ　ｉｎｔｅｒｖａｌｓ）三种不同的算法，应　用于缺陷预测后相比朴素贝叶斯算法显著地提高了预测能力，　其不足之处在于实验仅在少数的数据集上得以验证。Ｚｈｅｎｇ　７　Ｊ　针对缺陷预测研究了基于神经网络的三种代价敏感的Ｂｏｏｓ—　ｒｉｎｇ算法，但他的工作仅仅集中在Ｂｏｏｓｔｉｎｇ这一种集成模型上。　目前利用分类器集成技术构造缺陷预测模型仍处于研究　初级阶段。因此，本文主要研究两个问题：ａ）如何在缺陷预测　中应用集成分类器；ｂ）可应用于缺陷预测的分类器集成算法　哪个性能更出色。本文分析了七种集成分类器构造缺陷预测　模型的方法，基于构造方法的层次将这些集成方法进行了分　类；在标准的缺陷预测数据集上，对七种集成方法进行了实验　分析，并将其与单一分类器模型Ｎａｉｖｅ　Ｂａｙｅｓ进行比较，从准确　性指示方面给出了最优的集成缺陷预测模型；针对准确性实验　结果开展了假设检验分析，从统计学角度分析了这些集成算法　性能差异的显著性。　１集成分类器　集成分类器是一种模仿人类第二天性的策略——人类总　是在考虑了多方面因素后才作出某个关键决策　Ｊ。集成分类　器技术是综合多个分类器来构造分类模型的方法，通过有效地　利用各种类型分类器的多样性，在不增加偏差的同时降低方　差，从而可以有效地提高缺陷预测性能　Ｊ。图１显示了集成　分类器与单个分类器相比较的优势。Ａ、Ｂ、Ｃ三条直线分别代　表三个分类器，标记为“＋”的样本为实际正类样本，标记为　“一”的样本为实际负类样本。容易发现，无论哪个分类器都　

收稿１３期：２０１２—１０．１０；修回１３期：２０１２—１１．２４　基金项目：国家自然科学基金面上项目（６１１７３１９０）；陕西省自然科学基础研究计划项　目（２００９ＪＭ８００２）；中央高校基本科研业务费专项资金资助项目（ＧＫ２０１３０２０５５）　作者简介：刘小花（１９８０．），女，甘肃永昌人，博士研究生，主要研究方向为数据挖掘、软件工程（ｆｌｏｗｅｒｅｔ＠ｓｎｎｕ．ｅｄｕ．ＣＩＩ）；王涛（１９８０一），男，讲　师，博士，主要研究方向为数据挖掘、软件工程等；吴振强（１９６８－），男，教授，博导，主要研究方向为信息安全、计算机网络等．　第６期　刘小花，等：软件缺陷集成预测模型研究　・１７３５・　无法单独地彻底将所有样本分开。例如，Ａ将其右侧的样本分　类为正类，将其左侧的样本分类为负类。因此，处于３号区域　的样本Ａ就无法对其正确分类。实际上，对于图１中描述的样　本不可能有直线将其完美正确分类。然而，通过组合Ａ、Ｂ、Ｃ　三个分类器却有办法可以实现这一点。可以观察到，对于１号　区域的样本，三个分类器都可分类为负类，而剩余的２、３、４三　个区域中的样本，三个分类器的分类无法实现统一，但是通过　一个简单的集成策略就可实现对样本的正确划分。显然，这个　策略可以是多数投票，即Ａ、Ｂ、Ｃ三个分类器对样本分类出现　争议时采用持多数意见者获胜的策略。因此，２、３、４三个区域　中的样本将被正确分类。可以看出，分类器集成的结果就是将　原有的三个直线分类器转换成一个多段的曲线分类器（图１　中的粗体线段构成的曲线）。　图１集成分类器的优势　２基于集成分类器的缺陷预测模型　本章将分析主流的七种集成技术如何构造缺陷预测模型。　首先，假定预测对象即模块ｍ由一组代码属性描述，ｍ：｛ａ。，　ａ　，…，。　｝。分类器的任务是决策ｍ分类为ｃ　或者ｃ　，其中　ｃ　为缺陷类标记，而ｃ　为非缺陷类标记。　Ｂａｇｇｉｎｇ［８　（ｂｏｏｔｓｔｒａｐ　ａｇｇｒｅｇａｔｉｎｇ）是一个著名的集成分类　器算法。其核心思想是从训练集抽取出不同的部分（有交集）　来训练集成分类器成员。预测阶段，采取平均或投票方式集成　分类器成员。如算法１所示，Ｂａｇｇｉｎｇ算法每次有放回地、均匀　地采样Ⅳ个样本，也就是说每个分类器由这次采样得到的数　据集进行训练，并且该数据集和原始数据集的大小一致。因　此，通常认为利用Ｂａｇｇｉｎｇ算法得到的集成分类器，其性能往　往优于在原始数据集上训练出来的单个模型。　算法１　Ｂａｇｇｉｎｇ算法描述　Ｉｎｐｕｔ：ｔｈｅ　ｎｕｍｂｅｒ　ｏｆ　ｅｎｓｅｍｂｌｅ　ｍｅｍｂｅｒｓ　Ｍ；Ｔｒａｉｎｉｎｇ　ｓｅｔ　Ｓ＝｛（ｍｌ，　ｃ１），（ｍ２，ｅ２），・一，（ｍＮ，ｃＮ）；ｃｌ，Ｃ２，…，ＣＮ∈｛。ｄ，　ｎｄ｝｝；Ｔｅｓｔｉｎｇ　ｓｅｔＴ　Ｔｒａｉｎｉｎｇ　ｐｈａｓｅ：　ｆｏｒ　ｉ＝１　ｔｏ　Ｍ　ｄｏ　Ｄｒａｗ（ｗｉｔｈ　ｒｅｐｌａｃｅｍｅｎｔ）ａ　ｂｏｏｔｓｔｒａｐ　ｓａｍｐｌｅ　ｓｅｔ　Ｓ、（Ｎ　ｅｘａｍｐｌｅｓ）ｏｆ　ｔｈｅ　ｄａｔａ　ｆｒｏｍ　Ｓ；　Ｔｒａｉｎ　ａ　ｃｌａｓｓｉｆｉｅｒ　Ｃ。ｆｒｏｍ　Ｓｉ　ａｎｄ　ａｄｄ　ｉｔ　ｔｏ　ｔｈｅ　ｅｎｓｅｍｂｌｅ；　ｅｎｄ　ｆｏｒ　Ｔｅｓｔｉｎｇ　ｐｈａｓｅ：　ｆｏｒ　ｅａｃｈ　ｔ　ｉｎ　Ｔ　ｄｏ　Ｔｒｙ　ａｌｌ　ｃｌａｓｓｉｆｉｅｒｓ　Ｃ。；　Ｐｒｅｄｉｃｔ　ｔｈｅ　ｃｌａｓｓ　ｔｈａｔ　ｒｅｃｅｉｖｅｓ　ｔｈｅ　ｈｉｇｈｅｓｔ　ｎｕｍｂｅｒ　ｏｆ　ｖｏｔｅｓ；　ｅｎｄ　ｆｏｒ　Ｂｏｏｓｔｉｎｇ也是一个非常著名的集成算法，其中ＡｄａＢｏｏｓｔ　是Ｂｏｏｓｔｉｎｇ算法家族中最著名的一个实现。如算法２所示，　ＡｄａＢｏｏｓｔ通过多个回合的迭代构造集成分类器，每个回合利用　不同的样本加权来训练一个新的模型，整个迭代过程串行地完　成。每个回合不正确分类样本的权重将增大，使得在下次迭代　回合中，这些不正确分类的样本对分类器的训练贡献更大。该　算法产生了一系列的分类器，并且后续的分类器是之前分类器　的补充，最终ＡｄａＢｏｏｓｔ以投票方式将这些分类器组合在一起。　算法２　ＡｄａＢｏｏｓｔ算法描述　Ｉｎｐｕｔ：ｔｈｅ　ｎｕｍｂｅｒ　ｏｆ　ｅｎｓｅｍｂｌｅ　ｍｅｍｂｅｒｓ　Ｍ；Ｔｒａｉｎｉｎｇ　ｓｅｔ　Ｓ＝｛（ｍｌ，　ｃ１），（ｍ２，ｃ２），…，（ｍＮ，ｃＮ）；Ｃ１，Ｃ２，…，ＣＮ∈｛Ｃｄ，Ｃｎｄ｝｝　Ｉｎｉｔｉａｌｉｚｅ：ｅａｃｈ　ｔｒａｉｎｉｎｇ　ｅｘａｍｐｌｅ　ｗｅｉｇｈｔ　ｗ．＝１／Ｎ（ｉ＝１，…，Ｎ）　Ｔｒａｉｎｉｎｇ　ｐｈａｓｅ：　ｆｏｒ　ｘ＝１　ｔｏ　Ｍ　ｄｏ　Ｔｒａｎ　ａ　ｃｌａｓｓｉｆｉｅｒ　Ｃｘ　ｕｓｉｎｇ　ｔｈｅ　ｃｕｒｒｅｎｔ　ｅｘａｍｐｌｅ　ｗｅｉｇｈｔｓ；　ｃｏｍｐｕｔｅ　ａ　ｗｅｉｇｈｔｅｄ　ｅｒｒｏｒ　ｅｓｔｉｍａｔｅ：ｅｒｒｘ：∑（Ｗｌ　ｏｆ　ａｌｌ　ｉｎｃｏｒｒｅｃｔｌｙ　ｃｌａｓｓｆｉｅｄ　ｍ。）／∑　１ｗ。　ｃｏｍｐｕｔｅ　ａ　ｃｌａｓｓｉｆｉｅｒｗｅｉｇｈｔ：Ⅱ　＝ｌｏｇ（（１一ｅｒｒｘ）／ｅｒｒ　）／２；　ｆ０ｒ　ａｌｌ　ｃｏｒｒｅｃｔｌｙ　ｃｌａｓｓｉｆｉｅｄ　ｅｘａｍｐｌｅｓ　ｍｌ：ｗ。＋＿＿ｗｌ　ｅ…；　ｆｎｒ　ａｌｌ　ｉｎｃｏｒｒｅｃｔｌｙ　ｃｌａｓｓｉｆｉｅｄ　ｅｘａｍｐｌｅｓ　ｍ　：Ｗｌ　ｗｌ　ｅ　ｎｏｒｍａｌｉｚｅ　ｔｈｅ　ｗｅｉｇｈｔｓ　Ｗｌ　ＳＯ　ｔｈａｔ　ｔｈｅｙ　ｓｕｍ　ｔｏ　１；　ｅｎｄ　ｆｏｒ　Ｔｅｓｔｉｎｇ　ｐｈａｓｅ：　ｆｏｒ　ｅａｃｈｔｉｎ　Ｔ　ｄｏ　Ｔｒｙ　ａｌｌ　ｃｌａｓｓｉｆｉｅｒｓ　Ｃ　；　Ｐｒｅｄｉｃｔ　ｔｈｅ　ｃｌａｓｓ　ｔｈａｔ　ｒｅｃｅｉｖｅｓ　ｔｈｅ　ｈｉｇｈｅｓｔ　ｓｕｍ　ｏｆ　ｗｅｉｇｈｔｓ　ｄｘ；　ｅｎｄ　ｆｏｒ　Ｄｉｅｔｔｅｒｉｃｂ［１叫提出了一种名叫随机Ｃ４．５的算法。这个算