贝叶斯的决策树剪枝算法在学科评审中的研究

合集下载

剪枝算法在路径规划中的应用

剪枝算法在路径规划中的应用

剪枝算法在路径规划中的应用剪枝算法是一种在搜索空间中剪掉无效分支的优化策略,能够提高搜索效率。

在路径规划问题中,剪枝算法被广泛应用,以寻找最优的路径方案并减少计算成本。

本文将介绍剪枝算法在路径规划中的应用,并探讨其优势和实际效果。

1. 理论基础剪枝算法基于搜索过程中的评估函数,通过判断当前搜索状态是否有可能成为最优解的一部分,从而决定是否继续搜索。

对于路径规划问题而言,每一步的决策都会带来一个新的状态,通过评估函数可以预测该状态是否有潜力成为最终解的一部分。

剪枝算法利用这个评估函数,检查当前状态的可行性,从而优化搜索过程。

2. 剪枝策略在路径规划中,剪枝策略主要包括以下几种:2.1 最短路径剪枝在搜索过程中,当某个节点到达终点的路径长度已经超过当前最短路径长度时,可以剪枝掉该节点的搜索。

因为该路径长度已经超过最短路径,无需继续搜索,直接剪枝。

这种剪枝策略能够有效地减少无效搜索,提高路径规划效率。

2.2 死胡同剪枝死胡同是指没有出口或者无法到达目标节点的路径。

在路径规划中,如果某个节点的所有相邻节点都已经被访问过,且都不是目标节点,那么该节点是一个死胡同,可以剪枝掉该节点。

因为从该节点无法到达目标节点,无需继续搜索,直接剪枝。

2.3 重复节点剪枝路径规划搜索过程中,可能会遇到重复的节点,即已经访问过的节点再次出现。

在剪枝算法中,可以通过判断重复节点是否能够提供更优的路径来进行剪枝。

如果重复节点的路径长度较长,则可以剪枝掉该节点,因为已经存在一条更短的路径。

3. 实际应用剪枝算法在实际路径规划应用中具有广泛的应用场景。

例如,通过在地图中标记已访问节点,可以根据剪枝策略减少无效搜索路径,提高路径规划的效率;利用启发式函数对搜索状态进行评估,结合剪枝算法,可以快速找到最优路径;在动态环境下,根据实时变化的情况,通过剪枝策略及时更新搜索状态,及时调整路径。

4. 优势和实际效果剪枝算法在路径规划中的应用能够大幅提升搜索效率,并减少不必要的计算成本。

决策树算法 课程思政

决策树算法 课程思政

决策树算法课程思政决策树算法是一种常用的机器学习算法,在各个领域都有广泛的应用。

而课程思政作为大学生的必修课程,对于我们的思维方式、价值观和道德观念等方面都有着重要的影响。

本文将从决策树算法的基本原理、应用案例以及如何将决策树算法应用于课程思政等方面展开讨论。

一、决策树算法的基本原理决策树算法是一种基于树形结构的有监督学习算法,它通过对数据集进行划分,构建一棵树形结构来进行决策。

决策树的每个内部节点表示一个特征属性,每个分支代表该特征属性的一个取值,而每个叶节点则表示一个类别。

根据样本的特征值,沿着决策树从根节点到叶节点的路径,就可以得到对样本的分类结果。

决策树算法的主要步骤包括特征选择、决策树的生成和决策树的修剪。

特征选择是指根据某个准则选择最佳的划分属性,常用的准则有信息增益、信息增益比和基尼指数等。

决策树的生成是通过递归的方式,根据选择的特征属性进行划分,直到所有样本都属于同一类别或无法继续划分为止。

决策树的修剪是为了避免过拟合,通过剪枝操作来简化决策树的复杂度。

二、决策树算法的应用案例决策树算法在很多领域都有广泛的应用,例如医学诊断、金融风控和智能推荐等。

下面以医学诊断为例,介绍决策树算法的应用。

在医学诊断中,医生需要根据患者的症状和体征来判断患者患的是哪种疾病。

使用决策树算法可以通过构建一棵决策树来辅助医生进行诊断。

首先,根据已有的病例数据,选择合适的特征属性进行划分,例如体温、血压和呼吸频率等。

然后,根据特征属性的取值,将患者分到不同的类别,例如感冒、肺炎和流感等。

最后,根据决策树的分类结果,医生可以给出相应的治疗方案。

三、决策树算法与课程思政的应用将决策树算法应用于课程思政可以帮助学生更好地理解和运用思政知识。

首先,可以通过构建决策树来帮助学生解决思政问题。

例如,对于一个道德问题,可以根据不同的特征属性进行划分,例如利益关系、公平原则和伦理道德等,从而得到不同的判断结果。

这样可以帮助学生系统地分析和解决复杂的思政问题。

决策树算法的优缺点及其改进方法

决策树算法的优缺点及其改进方法

决策树算法的优缺点及其改进方法决策树算法是一种常用的数据挖掘和机器学习算法,它通过构建树型结构来进行决策和分类。

决策树算法具有一些独特的优点,同时也存在一些局限性。

为了进一步提高决策树算法的性能,许多改进方法被提出和应用。

本文将对决策树算法的优缺点进行探讨,并介绍一些改进方法。

一、决策树算法的优点1. 可解释性强:决策树算法生成的模型具有易于理解和解释的特点。

决策树的每个分支代表了一个属性的决策过程,最终的叶子节点表示了最终的决策结果。

这使得决策树算法在需要将模型结果向非专业人士解释时表现出色。

2. 适用于多类别问题:相比其他机器学习算法,决策树算法对于多类别问题的处理更加简单直观。

每个叶子节点代表了一种类别的划分结果,通过遍历决策树便能够得到对应的类别。

3. 可以处理混合数据类型:决策树算法能够处理包含离散型和连续型数据的混合型数据。

通过对混合型数据进行离散化处理,可以在决策树的节点中进行有效的属性选择。

二、决策树算法的缺点1. 容易产生过拟合:决策树算法在处理复杂问题时容易产生过拟合现象。

当决策树生长过深或者树的分支过多时,模型会过于复杂,从而导致对训练集的过拟合,而在新的数据集上表现较差。

2. 对输入数据的变化敏感:决策树算法对输入数据的变化非常敏感。

当输入数据发生轻微变化时,决策树可能会重新生成或调整,导致模型不稳定。

3. 忽略了属性之间的相关性:决策树算法在生成树形结构时,只考虑了当前节点和它的子节点之间的关联,而忽略了其他属性之间的相关性。

这可能导致某些属性在集成学习中被过度强调或被忽略,从而影响模型的准确性。

三、决策树算法的改进方法1. 剪枝方法:为了避免过拟合问题,可以通过剪枝方法对决策树进行修剪,减少模型的复杂度。

常见的剪枝方法包括预剪枝和后剪枝。

预剪枝在树的生成过程中进行剪枝,通过设定阈值终止树的生长;后剪枝则在树的生成完成后,通过交叉验证等方法对节点进行合并或剪枝。

2. 集成学习方法:集成学习方法可以通过结合多个决策树模型的预测结果来提高分类准确度。

决策树技术及其在医学中的应用

决策树技术及其在医学中的应用

拉曼光谱技术的未来发展
随着科学技术的发展,拉曼光谱技术在未来将会有更广泛的应用前景。首先, 随着仪器设备的不断改进和优化,拉曼光谱技术的灵敏度和分辨率将会进一步 提高,为医学研究提供更准确的数据。其次,随着算法和计算机技术的不断发 展,拉曼光谱技术的数据处理和分析能力将会得到进一步提升,为医学诊断和 治疗提供更有效的支持。
决策树技术的优缺点
1、优点
决策树技术的优点主要包括以下几点: (1)直观易懂:决策树模型具有直观的树状结构,方便医生和患者理解。
(2)分类准确:决策树算法具有较高的分类准确性和鲁棒性,能够很好地处 理医学数据中的噪声和异常值。
(3)可解释性强:决策树模型可以清晰地展示出分类规则和决策路径,方便 医生和患者解释和理解。
2、数据预处理:对数据进行清洗、整理、归一化等操作,以提高决策树的准 确性。
3、特征选择:选择与分类结果相关的特征,以便在决策树中进行划分。
4、决策树生成:根据选择的特 征和数据,生成决策树模型。
5、模型评估:使用测试数据集评估决策树的准确性和鲁棒性。
决策树技术在医学中的应用
1、疾病诊断
决策树技术在疾病诊断方面具有广泛的应用。例如,医生可以使用决策树模型 根据患者的症状和体征,快速准确地诊断出疾病类型。此外,决策树还可以帮 助医生确定疾病的发展趋势和可能的治疗方案。通过对大量病例数据的分析, 决策树可以高精度地识别出疾病类型和风险因素,从而提高了医生的诊断能力 和治疗效果。
决策树技术及其在医学中的应用
目录
01 引言
03 决策树建立的方法
02 决策树的基本概念
04
决策树技术在医学中 的应用
目录
05 决策树技术的优缺点
07 参考内容

如何对决策树进行剪枝

如何对决策树进行剪枝

决策树剪枝是一种通过减少决策树的复杂度来提高其泛化能力的方法。

常见的决策树剪枝方法包括预剪枝和后剪枝。

1. 预剪枝(Pre-pruning):
- 基于信息增益(或基尼系数)进行预剪枝:在决策树构建的过程中,每次划分前先计算该划分能够带来的信息增益(或基尼系数),如果划分后的信息增益(或基尼系数)小于一个预先设定的阈值,则停止划分并将当前节点标记为叶子节点;
- 基于验证集进行预剪枝:将原始数据集划分为训练集和验证集,构建决策树时,在每个节点上计算该划分在验证集上的性能指标(例如准确率),如果划分后的性能指标没有显著提升,则停止划分并将当前节点标记为叶子节点。

2. 后剪枝(Post-pruning):
- 基于验证集进行后剪枝:在决策树构建完成后,自底向上地对决策树进行剪枝。

对每个节点进行考察,将其替换为叶子节点,并计算在验证集上的性能指标的变化(例如准确率),如果剪枝后的性能指标有所提升,则进行剪枝操作,否则保留当前节点。

- 基于不确定性度量进行后剪枝:利用统计学中的结构判断与不确定性(如卡方检验)来判断对应的剪枝操作。

需要注意的是,剪枝会牺牲一部分训练集上的准确率,但能够提高模型在未见样本上的泛化能力。

另外,剪枝操作还可以用于控制模型的复杂度,防止过拟合。

决策树及其剪枝原理

决策树及其剪枝原理

决策树及其剪枝原理决策树可以分成ID3、C4.5和CART。

CART与ID3和C4.5相同都由特征选择,树的⽣成,剪枝组成。

但ID3和C4.5⽤于分类,CART可⽤于分类与回归。

ID3和C4.5⽣成的决策树可以是多叉的,每个节点下的叉树由该节点特征的取值种类⽽定,⽐如特征年龄分为(青年,中年,⽼年),那么改节点下可分为3叉。

⽽CART为假设决策树为⼆叉树,内部结点特征取值为”是”和”否”。

特征选择CART分类树通过基尼指数选择最优特征,同时决定该特征的最优⼆值切分点,⽽ID3和C4.5直接选择最优特征,不⽤划分。

算法⽬的:决策树的剪枝是为了简化决策树模型,避免过拟合。

剪枝类型:预剪枝、后剪枝预剪枝:在构造决策树的同时进⾏剪枝。

所有决策树的构建⽅法,都是在⽆法进⼀步降低熵的情况下才会停⽌创建分⽀的过程,为了避免过拟合,可以设定⼀个阈值,熵减⼩的数量⼩于这个阈值,即使还可以继续降低熵,也停⽌继续创建分⽀。

但是这种⽅法实际中的效果并不好。

后剪枝是在决策树⽣长完成之后,对树进⾏剪枝,得到简化版的决策树。

剪枝的过程是对拥有同样⽗节点的⼀组节点进⾏检查,判断如果将其合并,熵的增加量是否⼩于某⼀阈值。

如果确实⼩,则这⼀组节点可以合并⼀个节点,其中包含了所有可能的结果。

后剪枝是⽬前最普遍的做法。

后剪枝的剪枝过程是删除⼀些⼦树,然后⽤其叶⼦节点代替,这个叶⼦节点所标识的类别通过⼤多数原则(majority class criterion)确定。

所谓⼤多数原则,是指剪枝过程中, 将⼀些⼦树删除⽽⽤叶节点代替,这个叶节点所标识的类别⽤这棵⼦树中⼤多数训练样本所属的类别来标识,所标识的类称为majority class ,(majority class 在很多英⽂⽂献中也多次出现)。

预剪枝依据:作为叶结点或作为根结点需要含的最少样本个数决策树的层数结点的经验熵⼩于某个阈值才停⽌后剪枝算法后剪枝算法有很多种,这⾥简要总结如下:Reduced-Error Pruning (REP,错误率降低剪枝)这个思路很直接,完全的决策树不是过度拟合么,我再搞⼀个测试数据集来纠正它。

贝叶斯推理树-概述说明以及解释

贝叶斯推理树-概述说明以及解释1.引言1.1 概述概述贝叶斯推理树是一种基于贝叶斯推理原理构建的推理模型。

贝叶斯推理是一种统计学方法,用于根据先验知识和观测数据来更新对事件概率的估计。

贝叶斯推理树则是在这种推理思想的基础上,将问题分解成一系列条件概率的计算,从而实现复杂问题的推理和决策。

贝叶斯推理树的构建过程包括了确定根节点、分支节点和叶节点,以及计算在给定观测条件下各节点的条件概率。

通过逐层推理和条件概率的更新,贝叶斯推理树可以有效地处理不确定性问题,并提供具有较高可信度的结果。

贝叶斯推理树的应用领域十分广泛。

在医学诊断中,贝叶斯推理树可以帮助医生根据症状和观测结果推断患者可能患有的疾病。

在决策分析中,贝叶斯推理树可以帮助企业制定最优的决策方案。

在智能交通领域,贝叶斯推理树可以帮助交通系统预测交通流量,优化交通信号控制。

然而,贝叶斯推理树也存在一些局限性。

首先,贝叶斯推理树的构建需要大量的先验知识和观测数据,才能得出准确可靠的结果。

其次,贝叶斯推理树对于问题的分解和条件概率计算较为复杂,需要一定的数学和统计学知识。

此外,贝叶斯推理树在处理大规模问题时,由于计算复杂度的增加,可能面临计算资源和时间的限制。

展望未来,随着数据科学和人工智能的快速发展,贝叶斯推理树有望在更多领域得到广泛应用。

未来的研究可以致力于改进贝叶斯推理树的构建方法,提高其计算效率和可解释性。

此外,还可以探索与其他推理模型的融合,从而进一步扩展贝叶斯推理树的应用范围。

综上所述,贝叶斯推理树是一种基于贝叶斯推理原理构建的推理模型,具有应用广泛且潜力巨大的特点。

随着相关技术的不断发展和深入研究,贝叶斯推理树有望为解决复杂问题和推动社会进步做出更多贡献。

1.2文章结构文章结构部分(1.2 文章结构)的内容如下:在本文中,我们将按照以下结构对贝叶斯推理树进行详细的介绍和讨论。

首先,引言部分将给出一个对贝叶斯推理树的概述,解释其基本原理和运作方式。

决策树算法的优化方法及其改进思路

决策树算法的优化方法及其改进思路决策树算法是一种常用的机器学习方法,广泛应用于分类和回归问题。

然而,在实际应用中,决策树算法也存在一些问题,例如容易过拟合、对噪声敏感等。

为了克服这些问题,研究人员提出了一系列优化方法和改进思路。

本文将介绍决策树算法的常见优化方法,并探讨一些改进思路。

一、剪枝算法剪枝算法是决策树算法中常用的优化方法之一。

传统的决策树算法在构建决策树时会一直生长,直到每个叶节点都是单一的类别或者达到预定的阈值。

然而,这样的决策树容易过拟合,泛化能力较差。

剪枝算法通过移除一些决策树的分支或合并一些叶节点来减小决策树的复杂度,以提高决策树的泛化能力。

常用的剪枝算法包括预剪枝和后剪枝。

预剪枝算法在决策树构建过程中,在每一次划分之前评估划分后的决策树的性能,如果划分后的性能下降,则停止划分,将当前节点作为叶节点。

后剪枝算法则是先构建完整的决策树,然后通过计算剪枝前后的性能来决定是否剪枝。

具体操作是从底向上,逐步剪枝,直到剪枝后的决策树达到预期的性能。

二、集成学习方法集成学习是通过构建多个基分类器,然后将它们组合成一个更强大的分类器的方法。

决策树算法也可以通过集成学习来进行优化。

常见的集成学习方法包括Bagging和Boosting。

Bagging方法通过随机抽样得到多个训练集,然后分别训练多个决策树,最后通过对多个决策树的结果进行投票或平均来得到最终结果。

Boosting方法则是通过逐步调整样本权重来训练多个弱分类器,并将它们组合成一个强分类器。

三、特征选择方法特征选择是指在构建决策树时选择最优的特征进行划分。

选择合适的特征可以提高决策树的学习能力和泛化能力。

常见的特征选择方法有信息增益、信息增益率、基尼指数等。

信息增益是通过计算特征对数据集的熵的减少程度来选择最优特征的方法。

信息增益率则是在信息增益的基础上考虑特征本身的信息量。

四、决策树剪枝策略的改进在传统的决策树剪枝策略中,通过预剪枝和后剪枝来减小决策树的复杂度,以提高泛化能力。

基于决策树算法的改进与应用

基于决策树算法的改进与应用基于决策树算法的改进与应用一、引言决策树算法是一种常用的机器学习算法,广泛应用于数据挖掘、模式识别、智能推荐等领域。

其简单直观的特性使得决策树算法成为人工智能领域的热门研究方向之一。

然而,传统的决策树算法在一些问题上存在不足,例如容易过拟合、难以处理连续型属性等。

本文将介绍基于决策树算法的改进方法以及其在实际应用中的案例。

二、改进方法1. 剪枝方法传统决策树算法容易过拟合,剪枝方法是一种常用的改进策略。

剪枝方法通过减少决策树的深度和宽度,降低模型复杂度,从而提高泛化能力。

常用的剪枝方法包括预剪枝和后剪枝。

预剪枝在决策树构建过程中进行剪枝操作,根据一定的剪枝准则判断是否继续划分子节点;后剪枝则先构建完整的决策树,再根据相应的剪枝准则进行剪枝操作。

剪枝方法可以有效地改善传统决策树算法的过拟合问题,提高模型的泛化性能。

2. 连续属性处理传统决策树算法难以处理连续型属性,常用的处理方法是二分法和离散化。

二分法通过将连续属性划分为两个离散的取值范围,从而将连续属性转化为离散属性。

离散化方法则将连续属性划分为若干个离散的取值,例如等宽法、等频法等。

这样,连续属性就可以像离散属性一样进行处理,便于在决策树算法中应用。

三、应用案例1. 土壤质量评估土壤质量评估是农业生产和环境保护的重要问题之一。

传统的土壤质量评估方法繁琐且耗时,难以适应大规模的数据分析需求。

基于决策树算法的改进方法可以有效地解决这个问题。

在改进的决策树算法中,可以采用剪枝方法减少决策树的深度,从而提高模型的泛化性能。

另外,通过对连续属性进行离散化处理,可以更好地利用土壤质量监测数据进行决策树构建和评估。

实践证明,基于决策树算法的土壤质量评估方法能够快速、准确地判断土壤质量状况。

2. 金融风险评估金融风险评估是银行和金融机构的核心业务之一。

传统的金融风险评估方法主要基于统计分析和经验法则,存在模型复杂度高、计算量大的问题。

决策树毕业论文

决策树毕业论文决策树毕业论文毕业论文是每个大学生在完成学业之前必须面对的一道难题。

在这个论文中,学生需要选择一个合适的主题,并进行深入研究和分析。

在这篇文章中,我将探讨一个可能的主题:决策树。

决策树是一种常用的机器学习算法,用于解决分类和回归问题。

它通过构建一棵树形结构来对数据进行分类或预测。

这个算法的核心思想是将数据集分割成更小的子集,直到子集中的数据属于同一类别或具有相似的特征。

决策树的优势在于它的可解释性和适应性,它可以处理各种类型的数据,并且能够处理大规模的数据集。

在我的毕业论文中,我将研究决策树算法在不同领域的应用。

首先,我将探索决策树在医疗领域的应用。

医疗数据通常包含大量的特征和复杂的关联关系。

通过构建决策树模型,我们可以根据患者的症状和疾病历史来预测患者是否患有某种疾病。

这对于医生来说是一个有用的工具,可以帮助他们做出更准确的诊断和治疗决策。

其次,我将研究决策树在金融领域的应用。

金融数据通常包含大量的时间序列数据和复杂的市场变化。

通过构建决策树模型,我们可以预测股票价格的涨跌趋势,帮助投资者做出更明智的投资决策。

此外,决策树还可以用于信用评分和风险管理,帮助银行和金融机构识别潜在的风险客户。

另外,我还将研究决策树在社交媒体分析中的应用。

社交媒体平台上产生了大量的用户生成内容,包括文本、图片和视频等。

通过构建决策树模型,我们可以对这些内容进行情感分析,了解用户的喜好和情绪状态。

这对于市场营销和品牌管理来说是一个有用的工具,可以帮助企业更好地了解消费者的需求和反馈。

在我的毕业论文中,我将通过实验和案例研究来验证决策树算法在不同领域的应用效果。

我将使用公开可用的数据集,并使用不同的评估指标来评估模型的性能。

我还将与其他机器学习算法进行比较,以评估决策树算法的优势和劣势。

总结起来,决策树是一种强大的机器学习算法,具有广泛的应用前景。

在我的毕业论文中,我将研究决策树算法在医疗、金融和社交媒体分析等领域的应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
mo s t u n r e l i a b l e a n d o v e r i f t i n g b r a n c h e s .An d c o mp a r e d wi t h t h e C4 . 5 a l g o r i t m 。t h h e p r o p o s e d a l g o r i t h m h a s a h i g h e r p r e d i c t i o n
张文超 , 李亚芬 , 王 普
( 北京 工业 大 学 电子 信 息与控 制 工程 学院 ,北京 1 0 0 1 2 4 )
摘 要 :为 了解决决策树 c 4 . 5算法生成 的决策树 过度 拟合训 练样本 ,泛化 能 力低 的 问题 ,提 出了一 种基 于贝叶斯理论 的 决策树后 剪枝 算法 。该算法利用 贝叶斯后验定律 ,对 决策树 c 4 . 5算法 所生成 的决策树 的每一 个分枝进行 验证 ,将 不能满 足 条件 的分枝从该决策树 中去除 ,生成一个 简单 的树 。对 北京 市重 点学科信 息平 台和硕 、博 授予 点平 台提 供的 学科 历史审 批数据进行 实验验证 。实验结果表 明,该算法可 以剪掉 大多数不 可靠分枝 和过拟合 分枝 ,较 决策树 C 4 . 5算 法对新数 据的
2 0 1 3 年 1 1 月
计 算机 工 程 与 设 计
COM P UTE R ENGI NEE RI NG AND DES I GN
N ov e . 20 13
第3 4卷
第 l 1 期
Vo 1 . 3 4 No . 1 1
贝 叶斯 的决 策树 剪枝 算 法 在 学 科 评 审 中 的研 究
s i o n t r e e .F i n a l l y a s i mp l e d e c i s i o n t r e e i s g e n e r a t e d .T h e p r o p o s e d a l g o r i t h m i s v e r i f i e d b y t h e d a t a p r o v i d e d b y t h e B e i j i n g k e y
Ab s t r a c t : To s o l v e t h e p r o b l e ms t h a t t h e d e c i s i o n t r e e c r e a t e d b y C4 . 5 a l g o r i t h m k e e p s o v e r it f i n g t h e t r a i n i n g d a t a a n d h a s we a k g e n e r a l i z a t i o n a b i l i t y ,a p o s t - p r u n i n g d e c i s i o n t r e e a l g o r i t h m b a s e d o n B a y e s i a n t h e o r y i s p r o p o s e d .Ba y e s i a n t h e o r e m i s u s e d t o
Z H ANG w e n - c h a o,LI Ya - f e n,W ANG Pu
( C o l l e g e o f E l e c t r o n i c I n f o r ma t i o n a n d C o n t r o l E n g i n e e r i n g , B e i j i n g Un i v e r s i t y o f T e c h n o l o g y , B e i j i n g 1 0 0 1 2 4 ,C h i n a )
v a l i d a t e t h e e a c h b r a n c h o f t h e d e c i s i o n t r e e .An d t h e n t h o s e b r a n c h e s t h a t d o n o t me e t t h e c o n d i t i o n s a r e r e mo v e d f r o m t h e d e c i —
Re s e a r c h o f p o s t — p r u n i n g d e c i s i o n t r e e a l g o r i t h m b a s e d o n
Ba y e s i a n t h e o r y i n d i s c i p l i n e e v a l u a t i o n
d i s c i p l i n e s p l a t f o r r n a n d t h e Be i j i n g Ma s t e r a n d Do c t e r p l a t f o r m.Th e e x p e r i me n t a l r e s u l t s h o ws t h a t t h e a l g o r i t m h c a n c u t t h e
分 类 有 着 更 高的 预 测 精 度 。
关键词 :决策树 C 4 . 5 ;后剪枝 ;数据挖掘 ;决策支持
中 图 法 分 类 号 :T P 1 8 1 文 献 标 识 号 :A 文 章 编 号 :1 0 0 0 — 7 0 2 4( 2 0 1 3 )1 1 — 3 8 7 3 — 0 5
相关文档
最新文档