id3决策树算法例题

合集下载

机器学习--决策树算法（ID3C4.5）

机器学习--决策树算法（ID3C4.5）在⽣活中，“树”这⼀模型有很⼴泛的应⽤，事实证明，它在机器学习分类和回归领域也有着深刻⽽⼴泛的影响。

在决策分析中，决策树可以明确直观的展现出决策结果和决策过程。

如名所⽰，它使⽤树状决策模型。

它不仅仅是在数据挖掘中⽤户获取特定⽬标解的策略，同时也被⼴泛的应⽤于机器学习。

如何使⽤树来表⽰算法为此，我们考虑使⽤泰坦尼克号数据集的⽰例，以预测乘客是否会⽣存。

下⾯的模型使⽤数据集中的3个特征/属性/列，即性别，年龄和SIBSP（配偶或⼉童的数量）。

这是⼀棵体现了⼈性光辉的决策树。

树的形状是⼀棵上下颠倒的决策树，叶⼦节点在下，根节点在上。

在图像中，⿊⾊中的粗体⽂本表⽰条件/内部节点，基于树分成分⽀/边缘。

不再分裂的分⽀结束是决策/叶⼦，在这种情况下，乘客是否被死亡或幸存，分别表⽰为红⾊和绿⾊⽂本。

虽然，⼀个真实的数据集将有很多功能，这只是⼀个更⼤的树中的部分分⽀，但你不能忽略这种算法的简单性。

该特征重要性是明确的，可以轻易查看决策关系。

该⽅法更常见于来⾃数据的学习决策树，并且在树上被称为分类树，因为⽬标是将乘客分类为幸存或死亡，上⾯所展⽰的决策树就是分类树。

回归树以相同的⽅式表⽰，例如⽤于预测房⼦价格的连续价值。

通常，决策树算法被称为CART或分类和回归树。

那么，算法⽣成的背后发⽣了什么呢？如何⽣成⼀个决策树取决于选择什么特征和在何种情况下进⾏分裂，以及在什么时候停⽌。

因为⼀棵树通常是随意⽣长的，你需要修剪它，让它看起来漂亮（研究如何⽣成决策树）。

ID3算法ID3算法⽣成决策树ID3算法（Iterative Dichotomiser 3）是决策树⽣成算法的⼀种，基于奥卡姆剃⼑原理(简约原则) 1。

是Ross Quinlan发明的⼀种决策树算法，这个算法的基础就是上⾯提到的奥卡姆剃⼑原理，越是⼩型的决策树越优于⼤的决策树，尽管如此，也不总是⽣成最⼩的树型结构，⽽是⼀个启发式算法。

决策树ID3例题经典案例

决策树ID3例题经典案例
决策树ID3例题是探究决策树原理的经典案例。

它的主要内容是利用决策树对一组状态变量输入，按照规则变化，最终得出一组结论。

决策树ID3例题的经典案例如下：
假设有一组客户，他们的信息如下：
客户年龄收入是否有孩子是否有信用卡
A 35 150 有有
B 25 100 有无
C 60 150 无有
D 35 200 无有
这个案例中，状态变量为年龄、收入、是否有孩子、是否有信用卡，如果想要利用决策树分析得出最终结论，可以根据如下规则进行对比：
（1）根据年龄，将客户分为年轻客户和中老年客户；
（2）根据收入，将客户分为低收入和高收入；
（3）根据是否有孩子，将客户分为家庭客户和非家庭客户；
（4）根据是否有信用卡，将客户分为信用良好客户和信用较差客户。

以上就是用决策树ID3例题的经典案例，通过综合分析多个状态变量，最终得出一组划分客户的结论，以便采取相应的策略。

- 1 -。

仿照例题,使用id3算法生成决策树

标题：使用ID3算法生成决策树一、概述在机器学习领域，决策树是一种常见的分类和回归算法。

它基于一系列属性对数据进行划分，最终生成一棵树状图来表示数据的分类规则。

在本文中，我们将介绍ID3算法，一种经典的决策树生成算法，并演示如何使用ID3算法生成决策树。

二、ID3算法概述ID3算法是一种基于信息论的决策树生成算法，其全称为Iterative Dichotomiser 3。

它由Ross Quinlan于1986年提出，是C4.5算法的前身。

ID3算法的核心思想是在每个节点选择最佳的属性进行划分，使得各个子节点的纯度提高，从而最终生成一棵有效的决策树。

ID3算法的主要步骤包括计算信息增益、选择最佳属性、递归划分数据集等。

在这一过程中，算法会根据属性的信息增益来确定最佳的划分属性，直到满足停止条件为止。

三、使用ID3算法生成决策树的步骤使用ID3算法生成决策树的步骤如下：1. 收集数据集：需要收集一个包含多个样本的数据集，每个样本包含多个属性和一个类别标签。

2. 计算信息增益：对每个属性计算信息增益，信息增益越大表示该属性对分类的贡献越大。

3. 选择最佳属性：选择信息增益最大的属性作为当前节点的划分属性。

4. 划分数据集：根据选择的属性值将数据集划分成若干子集，每个子集对应属性的一个取值。

5. 递归生成子节点：对每个子集递归调用ID3算法，生成子节点，直到满足停止条件。

6. 生成决策树：将所有节点连接起来，生成一棵完整的决策树。

四、使用ID3算法生成决策树的示例为了更好地理解ID3算法的生成过程，我们以一个简单的示例来说明。

假设有一个包含天气、温度和湿度三个属性的数据集，我们希望使用ID3算法生成一个决策树来预测是否适合外出活动。

我们需要计算每个属性的信息增益。

然后选择信息增益最大的属性进行划分，将数据集划分成若干子集。

接着递归调用ID3算法，直到满足停止条件为止。

经过计算和递归划分，最终我们得到一棵决策树，可以根据天气、温度和湿度来预测是否适合外出活动。

决策树系列（三）——ID3

决策树系列（三）——ID3预备知识：初识ID3回顾决策树的基本知识，其构建过程主要有下述三个重要的问题：（1）数据是怎么分裂的（2）如何选择分类的属性（3）什么时候停⽌分裂从上述三个问题出发，以实际的例⼦对ID3算法进⾏阐述。

例：通过当天的天⽓、温度、湿度和季节预测明天的天⽓表1 原始数据当天天⽓温度湿度季节明天天⽓晴2550春天晴阴2148春天阴阴1870春天⾬晴2841夏天晴⾬865冬天阴晴1843夏天晴阴2456秋天晴⾬1876秋天阴⾬3161夏天晴阴643冬天⾬晴1555秋天阴⾬458冬天⾬1.数据分割对于离散型数据，直接按照离散数据的取值进⾏分裂，每⼀个取值对应⼀个⼦节点，以“当前天⽓”为例对数据进⾏分割，如图1所⽰。

对于连续型数据，ID3原本是没有处理能⼒的，只有通过离散化将连续性数据转化成离散型数据再进⾏处理。

连续数据离散化是另外⼀个课题，本⽂不深⼊阐述，这⾥直接采⽤等距离数据划分的李算话⽅法。

该⽅法先对数据进⾏排序，然后将连续型数据划分为多个区间，并使每⼀个区间的数据量基本相同，以温度为例对数据进⾏分割，如图2所⽰。

2. 选择最优分裂属性ID3采⽤信息增益作为选择最优的分裂属性的⽅法，选择熵作为衡量节点纯度的标准，信息增益的计算公式如下：其中，表⽰⽗节点的熵；表⽰节点i的熵，熵越⼤，节点的信息量越多，越不纯；表⽰⼦节点i的数据量与⽗节点数据量之⽐。

越⼤，表⽰分裂后的熵越⼩，⼦节点变得越纯，分类的效果越好，因此选择最⼤的属性作为分裂属性。

对上述的例⼦的跟节点进⾏分裂，分别计算每⼀个属性的信息增益，选择信息增益最⼤的属性进⾏分裂。

天⽓属性：（数据分割如上图1所⽰）温度：（数据分割如上图2所⽰）湿度：季节：由于最⼤，所以选择属性“季节”作为根节点的分裂属性。

3.停⽌分裂的条件停⽌分裂的条件已经在决策树中阐述，这⾥不再进⾏阐述。

（1）最⼩节点数当节点的数据量⼩于⼀个指定的数量时，不继续分裂。

决策树id3算法例题

决策树id3算法例题决策树ID3算法是一种常用的分类算法，用于根据已知的一组特征和标签数据，构建一个决策树模型来进行分类预测。

下面我将以一个示例来介绍决策树ID3算法的基本步骤和过程。

假设我们想要构建一个决策树模型来帮助我们判断一个人是否会购买一款新的智能手机。

我们已经收集了一些关于个体的特征数据和对应的购买结果数据，包括性别、年龄、收入和是否购买。

首先，我们需要计算每个特征对于分类结果的信息增益。

信息增益是指通过使用某个特征来对数据进行分类，所能获得的关于数据的新的信息量。

计算信息增益的公式如下：信息增益 = 熵(D) - ∑(Dv/D) * 熵(Dv)其中，熵(D)表示数据集D的混乱程度，熵的计算公式为：熵(D) = - ∑(pi * log2(pi))Dv表示特征A的某个取值，D表示数据集D的标签集合，pi表示标签i在数据集D中的比例。

我们首先计算整个数据集的熵D，然后计算每个特征的条件熵，最后将它们相加得到信息增益。

选择信息增益最大的特征作为当前节点的划分特征。

接下来，我们根据选择的特征将数据集划分成不同的子集。

每个子集都对应一个特征值的取值，例如性别特征可能有男和女两个取值。

我们对每个子集重复上述过程，以递归的方式构建子树。

在每个子树中，我们需要选择一个特征进行划分。

如果所有的特征都已经使用完毕，或者剩余的数据集已经完全属于同一类别，那么我们停止划分，将当前节点标记为叶节点，并将最常见的类别作为该节点的预测结果。

否则，我们选择信息增益最大的特征作为当前节点的划分特征，并继续递归构建子树。

最终，我们得到了一个完整的决策树模型。

我们可以使用该模型来对新的个体进行分类预测。

从根节点开始，根据个体的特征值选择相应的子节点，直到到达叶节点，将叶节点的预测结果作为最终的分类结果。

在本示例中，决策树模型可能会根据最佳特征先根据性别划分，接着根据年龄划分，最后根据收入划分。

我们可以根据决策树模型将一个新的个体划分到某个叶节点，并预测其是否会购买手机。

决策树ID3算法的实例解析

根据票数排名筛选出10大算法 (如果票数相同，则按字母顺序进行排名)
数据挖掘10大算法产生过程
1 2 3 4
三步鉴定流程 18种通过审核的候选算法算法陈述数据挖掘10大算法：一览
5
开放式讨论
18种通过审核的候选算法
§分类(Classification)
1. C4.5: Quinlan, J. R. 1993. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers Inc. 2. CART: L. Breiman, J. Friedman, R. Olshen, and C. Stone. Classification and Regression Trees. Wadsworth, Belmont, CA, 1984. 3. K Nearest Neighbours (kNN): Hastie, T. and Tibshirani, R. 1996. Discriminant Adaptive Nearest Neighbor Classification. IEEE Trans. Pattern Anal. Mach. Intell. (TPAMI). 18, 6 (Jun. 1996), 607-616. 4. Naive Bayes Hand, D.J., Yu, K., 2001. Idiot's Bayes: Not So Stupid After All? Internat. Statist. Rev. 69, 385-398.
共有145人参加了ICDM 2006 Panel (会议的专题讨论),并对18种候选算法进行投票，选出了数据挖掘10大算法
排名挖掘主题

1实验1-ID3算法填空及决策树构建

1实验1-ID3算法填空及决策树构建姓名：蔡菲菲学号：22015045填空，将答案直接填写在横线上。

1. ID3 算法是⼀个众所周之的决策树算法，该算法是澳⼤利亚悉尼⼤学的Ross Quinlan 于1986年提出，也是国际上最早、最有影响⼒的决策树算法。

2. 信息量的单位是位。

3. 熵是系统混乱程度的统计量。

熵越⼤，表⽰系统混乱程度越⼤。

4. 熵的计算公式为：∑=-=mi i i p p D Info 12)(log )(，那么投掷硬币这⼀⾏为的信息含量就是多少？ 15. 决策树算法的关键在于如何选择⼀个分裂属性形成决策树的决策节点，并从当前节点⽣成决策分枝。

在选择某⼀分裂属性作为决策节点时，通常希望该属性能够最⼤程度地反映训练样本集的分类特征。

在ID3算法中，决策节点属性的选择运⽤了信息论中的熵概念作为启发式函数。

在这种属性选择⽅法中，选择具有最⼤信息增益的属性作为当前划分节点。

6. 设数据划分D 为类标记的元组的训练集。

假定类标号属性具有M 个不同值，定义m 个不同的类C i （I ＝1，2，…，m ），C i,D 是C i 类的元组的集合。

D 和D Ci ,分别表⽰D 和C i,D 中元组的个数。

对D 中的元组分类所需的期望信息由下式给出：∑=-=mi i i p p D Info 12)(log )(假设属性A 具有v 个不同的离散属性值，可使⽤属性A 把数据集D 划分成v 个⼦集{D 1, D 2，…D v }。

设⼦集D j 中全部的记录数在A 上具有相同的值a j 。

基于按A划分对D 的元组分类所需要的期望信息由下式给出： )( Dj )(1j v j A D Info D D Info ∑=?-=信息增益定义：原来的信息需求（基于类⽐例）与新的信息需求（对A 划分之后得到的）之间的差，即Gain(A)=Info （D ）-Info A （D ）根据以上提⽰计算的：（要求写出计算过程）数据：⼼⾎管病住院患者信息表（D ）类标号属性：住院天数少于两周则Info （D ）= 0.94029分别计算基于性别、主要诊断、⼊院病情、⾼⾎压病史和平时⾝体状况作为划分属性来对D 分类所需要的期望信息值：Info 性别（D ）= 0.69523Info 主要诊断（D ）= 0.836125Info ⼊院病情（D ）= 0.479088Info⾼⾎压病史（D）= 0.894225Info平时⾝体状况（D）= 0.936728根据信息增益定义，我们可以计算出Gain(性别)= 0.245056Gain(主要诊断)=0.106141Gain(⼊院病情)=0.461198Gain(⾼⾎压病史)=0.046061Gain(平时⾝体状况)=0.003558决策树构建1）将你电脑上⼼⾎管病住院患者信息表.xls 的数据导⼊到SQL server 2005 数据库中以备后期数据挖掘⽤，数据库命名为⼼⾎管病住院患者信息。

分类决策树ID3算法-理论加实例

第6章决策树
决策树基本概念
关于归纳学习(3)
归纳学习由于依赖于检验数据，因此又称为检验学习。归纳学习存在一个基本的假设：
任一假设如果能够在足够大的训练样本集中很好的逼近目标函数，则它也能在未见样本中很好地逼近目标函数。该假定是归纳学习的有效性的前提条件。
第6章决策树
决策树基本概念
关于归纳学习(4)
第 6 章决策树
决策树基本概念决策树算法决策树研究问题
主要内容
决策树基本概念决策树算法决策树研究问题
第6章决策树
关于分类问题
决策树基本概念
分类（Classification）任务就是通过学习获得一个目标函数（Target Function）f, 将每个属性集x映射到一个预先定义好的类标号y。
买
不买
买
在沿着决策树从上到下的遍历过程中，在每个结点都有一个测试。对每个结点上问题的不同测试输出导致不同的分枝，最后会达到一个叶子结点。这一过程就是利用决策树进行分类的过程，利用若干个变量来判断属性的类别
第6章决策树
决策树算法
CLS（Concept Learning System）算法
CLS算法是早期的决策树学习算法。它是许多决策树学习算法的基础。
归类：买计算机？
不买不买买买买不买买不买买买买买买不买买
假定公司收集了左表数据，那么对于任意给定的客人（测试样例），你能帮助公司将这位客人归类吗？
即：你能预测这位客人是属于“买” 计算机的那一类，还是属于“不买” 计算机的那一类？
又：你需要多少有关这位客人的信息才能回答这个问题？
3、可自动忽略目标变量没有贡献的属性变量，也为判断属性变量的重要性，减少变量的数目提供参考。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

ID3决策树算法例题
简介
决策树是一种常见的机器学习算法，用于解决分类和回归问题。

其中，ID3（Iterative Dichotomiser 3）决策树算法是最早被提出的决策树算法之一。

本文将以一个例题为例，深入探讨ID3决策树算法的原理和应用。

例题描述
假设我们要根据以下特征来判断一个水果是苹果还是橘子： 1. 颜色：红、橙 2. 直径：大、中等、小 3. 纹理：平滑、凹凸
我们已经收集到了一些水果的样本数据，如下所示：
编号颜色直径纹理类别
1 红大平滑苹果
2 红大凹凸苹果
3 橙大平滑橘子
4 橙小平滑橘子
5 红中等平滑苹果
我们希望构建一个决策树模型，通过输入颜色、直径和纹理这3个特征，能够预测水果的类别。

ID3决策树算法原理
ID3决策树算法的核心思想是选择每次划分时信息增益最大的特征作为决策节点。

它采用自顶向下的贪心策略，递归地构建决策树。

下面详细介绍ID3算法的原理。

1. 计算信息熵
首先，我们需要计算每个特征的信息熵，以此来衡量特征对分类结果的纯度影响。

信息熵的计算公式如下：
H (D )=−∑p i N
i=1
log 2p i
其中，H (D )表示数据集D 的信息熵，N 表示类别的个数，p i 表示类别i 在数据集D 中的比例。

2. 计算信息增益
接下来，对于每个特征A ，我们需要计算其信息增益Gain (D,A )。

信息增益是指特征A 对于数据集D 的纯度提升程度，计算公式如下：
Gain (D,A )=H (D )−∑
|D v ||D |
V
v=1H (D v ) 其中，V 表示特征A 的取值个数，D v 表示特征A 取值为v 的样本子集。

3. 选择最佳划分特征
根据计算得到的信息增益，选择信息增益最大的特征作为决策节点。

4. 递归构建决策树
将选择的特征作为决策节点，以该特征的不同取值作为分支，递归地构建决策树。

计算步骤
根据上面的原理，我们来逐步计算示例中的决策树。

1. 计算初始数据集的信息熵H (D )
根据表格中的数据，我们可以计算出初始数据集的信息熵H (D )，其中苹果出现的
概率为35，橘子出现的概率为25。

根据信息熵的计算公式，可以得到H (D )=
−(35log 235+25log 225)。

2. 计算每个特征的信息增益
接下来，我们需要计算每个特征的信息增益。

颜色特征
颜色特征有2个取值：红和橙。

根据这两个取值分割数据集，我们计算出红色的水
果出现的概率为35，橙色的水果出现的概率为25，再根据信息熵的计算公式，可以得
到红色特征的信息熵H (D 红)=−(35log 235+25log 225)。

同样地，我们计算出橙色特征的信息熵H(D 橙)=−(15log 215+45log 245)。

根据信息增益的计算公式，我们可以得到颜色特征的信息增益Gain (D,颜色)=
H (D )−510H (D 红)−510H(D 橙)。

直径特征
直径特征有3个取值：大、中等、小。

根据这3个取值分割数据集，我们可以计算
出大直径的水果出现的概率为25，中等直径的水果出现的概率为15，小直径的水果出
现的概率为25，再根据信息熵的计算公式，可以得到直径特征的信息熵H (D 大)=−(15log 215+45log 245)。

同样地，我们可以得到中等直径特征的信息熵H(D 中等)=−(15log 215+45log 245)，小直径特征的信息熵H (D 小)=−(15log 215+45log 245)。

根据信息增益的计算公式，我们可以得到直径特征的信息增益Gain (D,直径)=
H (D )−510H (D 大)−210H(D 中等)−310H (D 小)。

纹理特征
纹理特征有2个取值：平滑和凹凸。

根据这2个取值分割数据集，我们可以计算出
平滑纹理的水果出现的概率为45，凹凸纹理的水果出现的概率为15，再根据信息熵的
计算公式，可以得到纹理特征的信息熵H (D 平滑)=−(35log 235+25log 225)。

同样地，我们可以得到凹凸纹理特征的信息熵H (D 凹凸)=−(15log 215+45log 245)。

根据信息增益的计算公式，我们可以得到纹理特征的信息增益Gain (D,纹理)=
H (D )−510H (D 平滑)−510H (D 凹凸)。

3. 选择最佳划分特征
根据上面计算得到的信息增益，我们可以比较三个特征的信息增益大小，选择信息增益最大的特征作为决策节点。

在这个例题中，直径特征的信息增益最大，因此我们选择直径作为决策节点。

4. 递归构建决策树
在选择了直径特征作为决策节点后，我们根据直径特征的不同取值（大、中等、小）划分数据集，得到三个子集。

对于每个子集，我们可以再次计算特征的信息增益，并选择信息增益最大的特征作为该子集的决策节点。

我们继续递归地进行这个过程，直到所有数据子集都属于同一类别或没有更多特征可供划分。

最终构建得到的决策树如下所示：
决策节点：直径
- 大
- 类别：苹果
- 中等
- 类别：苹果
- 小
- 纹理
- 平滑
- 类别：苹果
- 凹凸
- 类别：橘子
总结
本文以一个例题为例，详细介绍了ID3决策树算法的原理和应用过程。

ID3算法是
一种自顶向下的贪心策略，通过计算信息增益来选择最佳划分特征，并根据划分特征递归构建决策树。

通过这个例题，我们可以更加深入地理解ID3决策树算法的计算过程和决策树构建的原理。