决策树分析方法PPT(共39页)
合集下载
决策树分析方法ppt

全局最优
通过剪枝等技术来优化决 策树,以获得全局最优解 (最小损失函数值)。
决策树的预测原理
特征选择
使用训练好的决策树模型对新 的样本进行预测时,需要根据 模型中保存的特征选择规则进
行预测。
路径搜索
从根节点开始,根据模型中保存 的分裂准则和分裂点信息,沿着 树结构向下搜索,直到到达叶子 节点或无法继续分裂的节点。
CART算法步骤
划分数据集、对每个属性计算其划分能力、选择划分能力最大的属性、生成决策 节点、递归生成决策树。
随机森林算法
随机森林算法原理
基于多棵决策树的投票策略,通过训练多棵决策树,然后对 结果进行投票,以得到更加准确的结果。
随机森林算法步骤
数据集随机化、生成多棵决策树、对结果进行投票、选择票 数最多的结果作为输出。
01
02
03
04
总结词:差异对比、应用场景
线性回归是一种基于因变量和 一个或多个自变量之间关系的 预测模型,通常适用于连续目 标变量。
决策树是一种基于自上而下的 贪心搜索算法,将数据集划分 成若干个不相交的子集,每个 子集对应一个决策节点,从而 形成一棵树状结构。
在回归问题上,决策树不如线 性回归表现稳定,但在分类问 题上,决策树表现更优秀,可 以很好地处理非线性关系和异 常值。
C4.5算法
C4.5算法原理
在ID3算法的基础上,增加了剪枝、处理缺失值和连续属性等处理,以得到 更加准确的决策树。
C4.5算法步骤
计算各个属性的信息增益率、选择信息增益率最大的属性、生成决策节点、 递归生成决策树、剪枝处理。
CART算法
CART算法原理
基于二叉树的贪心策略,将数据集划分为两个子集,然后对每个子集递归生成决 策树。
决策树算法(PPT36页)

第七章 决策树和决策规则
本章目标 分析解决分类问题的基于逻辑的方法的特
性. 描述决策树和决策规则在最终分类模型中
的表述之间的区别. 介绍C4.5算法. 了解采用修剪方法降低决策树和决策规则
的复杂度.
决策树和决策规则是解决实际应用中分类 问题的数据挖掘方法。
一般来说,分类是把数据项映射到其中一 个事先定义的类中的这样一个学习函数的 过程。由一组输入的属性值向量(也叫属性 向量)和相应的类,用基于归纳学习算法得 出分类。
单按上面方式计算。下面先介绍一下C4.5 算法中一般包含3种类型的检验结构:
1.离散值的“标准”检验,对属性的每个可 能值有一个分枝和输出。
2.如果属性Y有连续的数值,通过将该值和阈 值Z比较,用输出Y≤Z和Y>Z定义二元检验。
3.基于离散值的更复杂的检验,该检验中属 性的每个可能值被分配到许多易变的组中, 每组都有一个输出和分枝。
7.2 C4.5算法:生成一个决策树
C4.5算法最重要的部分是由一组训练样本 生成一个初始决策树的过程。决策树可以 用来对一个新样本进行分类,这种分类从 该树的根节点开始,然后移动样本直至达 叶节点。在每个非叶决策点处,确定该节 点的属性检验结果,把注意力转移到所选 择子树的根节点上。
例如,如图7-3a为决策树分类模型,待分 类有样本如图7-3b所示,由决策树分类模 型可得出待分类样本为类2。(节点A,C,F(叶 节点))
=0.694
相应的增益: Gain(x1)=0.94-0.694=0.246
按属性3分区可得子集的熵的加权和:
infox2(T)=6/14(-3/6log2(3/6)-3/6log2(3/6)) +8/14(-6/8log2(6/8)-2/8log2(2/8))
本章目标 分析解决分类问题的基于逻辑的方法的特
性. 描述决策树和决策规则在最终分类模型中
的表述之间的区别. 介绍C4.5算法. 了解采用修剪方法降低决策树和决策规则
的复杂度.
决策树和决策规则是解决实际应用中分类 问题的数据挖掘方法。
一般来说,分类是把数据项映射到其中一 个事先定义的类中的这样一个学习函数的 过程。由一组输入的属性值向量(也叫属性 向量)和相应的类,用基于归纳学习算法得 出分类。
单按上面方式计算。下面先介绍一下C4.5 算法中一般包含3种类型的检验结构:
1.离散值的“标准”检验,对属性的每个可 能值有一个分枝和输出。
2.如果属性Y有连续的数值,通过将该值和阈 值Z比较,用输出Y≤Z和Y>Z定义二元检验。
3.基于离散值的更复杂的检验,该检验中属 性的每个可能值被分配到许多易变的组中, 每组都有一个输出和分枝。
7.2 C4.5算法:生成一个决策树
C4.5算法最重要的部分是由一组训练样本 生成一个初始决策树的过程。决策树可以 用来对一个新样本进行分类,这种分类从 该树的根节点开始,然后移动样本直至达 叶节点。在每个非叶决策点处,确定该节 点的属性检验结果,把注意力转移到所选 择子树的根节点上。
例如,如图7-3a为决策树分类模型,待分 类有样本如图7-3b所示,由决策树分类模 型可得出待分类样本为类2。(节点A,C,F(叶 节点))
=0.694
相应的增益: Gain(x1)=0.94-0.694=0.246
按属性3分区可得子集的熵的加权和:
infox2(T)=6/14(-3/6log2(3/6)-3/6log2(3/6)) +8/14(-6/8log2(6/8)-2/8log2(2/8))
高中信息技术浙教版:决策树教学课件(共27张PPT)

第五步:使用Python库测试结果可视化
第一步:收集数 据
第三步:向Python导入 数据
第四步:使用Python库sklearn训练
第二步:分割数据
课堂小结
一、2017年度重点工作项目完成情况
1 决策树分类概念 2 构建决策树
3 举例说明:鸢尾花分类
备未用来:的深深度度学学习习:人工智能
展望与挑战
“温度”是多余的特点
如何判断某一天游客是否会来游乐场游玩?
天气、温度、湿度
2.4.1决策树分类概念
建立决策树的过程 选择一个属性值,基于这个属性对样本集进行划分,得到子集划分结果。
再选择其他属性,对得到的划分结果进行划分,直至最后所得划分结果中每 个样本为同一个类别。
2.4.2构建决策树
构建决策树来解决实际生活中的问题时,需按照一定的顺序选择划分属 性。通常,性能好的决策树随着划分不断进行,决策树分支节点的“纯度” 会越来越高,即其所包含样本尽可能属于相同类别。为了逐次选出最优属 性,可以采用信息增益(informationgain)这一指标。
2.4.2构建决策树
练一练: 1.计算表2.4.1中温度高低、湿度大小、风力强弱三个气象特点的信息增益。
思考: 将天气状况、温度高低、湿度大小、风力强弱作为分支点来构造图2.4.1决策
树时,是否信息增益大的气象特点离根节点越近?
【练一练】: 如下表所示,每朵鸢尾花有萼片长度、萼片宽度、花瓣长度、花瓣宽度四个
4个属性 1个标签 1 Label 4 Features 用来标记种类
序号 Index 0-149, 一共150个样本
基于鸢尾花数据集
例:鸢尾花数据集是常用的分类实验数据集,由Fisher1936收集整理。 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含 150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通 过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于 (Sentosa 0,Versicolor 1,Virginia 2)三个种类中的哪一类。
第一步:收集数 据
第三步:向Python导入 数据
第四步:使用Python库sklearn训练
第二步:分割数据
课堂小结
一、2017年度重点工作项目完成情况
1 决策树分类概念 2 构建决策树
3 举例说明:鸢尾花分类
备未用来:的深深度度学学习习:人工智能
展望与挑战
“温度”是多余的特点
如何判断某一天游客是否会来游乐场游玩?
天气、温度、湿度
2.4.1决策树分类概念
建立决策树的过程 选择一个属性值,基于这个属性对样本集进行划分,得到子集划分结果。
再选择其他属性,对得到的划分结果进行划分,直至最后所得划分结果中每 个样本为同一个类别。
2.4.2构建决策树
构建决策树来解决实际生活中的问题时,需按照一定的顺序选择划分属 性。通常,性能好的决策树随着划分不断进行,决策树分支节点的“纯度” 会越来越高,即其所包含样本尽可能属于相同类别。为了逐次选出最优属 性,可以采用信息增益(informationgain)这一指标。
2.4.2构建决策树
练一练: 1.计算表2.4.1中温度高低、湿度大小、风力强弱三个气象特点的信息增益。
思考: 将天气状况、温度高低、湿度大小、风力强弱作为分支点来构造图2.4.1决策
树时,是否信息增益大的气象特点离根节点越近?
【练一练】: 如下表所示,每朵鸢尾花有萼片长度、萼片宽度、花瓣长度、花瓣宽度四个
4个属性 1个标签 1 Label 4 Features 用来标记种类
序号 Index 0-149, 一共150个样本
基于鸢尾花数据集
例:鸢尾花数据集是常用的分类实验数据集,由Fisher1936收集整理。 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含 150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通 过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于 (Sentosa 0,Versicolor 1,Virginia 2)三个种类中的哪一类。
决策树ppt课件

建设小工厂投资280万元,如销路好,3年后扩建,扩 建需要投资400万元,可使用7年,每年赢利190万元。 不扩建则每年赢利80万元。如销路不好则每年赢利60 万元。
试用决策树法选出合理的决策方案。 经过市场调查, 市场销路好的概率为0.7,销路不好的概率为0.3。
15
680万元 2
建大厂
该承包商过去也承包过与A、B类似的工程,根 据统计资料,每种方案的利润和出现的概率如 下表所示。投标不中时,则对A损失50万元, 对B损失100万元。根据上述情况,试画出决 策树
11
方案 A高 A低 B高 B低
效果
优 一般 赔 优 一般 赔 优 一般 赔 优 一般 赔
可能的利润(万元)
5000 1000 -3000 4000 500 -4000 7000 2000 -3000 6000 1000 -1000
10
例2
某承包商拥有的资源有限,只能在A和B两个工 程中选A或B进行投标,或者对这两项工程都不 参加投标。
但根据过去该承包商投标经验资料,他对A或B 投标又有两种策略:一种是投高标,中标的机会 是0.3;另一种是投低标,中标的机会是0.5。 这样共有A高、A低、不投、B高和B低五种方 案。
叫做方案枝; C、在每个方案枝的末端画一个圆圈,这个圆
圈称为概率分叉点,或自然状态点; D、从自然状态点引出代表各自然状态的分枝,
称为概率分枝; E、如果问题只需要一级决策,则概率分枝末
端画三角形,表示终点 。
3
1
决策 结点
概率分叉点
(自然状态点) 概率枝
方案分枝 2
概率枝
方案分枝
概率枝
益期望值分别为125、0、620和1100。 至此,承包商可做出决策,如投A工程,
试用决策树法选出合理的决策方案。 经过市场调查, 市场销路好的概率为0.7,销路不好的概率为0.3。
15
680万元 2
建大厂
该承包商过去也承包过与A、B类似的工程,根 据统计资料,每种方案的利润和出现的概率如 下表所示。投标不中时,则对A损失50万元, 对B损失100万元。根据上述情况,试画出决 策树
11
方案 A高 A低 B高 B低
效果
优 一般 赔 优 一般 赔 优 一般 赔 优 一般 赔
可能的利润(万元)
5000 1000 -3000 4000 500 -4000 7000 2000 -3000 6000 1000 -1000
10
例2
某承包商拥有的资源有限,只能在A和B两个工 程中选A或B进行投标,或者对这两项工程都不 参加投标。
但根据过去该承包商投标经验资料,他对A或B 投标又有两种策略:一种是投高标,中标的机会 是0.3;另一种是投低标,中标的机会是0.5。 这样共有A高、A低、不投、B高和B低五种方 案。
叫做方案枝; C、在每个方案枝的末端画一个圆圈,这个圆
圈称为概率分叉点,或自然状态点; D、从自然状态点引出代表各自然状态的分枝,
称为概率分枝; E、如果问题只需要一级决策,则概率分枝末
端画三角形,表示终点 。
3
1
决策 结点
概率分叉点
(自然状态点) 概率枝
方案分枝 2
概率枝
方案分枝
概率枝
益期望值分别为125、0、620和1100。 至此,承包商可做出决策,如投A工程,
决策树分析方法PPT课件( 39页)

• 提供快捷、口径一致的分析模式
• 适用于对银行盈利能力数量分析,根据影响指 标相关要素的数量变化,探求各要素变化的原 因以及影响程度
• 同样的方法也可运用于银行其他情况的分析
2019/6/23
3
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
本季度
上季度
第一步 第二步 第三步
初步判断:处于平均水平
2019/6/23
22
分析结论一─对当期盈利分析
• 计算数据显示该银行的盈利比率为 1.28%,同类型银行的平均数为1.29% ,表明该银行居于同类型银行的中间位 置
• 该银行的百分比排名为51,表示在同类 型银行中,有49%高于该行的1.28%比 率,而有51%低于该比率
时间点 平均资产 净收入 同类型银行数
该银行 同类型 百分比排名
边际分析 指标对各类平 均资产百分比
贷款分析 指标对各类平 均资产百分比
流动性分析
资本分析
增长比率
2019/6/23
12
分析过程
• 由概要指标开始分析 • 鉴别差异 • 分析差异的原因 • 考虑所有的影响要素 • 深究细节 • 确定问题的根本原因
决策树分析方法─非现
场数据分析法
2019/6/23
1
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
2019/6/23
2
概念和作用
• 决策树分析是数量分析方法
• 决策树是一种树状结构,其分析由树根节点开 始逐层展开,每一分支树枝前后节点具有数量 逻辑关系
• 适用于对银行盈利能力数量分析,根据影响指 标相关要素的数量变化,探求各要素变化的原 因以及影响程度
• 同样的方法也可运用于银行其他情况的分析
2019/6/23
3
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
本季度
上季度
第一步 第二步 第三步
初步判断:处于平均水平
2019/6/23
22
分析结论一─对当期盈利分析
• 计算数据显示该银行的盈利比率为 1.28%,同类型银行的平均数为1.29% ,表明该银行居于同类型银行的中间位 置
• 该银行的百分比排名为51,表示在同类 型银行中,有49%高于该行的1.28%比 率,而有51%低于该比率
时间点 平均资产 净收入 同类型银行数
该银行 同类型 百分比排名
边际分析 指标对各类平 均资产百分比
贷款分析 指标对各类平 均资产百分比
流动性分析
资本分析
增长比率
2019/6/23
12
分析过程
• 由概要指标开始分析 • 鉴别差异 • 分析差异的原因 • 考虑所有的影响要素 • 深究细节 • 确定问题的根本原因
决策树分析方法─非现
场数据分析法
2019/6/23
1
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
2019/6/23
2
概念和作用
• 决策树分析是数量分析方法
• 决策树是一种树状结构,其分析由树根节点开 始逐层展开,每一分支树枝前后节点具有数量 逻辑关系
决策树ppt课件

决策树在分类问题中应用
分类问题背景介绍
分类问题是机器学习中一类重要 的问题,旨在将数据划分为不同
的类别。
在现实世界中,分类问题广泛存 在,如垃圾邮件识别、疾病诊断、
信用评分等。
分类算法的目标是通过学习训练 数据中的特征与类别之间的关系, 从而对新的未知数据进行类别预
测。
决策树在分类问题中优势
直观易理解
决策树在处理缺失值和异常值时容易受到干扰,可能导致模型性能下降。可以通过数据 预处理等方法减少缺失值和异常值对模型的影响。
CART算法实例演示
实例背景
假设有一个关于信用卡欺诈的数据集,包含多个特征(如交 易金额、交易时间、交易地点等)和一个目标变量(是否欺 诈)。我们将使用CART算法构建一个分类模型来预测交易 是否属于欺诈行为。
构建决策树时间较长
C4.5算法在构建决策树时需要计算每 个特征的信息增益比,当数据集较大 或特征较多时,构建决策树的时间可 能会较长。
C4.5算法实例演示
数据集介绍
以经典的鸢尾花数据集为例,该数据集包含150个 样本,每个样本有4个特征(花萼长度、花萼宽度、 花瓣长度、花瓣宽度)和1个标签(鸢尾花的类 别)。
建造年份等特征。
选择合适的决策树算法 (如CART、ID3等),
对数据进行训练。
模型评估与优化
采用均方误差等指标评 估模型性能,通过调整 参数、集成学习等方法
优化模型。
结果展示与解读
展示决策树图形化结果, 解释每个节点含义及预
测逻辑。
08
CATALOGUE
总结与展望
决策树模型总结回顾
模型原理
决策树通过递归方式将数据集划分为若干个子集,每个子 集对应一个决策结果。通过构建树形结构,实现分类或回 归任务。
分类问题背景介绍
分类问题是机器学习中一类重要 的问题,旨在将数据划分为不同
的类别。
在现实世界中,分类问题广泛存 在,如垃圾邮件识别、疾病诊断、
信用评分等。
分类算法的目标是通过学习训练 数据中的特征与类别之间的关系, 从而对新的未知数据进行类别预
测。
决策树在分类问题中优势
直观易理解
决策树在处理缺失值和异常值时容易受到干扰,可能导致模型性能下降。可以通过数据 预处理等方法减少缺失值和异常值对模型的影响。
CART算法实例演示
实例背景
假设有一个关于信用卡欺诈的数据集,包含多个特征(如交 易金额、交易时间、交易地点等)和一个目标变量(是否欺 诈)。我们将使用CART算法构建一个分类模型来预测交易 是否属于欺诈行为。
构建决策树时间较长
C4.5算法在构建决策树时需要计算每 个特征的信息增益比,当数据集较大 或特征较多时,构建决策树的时间可 能会较长。
C4.5算法实例演示
数据集介绍
以经典的鸢尾花数据集为例,该数据集包含150个 样本,每个样本有4个特征(花萼长度、花萼宽度、 花瓣长度、花瓣宽度)和1个标签(鸢尾花的类 别)。
建造年份等特征。
选择合适的决策树算法 (如CART、ID3等),
对数据进行训练。
模型评估与优化
采用均方误差等指标评 估模型性能,通过调整 参数、集成学习等方法
优化模型。
结果展示与解读
展示决策树图形化结果, 解释每个节点含义及预
测逻辑。
08
CATALOGUE
总结与展望
决策树模型总结回顾
模型原理
决策树通过递归方式将数据集划分为若干个子集,每个子 集对应一个决策结果。通过构建树形结构,实现分类或回 归任务。
决策树培训讲义(PPT 49页)

Married 100K No
Single 70K
No
Married 120K No
Divorced 95K
Yes
Married 60K
No
Divorced 220K No
Single 85K
Yes
Married 75K
No
Single 90K
Yes
3. samples = { 2,3,5,6,8,9,10 } attribute_list = { MarSt, TaxInc }
选择TaxInc为最优分割属性:
Refund
Yes
No
NO < 80K
Single TaxInc
MarSt
Married Divorced
>= 80K
NO
YES
▪ 问题1:分类从哪个属性开始?
——选择分裂变量的标准
▪ 问题2:为什么工资以80为界限?
——找到被选择的变量的分裂点的标准( 连续变量情况)
分类划分的优劣用不纯性度量来分析。如果对于所有
分支,划分后选择相同分支的所有实例都属于相同的类,
则这个划分是纯的。对于节点m,令 N m 为到达节点m的训练
实例数,
个实例中
N
i m
个属于Ci
类,而
N
i m
Nm 。如果一
个实例到节点m,则它属于 类的概率估i 计为:
pˆ (Ci
|
x, m)
pmi
N
i m
10
Single 125K No
Married 100K No
Single 70K
No
Married 120K No
决策树ppt

三 实例
决策树算法
2.条件熵计算 ui ui H(U V) P(v ) P( ) log P( 条件熵: j vj 2 vj)
j i
P( ) 属性A1取值vj时,类别ui的条件概率: v v A1=天气的取值:v1=晴,v2=多云,v3=雨 在A1处取值“晴”的例子5个,取值“多云” 的例子4个,取值“雨”的例子5个,故:
决策树简介
划分数据集的大原则就是将无序的 数据变得更加有序。
划分数据集前后信息发生的变化成 为信息增益。
决策树简介
集合信息的度量方式称为香农熵 (熵)
H(U)=- P(u i )log 2 P(u i )
条件熵
H(U V) P(v j ) P(
j i
ui
vj
) log 2 P(
ui
果
—60
A2
状 态
结
0.3
120
点
30
决策树简介
状 态 决策 状 态
代表备选方案 的 经济效果
结
将 每个方案 在 各种 自然状态下 取得的 损益值 标注于 结果节点 的 右端
果
结
最后选择 的 最佳方案
点
决策树简介
决策树的一般流程: (1)收集数据 (2)准备数据 (3)分析数据 (4)训练算法 (5)测试算法 (6)使用算法
某天早晨气候描述为:天气-多云;气温-冷; 湿度-正常;风-无风。 它属于哪类气候呢?要解决这个问题,需要用某 个原则来判定,这个原则来自于大量的实际例子, 从例子中总结出原则,有了原则就可以判定任何 一天的气候了。 每个实体在世界中属于不同的类别,为简单起见, 假定仅有两个类别,分别为P、N。在这种两个类 别的归纳任务中,P类和N类的实体分别称为概念 的正例和反例。将一些已知正例和反例放在一起 便得到训练集。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 例子:该银行净收益率为1.28%,PCT为 51,表示在同类型银行中,有49%的银 行高于该银行1.28%的比率,而有51% 低于该指标。
• 百分比排名高或低不表示状态的好坏
2022/3/22
20
盈利分析─对百分比排名认识
本季度
上季度
2022/3/22
该银行的百分比排名 21
盈利分析比较过程─对当期盈利分析
2022/3/22
25
盈利分析细化─对净利息收入分析
本季度
上季度
利息收入率降低,但支出下降幅度更大,使净利息收入率提高0.23百分
点,同类行提高0.15百分点。利息收入率与支出率下降的原因?
2022/3/22
26
盈利分析细化─利息收入率下降原因
本季度
上季度
平均盈利资产对平均资产比率
• 盈利性资产比率下降:本期比同类型、比上期 • 资产组合出现了什么变化?
2022/3/22
27
盈利分析细化─贷款利息收入边际分析
Current Quarter Previous Quarter
国内贷款 利息收入
国外贷款 利息收入
2022/3/22
28
盈利分析细化─利息支出率下降原因
本季度
上季度
短期非核心负债对总资产比率
• 短期较高成本负债下降减少了利息支出
2022/3/22
2022/3/22
15
盈利的决策树分析法
─简化的概要指标框架
净收入
净利息收入
非利息收入
利息收入 利息支出
非利息支出
贷款拨备
2022/3/22
16
盈利分析─对银行本期数据认识
本季度
上季度
(税后)
该银行税后净收益 对平均资产的比率
2022/3/22
17
平均数
• 同类型银行总合的平均数,是去除头尾 各5%的银行,而进行平均的结果
2022/3/22
13
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
2022/3/22
14
分析示例
• 逐项介绍分析方法
➢ 以净利息收入分析为主线,介绍逐步深入分 析过程
➢ 汇总各项数据分析,探究影响要素与程度 ➢ 得到总体分析结果 ➢ 提出有待进一步了解的问题
2022/3/22
4
决策树结构初识 (网址:)
净收入
净利息收入
以上各项是对收入的影响要素
2022/3/22
5
决策树结构简图
净收入
2022/3/22
+净利息收入 +非利息收入 -非利息支出
为便于建立数量关系和 比较,所有指标都是对 平均资产的比率,后续 树枝的指标一般为比率
本季度
上季度
第一步 第二步 第三步
初步判断:处于平均水平
2022/3/22
22
分析结论一─对当期盈利分析
• 计算数据显示该银行的盈利比率为 1.28%,同类型银行的平均数为1.29% ,表明该银行居于同类型银行的中间位 置
• 该银行的百分比排名为51,表示在同类 型银行中,有49%高于该行的1.28%比 率,而有51%低于该比率
-准备金
各树枝细化。以净 利息收入为例
+银行账户净收入
+交易账户净收入
+其他净收入
-适用所得税
6
决策树分枝示例─利息收入与支出
利息收入
净利息收入 利息支出
2022/3/22
7
决策树分枝示例─利息支出
存款类利息 支出
利息支出 其他付息负 债利息支出
2022/3/22
8
决策树分枝示例─完全净利息收入树枝
2022/3/22
23
盈利分析比较过程─与前期比较分析
本季度
上季度
比较结论:比前期提高
2022/3/22
24
分析结论二─对前期比较分析
• 自身比较,该银行盈利比率由0.99%提 高到1.28%
• 与同类型银行比较,该银行的百分比排 名由上期的33提高到51,在同类银行中 的盈利能力有所增强
• 这种状况的原因?需要进一步分析:沿 树枝细化分析
• 提供快捷、口径一致的分析模式
• 适用于对银行盈利能力数量分析,根据影响指 标相关要素的数量变化,探求各要素变化的原 因以及影响程度
• 同样的方法也可运用于银行其他情况的分析
2022/3/22
3
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
• 设计分析指标,确定相关指标之间的数量关系
• 构造指标的层次关系,用以分析各要素的影响 程度
• 计算机系统实现指标计算,并以易于阅读的方 式列示计算结果:一般并列显示被分析行和同 类型行当期、上期和前三年末数据,进行横、 纵向比较
2022/3/22
11
概要指标一览表─数据展示形式
本组概要情况
盈利能力分析 指标对平均资 产百分比
决策树分析方法─非现场数据分析法源自2022/3/221
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
2022/3/22
2
概念和作用
• 决策树分析是数量分析方法
• 决策树是一种树状结构,其分析由树根节点开 始逐层展开,每一分支树枝前后节点具有数量 逻辑关系
29
盈利分析细化─沿树枝不断深入…
• 可以沿着盈利树枝深入探究利息收入率和支出 率下降的影响要素以及影响程度
净利息收入
利息收入
存款类利息支出
将所有相关要素按树枝结 构有层次地展示数量关系
2022/3/22
利息支出
其他付息负 债利息支出
9
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
2022/3/22
10
运用基础
• 按资产规模对被分析机构分组,这是进行横向 比较的很重要的基础
时间点 平均资产 净收入 同类型银行数
该银行 同类型 百分比排名
边际分析 指标对各类平 均资产百分比
贷款分析 指标对各类平 均资产百分比
流动性分析
资本分析
增长比率
2022/3/22
12
分析过程
• 由概要指标开始分析 • 鉴别差异 • 分析差异的原因 • 考虑所有的影响要素 • 深究细节 • 确定问题的根本原因
2022/3/22
18
盈利分析─对同类型银行平均数认识
本季度
上季度
该银行税后净收益 对平均资产的比率
2022/3/22
同类银行平均税后净收 益对平均资产的比率
19
百分比排名
• 百 分 比 排 名 ( The percentile ranking, PCT):对于被分析银行一项指标的比率 ,低于该比率的银行数量的百分比
• 百分比排名高或低不表示状态的好坏
2022/3/22
20
盈利分析─对百分比排名认识
本季度
上季度
2022/3/22
该银行的百分比排名 21
盈利分析比较过程─对当期盈利分析
2022/3/22
25
盈利分析细化─对净利息收入分析
本季度
上季度
利息收入率降低,但支出下降幅度更大,使净利息收入率提高0.23百分
点,同类行提高0.15百分点。利息收入率与支出率下降的原因?
2022/3/22
26
盈利分析细化─利息收入率下降原因
本季度
上季度
平均盈利资产对平均资产比率
• 盈利性资产比率下降:本期比同类型、比上期 • 资产组合出现了什么变化?
2022/3/22
27
盈利分析细化─贷款利息收入边际分析
Current Quarter Previous Quarter
国内贷款 利息收入
国外贷款 利息收入
2022/3/22
28
盈利分析细化─利息支出率下降原因
本季度
上季度
短期非核心负债对总资产比率
• 短期较高成本负债下降减少了利息支出
2022/3/22
2022/3/22
15
盈利的决策树分析法
─简化的概要指标框架
净收入
净利息收入
非利息收入
利息收入 利息支出
非利息支出
贷款拨备
2022/3/22
16
盈利分析─对银行本期数据认识
本季度
上季度
(税后)
该银行税后净收益 对平均资产的比率
2022/3/22
17
平均数
• 同类型银行总合的平均数,是去除头尾 各5%的银行,而进行平均的结果
2022/3/22
13
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
2022/3/22
14
分析示例
• 逐项介绍分析方法
➢ 以净利息收入分析为主线,介绍逐步深入分 析过程
➢ 汇总各项数据分析,探究影响要素与程度 ➢ 得到总体分析结果 ➢ 提出有待进一步了解的问题
2022/3/22
4
决策树结构初识 (网址:)
净收入
净利息收入
以上各项是对收入的影响要素
2022/3/22
5
决策树结构简图
净收入
2022/3/22
+净利息收入 +非利息收入 -非利息支出
为便于建立数量关系和 比较,所有指标都是对 平均资产的比率,后续 树枝的指标一般为比率
本季度
上季度
第一步 第二步 第三步
初步判断:处于平均水平
2022/3/22
22
分析结论一─对当期盈利分析
• 计算数据显示该银行的盈利比率为 1.28%,同类型银行的平均数为1.29% ,表明该银行居于同类型银行的中间位 置
• 该银行的百分比排名为51,表示在同类 型银行中,有49%高于该行的1.28%比 率,而有51%低于该比率
-准备金
各树枝细化。以净 利息收入为例
+银行账户净收入
+交易账户净收入
+其他净收入
-适用所得税
6
决策树分枝示例─利息收入与支出
利息收入
净利息收入 利息支出
2022/3/22
7
决策树分枝示例─利息支出
存款类利息 支出
利息支出 其他付息负 债利息支出
2022/3/22
8
决策树分枝示例─完全净利息收入树枝
2022/3/22
23
盈利分析比较过程─与前期比较分析
本季度
上季度
比较结论:比前期提高
2022/3/22
24
分析结论二─对前期比较分析
• 自身比较,该银行盈利比率由0.99%提 高到1.28%
• 与同类型银行比较,该银行的百分比排 名由上期的33提高到51,在同类银行中 的盈利能力有所增强
• 这种状况的原因?需要进一步分析:沿 树枝细化分析
• 提供快捷、口径一致的分析模式
• 适用于对银行盈利能力数量分析,根据影响指 标相关要素的数量变化,探求各要素变化的原 因以及影响程度
• 同样的方法也可运用于银行其他情况的分析
2022/3/22
3
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
• 设计分析指标,确定相关指标之间的数量关系
• 构造指标的层次关系,用以分析各要素的影响 程度
• 计算机系统实现指标计算,并以易于阅读的方 式列示计算结果:一般并列显示被分析行和同 类型行当期、上期和前三年末数据,进行横、 纵向比较
2022/3/22
11
概要指标一览表─数据展示形式
本组概要情况
盈利能力分析 指标对平均资 产百分比
决策树分析方法─非现场数据分析法源自2022/3/221
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
2022/3/22
2
概念和作用
• 决策树分析是数量分析方法
• 决策树是一种树状结构,其分析由树根节点开 始逐层展开,每一分支树枝前后节点具有数量 逻辑关系
29
盈利分析细化─沿树枝不断深入…
• 可以沿着盈利树枝深入探究利息收入率和支出 率下降的影响要素以及影响程度
净利息收入
利息收入
存款类利息支出
将所有相关要素按树枝结 构有层次地展示数量关系
2022/3/22
利息支出
其他付息负 债利息支出
9
目录
1. 概念和作用 2. 决策树体系结构 3. 决策树运用基本要素 4. 决策树运用示例 5. 决策树运用示例分析结论
2022/3/22
10
运用基础
• 按资产规模对被分析机构分组,这是进行横向 比较的很重要的基础
时间点 平均资产 净收入 同类型银行数
该银行 同类型 百分比排名
边际分析 指标对各类平 均资产百分比
贷款分析 指标对各类平 均资产百分比
流动性分析
资本分析
增长比率
2022/3/22
12
分析过程
• 由概要指标开始分析 • 鉴别差异 • 分析差异的原因 • 考虑所有的影响要素 • 深究细节 • 确定问题的根本原因
2022/3/22
18
盈利分析─对同类型银行平均数认识
本季度
上季度
该银行税后净收益 对平均资产的比率
2022/3/22
同类银行平均税后净收 益对平均资产的比率
19
百分比排名
• 百 分 比 排 名 ( The percentile ranking, PCT):对于被分析银行一项指标的比率 ,低于该比率的银行数量的百分比