树与森林的遍历

合集下载

树与森林的遍历

第十七讲
∑p ×I
i =1 i
7
i
= 0.40 × 1 + 0.30 × 2 + 0.15 × 3 + 0.05 × 5 + 0.04 × 5 + 0.03 × 5 + 0.03 × 5 = 2.20
第十七讲
举例：数据传送中的二进制编码。要传送数据 state, seat, act, tea, cat, set, a, eat，如何使传送的长度最短？首先规定二叉树的构造为左走0，右走1 ，如图6.31所示。为了保证长度最短，先看字符出现的次数，然后将出现次数当作权，如图6.32所示。
第十七讲
2. 森林的遍历森林的遍历森林的遍历方法主要有以下三种： 1）先序遍历若森林非空，则遍历方法为： (1) 访问森林中第一棵树的根结点。 (2) 先序遍历第一棵树的根结点的子树森林。 (3) 先序遍历除去第一棵树之后剩余的树构成的森林。例如，图6.24(a)中森林的先序遍历序列为ABCDEFGHIJ。
第十七讲作业：
1.二叉树的层次遍历算法（二叉链表存储）； 2.求二叉树中最大结点值（二叉链表存储）。
第十七讲
哈夫曼树及其应用
第十七讲
1. 哈夫曼树
1. 路径和路径长度路径和路径长度路径是指从一个结点到另一个结点之间的分支序列，路径路径长度是指从一个结点到另一个结点所经过的分支数目。路径长度树的路径长度是从树根到每一结点的路径长度之和。树的路径长度
图6.30 构造哈夫曼树示例
第十七讲
表 6 – 3 指令的哈夫曼编码
指令 I1 I2 I3 I4 I5 I6 I7 使用频率(Pi） 0 10 110 11100 11101 11110 11111

二叉树,树,森林遍历之间的对应关系

二叉树,树,森林遍历之间的对应关系一、引言在计算机科学中，数据结构是非常重要的知识点之一。

而树这一数据结构，作为基础的数据结构之一，在软件开发中有着广泛的应用。

本文将重点探讨二叉树、树和森林遍历之间的对应关系，帮助读者更加全面地理解这些概念。

二、二叉树1. 二叉树的定义二叉树是一种特殊的树结构，每个节点最多有两个子节点，分别称为左子节点和右子节点。

二叉树可以为空，也可以是一棵空树。

2. 二叉树的遍历在二叉树中，有三种常见的遍历方式，分别是前序遍历、中序遍历和后序遍历。

在前序遍历中，节点的访问顺序是根节点、左子树、右子树；在中序遍历中，节点的访问顺序是左子树、根节点、右子树；在后序遍历中，节点的访问顺序是左子树、右子树、根节点。

3. 二叉树的应用二叉树在计算机科学领域有着广泛的应用，例如用于构建文件系统、在数据库中存储有序数据、实现算法中的搜索和排序等。

掌握二叉树的遍历方式对于理解这些应用场景非常重要。

三、树1. 树的定义树是一种抽象数据类型，由n(n>0)个节点组成一个具有层次关系的集合。

树的特点是每个节点都有零个或多个子节点，而这些子节点又构成了一颗子树。

树中最顶层的节点称为根节点。

2. 树的遍历树的遍历方式有先根遍历、后根遍历和层次遍历。

在先根遍历中，节点的访问顺序是根节点、子树1、子树2...；在后根遍历中，节点的访问顺序是子树1、子树2...，根节点；在层次遍历中，节点的访问顺序是从上到下、从左到右依次访问每个节点。

3. 树的应用树广泛用于分层数据的表示和操作，例如在计算机网络中的路由算法、在操作系统中的文件系统、在程序设计中的树形结构等。

树的遍历方式对于处理这些应用来说至关重要。

四、森林1. 森林的定义森林是n(n>=0)棵互不相交的树的集合。

每棵树都是一颗独立的树，不存在交集。

2. 森林的遍历森林的遍历方式是树的遍历方式的超集，对森林进行遍历就是对每棵树进行遍历的集合。

3. 森林的应用森林在实际编程中经常用于解决多个独立树结构的问题，例如在数据库中对多个表进行操作、在图像处理中对多个图形进行处理等。

树的遍历和哈夫曼树

}
2021/4/18 北京化工大学信息学院数据结构 33
求二叉树高度的递归算法
int Height ( BinTreeNode * T ) { if ( T == NULL ) return -1; else { int m = Height ( T->leftChild ); int n = Height ( T->rightChild ) ); return (m > n) ? m+1 : n+1;
中序遍历 (Inorder Traversal)
中序遍历二叉树算法的框架是：
若二叉树为空，则空操作；
-
否则中序遍历左子树 (L)；
+
/
访问根结点 (V)；
a *e f
中序遍历右子树 (R)。
遍历结果
b-
a+b*c-d-e/f
cd
2021/4/18 北京化工大学信息学院数据结构 20
二叉树递归的中序遍历算法
如果 n = 0，称为空树；如果 n > 0，则 ▪ 有一个特定的称之为根(root)的结点，
它只有直接后继，但没有直接前驱； ▪ 除根以外的其它结点划分为 m (m 0)
个互不相交的有限集合T0, T1, …, Tm-1，每个集合又是一棵树，并且称之为根的子树。
2021/4/18 北京化工大学信息学院数据结构 3
typedef struct node { //树结点定义
TreeData data;
//结点数据域
struct node * leftChild, * rightchild;
//子女指针域
} BinTreeNode;
typedef BinTreeNode * BinTree; //树定义，代表树的根指针

数据结构-第6章树和二叉树---4. 树和森林(V1)

ElemType data ; struct CSnode *firstchild, *nextsibing ; }CSNode;
6.4.1 树的存储结构
R AB C D EG F
R⋀
A
⋀D
⋀B
⋀E ⋀
C⋀
⋀G
⋀F ⋀
6.4.2 树、森林和二叉树的转换
1. 树转换为二叉树将树转换成二叉树在“孩子兄弟表示法”中已给出，其详细步骤是： ⑴ 加线。在树的所有相邻兄弟结点之间加一条连线。 ⑵ 去连线。除最左的第一个子结点外，父结点与所有其它子结点的连线都去掉。 ⑶ 旋转。将树以根结点为轴心，顺时针旋转 450，使之层次分明。
B C
D
A E
L HK
M
技巧：无左孩子者即为叶子结点
6.4.3 树和森林的遍历
1. 树的遍历由树结构的定义可知，树的遍历有二种方法。 ⑴ 先序遍历：先访问根结点，然后依次先序遍历完每棵子树等。价于对应二叉树的先序遍历
⑵ 后序遍历：先依次后序遍历完每棵子树，然后访问根结点。等价于对应二叉树的中序遍历
0 R -1 1A 0 2B 0 3C 0
}Ptree ; R
4D 1 5E 1
AB C
6F 3
7G 6
DE
F
8H 6
9I 6
G H I 10~MAX_Size-1 ... ...
6.4.1 树的存储结构
2. 孩子表示法
每个结点的孩子结点构成一个单链表，即有n 个结点就有n个孩子链表；
n个孩子的数据和n个孩子链表的头指针组成一个顺序表；结点结构定义：顺序表定义：
typedef struct PTNode { ElemType data ;

数据结构课后习题答案及解析第六章

第六章树和二叉树（下载后用阅读版式视图或web版式可以看清）习题一、选择题1．有一“遗传”关系：设x是y的父亲，则x可以把它的属性遗传给y。

表示该遗传关系最适合的数据结构为( )。

A.向量B.树 C图 D.二叉树2．树最合适用来表示( )。

A.有序数据元素 B元素之间具有分支层次关系的数据C无序数据元素 D.元素之间无联系的数据3．树B的层号表示为la，2b，3d，3e，2c，对应于下面选择的( )。

A. la (2b (3d,3e),2c)B. a(b(D,e),c)C. a(b(d,e),c)D. a(b,d(e),c)4.高度为h的完全二叉树至少有( )个结点，至多有( )个结点。

A. 2h_lB.h C．2h-1 D. 2h5.在一棵完全二叉树中，若编号为f的结点存在右孩子，则右子结点的编号为( )。

A. 2iB. 2i-lC. 2i+lD. 2i+26.一棵二叉树的广义表表示为a(b(c)，d(e(，g(h))，f))，则该二叉树的高度为 ( )。

A.3B.4C.5D.67.深度为5的二叉树至多有( )个结点。

A. 31B. 32C. 16D. 108.假定在一棵二叉树中，双分支结点数为15，单分支结点数为30个，则叶子结点数为( )个。

A. 15B. 16C. 17D. 479.题图6-1中，( )是完全二叉树，( )是满二叉树。

..专业知识编辑整理..10.在题图6-2所示的二叉树中：(1)A结点是A.叶结点 B根结点但不是分支结点 C根结点也是分支结点 D.分支结点但不是根结点(2)J结点是A.叶结点 B．根结点但不是分支结点 C根结点也是分支结点 D.分支结点但不是根结点(3)F结点的兄弟结点是A.EB.D C．空 D.I(4)F结点的双亲结点是A.AB.BC.CD.D(5)树的深度为A.1B.2C.3D.4(6)B结点的深度为A.1B.2C.3D.4(7)A结点所在的层是A.1B.2C.3D.4..专业知识编辑整理..11.在一棵具有35个结点的完全二叉树中，该树的深度为( )。

数据结构第七章树和森林

7.5 树的应用
➢判定树
在实际应用中，树可用于判定问题的描述和解决。
•设有八枚硬币，分别表示为a，b，c，d，e，f，g，h，其中有一枚且仅有一枚硬币是伪造的，假硬币的重量与真硬币的重量不同，可能轻，也可能重。现要求以天平为工具，用最少的比较次数挑选出假硬币，并同时确定这枚硬币的重量比其它真硬币是轻还是重。
的第i棵子树。 ⑺Delete（t，x，i）在树t中删除结点x的第i棵子树。 ⑻Tranverse（t）是树的遍历操作，即按某种方式访问树t中的每个
结点，且使每个结点只被访问一次。
7.2.2 树的存储结构
顺序存储结构链式存储结构不管哪一种存储方式，都要求不但能存储结点本身的数据信息，还要能够唯一的反映树中各结点之间的逻辑关系。 1.双亲表示法 2.孩子表示法 3.双亲孩子表示法 4.孩子兄弟表示法
21
将二叉树还原为树示意图
A BCD
EF
A
B
C
E
D
F
A
B
C
E
D
F
22
练习：将下图所示二叉树转化为树
1 2
4
5
3
6
2 4
1 53
6
23
7.3.2 森林转换为二叉树
由森林的概念可知，森林是若干棵树的集合，只要将森林中各棵树的根视为兄弟，森林同样可以用二叉树表示。森林转换为二叉树的方法如下：
⑴将森林中的每棵树转换成相应的二叉树。 ⑵第一棵二叉树不动，从第二棵二叉树开始，依次把后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子，当所有二叉树连起来后，此时所得到的二叉树就是由森林转换得到的二叉树。
相交的集合T1，T2，…，Tm，其中每一个集合Ti（1≤i≤m）本身又是一棵树。树T1，T2，…，Tm称为这个根结点的子树。 • 可以看出，在树的定义中用了递归概念，即用树来定义树。因此，树结构的算法类同于二叉树结构的算法，也可以使用递归方法。

数据结构考研笔记整理(全)

数据结构考研笔记整理（全）一、第二章线性表●考纲内容●一、线性表的基本概念●线性表是具有相同数据结构类型的n个数据元素的有限序列；线性表为逻辑结构，实现线性表的存储结构为顺序表或者链表●二、线性表的实现●1、顺序表●定义(静态分配)●#define MaxSize 50 \\ typedef struct{ \\ ElemType data[MaxSize];\\ intlength;\\ }SqList;●定义(动态分配)●#define MaxSize 50\\ typedef strcut{\\ EleType *data; //指示动态非配数组的指针\\ int MaxSize,length;\\ }SqList;●c的动态分配语句为L.data=(ElemType*)malloc(sizeof(ElemType)*InitSize);●c++动态分配语句为L.data=new ElemType[InitSize];●插入操作●删除操作●按值寻找●2、链表●单链表●单链表的定义●●头插法建立单链表●●尾插法建立单链表●●按序号查找getElem(LinkList L,int i)和按值查找locateElem(LinkListL,ElemType e)●插入结点（后插）●p=getElem(L,i-1); //查找插入位置的前驱结点\\ s.next=p.next;\\p.next=s;●将前插操作转化为后插操作,即先将s插入的p的后面然后调换s和p的数据域●s.next=p.next;\\ p.next=s.next;\\ temp=p.data;\\ p.data=s.data;\\s.data=temp;●删除结点●p.getElem(L,i-1);\\ q=p.next;\\ p.next=q.next;\\ free(q);●双链表（结点中有prior指针和next指针）●循环链表●静态链表●借助数组来描述线性表的链式存储结构，结点中的指针域next为下一个元素的数组下标●三、线性表的应用●使用的时候如何选择链表还是顺序表？●表长难以估计，经常需要增加、删除操作——链表;表长可以估计，查询比较多——顺序表●链表的头插法，尾插法，逆置法，归并法，双指针法；顺序表结合排序算法和查找算法的应用●小知识点（选择题）二、第三章栈，队列和数组●考纲内容●一、栈和队列的基本概念●栈：后进先出，LIFO，逻辑结构上是一种操作受限的线性表●队列：先进先出，FIFO，逻辑结构上也是一种操作受限的线性表●二、栈和队列的顺序存储结构●栈的顺序存储●●队列的顺序存储●进队：队不满时，送值到队尾元素，再将队尾指针加一●出队：队不空时，取队头元素值，再将队头指针加一●判断队空：Q.front==Q.rear==0;●循环队列（牺牲一个单元来区分队空和队满，尾指针指向队尾元素的后一个位置，也就是即将要插入的位置）●初始：Q.front==Q.rear●队满：(Q.rear+1)%MaxSize=Q.front●出队，队首指针进1:Q.front=(Q.front+1)%MaxSize●入队，队尾指针进1:Q.rear=(Q.rear+1)%MaxSize●队列长度：(Q.rear+MaxSize-Q.front)%MaxSize●三、栈和队列的链式存储结构●栈的链式存储●●队列的链式存储●实际是上一个同时带有头指针和尾指针的单链表，尾指针指向单链表的最后一个结点，与顺序存储不同,通常带有头结点●四、多维数组的存储●行优先：00，01，02，10，11，12●列优先：00，10，01，11，02，12●五、特殊矩阵的压缩存储●对称矩阵●三角矩阵●三对角矩阵（带状矩阵）●稀疏矩阵●将非零元素及其相应的行和列构成一个三元组存储●十字链表法●六、栈、队列、数组的应用●栈在括号匹配中的应用●栈在递归中的应用●函数在递归调用过程中的特点：最后被调用的函数最先执行结束●队列在层次遍历中的应用●二叉树的层次遍历●1跟结点入队●2若队空，则结束遍历，否则重复3操作●3队列中的第一个结点出队并访问，若有左孩子，则左孩子入队；若有右孩子，则右孩子入队●重点为栈的(出入栈过程、出栈序列的合法性)和队列的操作及其特征●小知识点(选择题)●n个不同元素进栈，出栈元素不同排列的个数为{2n\choose n }/(n+1)●共享栈是指让两个顺序栈共享一个存储空间，将两个栈的栈底分别设置在共享空间的两端，两个栈顶向共享空间的中间延伸，可以更有效的利用存储空间，同时对存储效率没有什么影响●双端队列是指允许两端都可以进行入队和出队操作的队列●输出受限的双端队列：允许两端插入，只允许一端删除●输入受限的双端队列：允许两端删除，只允许一端插入三、第四章串●考纲内容●字符串模式匹配●暴力算法●注意指针回退时的操作是i=i-j+2;j=j+1;●kmp算法●手工求next数组时，next[j]=s的最长相等前后缀长度+1，其中s为1到j-1个字符组成的串●在实际kmp算法中，为了使公式更简洁、计算简单，如果串的位序是从1开始的，则next数组需要整体加一；如果串的位序是从0开始的，则next数组不需要加一●根据next数组求解nextval数组：如果p[j]==p[next[j]]，则nextval[j]=nextval[next[j]]，否则nextval[j]=next[j];●小知识点●串和线性表的区别：1线性表的数据元素可以不同，但串的数据元素一般是字符；2串的操作对象通常是子串而不是某一个字符四、第五章树与二叉树●考纲内容●一、树的基本概念●定义●树是一种递归的数据结构，是一种逻辑结构●树的性质●结点数为n，则边的数量为n-1●树中的结点数等于所有结点的度数之和加1（一个结点的孩子个数称为该结点的度，树中结点的最大度数称为树的度，每一条边表示一个结点，对应一个度，只有根结点上面无边，故结点树=度数之和+1）●度为m的树中第i层至多有m^{i-1}个结点（i\geq1）（m叉树的第i层最多有m^{i-1}个结点）●高度为h的m叉树至多有(m^h-1)/(m-1)个结点（假设每一个结点都有m个孩子，则由等比数列的求和公式可以推导出该式子）●具有n个结点的m叉树的最小高度是\lceil log_m(n(m-1)+1)\rceil（由高度为h的m叉树的最大结点树公式有，n满足式子(m^{h-1}-1)/(m-1) \leq n\leq (m^h-1)/(m-1)）●高度为h的m叉树至少有h个结点；高为h，度为m的树至少有h+m-1个结点（m叉树并不等于度为m的树，m叉树可以为空树，要求所有结点的度小于等于m，而度为m的树一定有一个结点的度数为m）●二、二叉树●二叉树的定义及其主要特征●定义●特点●每个结点至多只有两颗子树●二叉树是有序树，其子树有左右之分，次序不能颠倒，否则将成为另一颗二叉树，即使树中结点只有一颗子树，也要区分他是左子树还是右子树●特殊的二叉树●满二叉树：高度为h，结点数为2^h-1，所有叶子结点都集中在二叉树的最下面一层，除叶子结点外的所有结点度数都为2，从根结点为1开始编号，对于编号为i的结点，其父结点为\lfloor i/2 \rfloor，左孩子(若有)编号为2i，右孩子(若有)编号为2i+1，所以编号为偶数的结点只可能是左孩子，编号为奇数的结点只可能是右孩子●完全二叉树：删除了满二叉树中编号更大的结点，高为h，结点数为n的完全二叉树的每个结点的编号都与高度为h的满二叉树中编号为1到n的结点相同。

数据结构习题及答案与实验指导(树和森林)7

第7章树和森林树形结构是一类重要的非线性结构。

树形结构的特点是结点之间具有层次关系。

本章介绍树的定义、存储结构、树的遍历方法、树和森林与二叉树之间的转换以及树的应用等内容。

重点提示：●树的存储结构●树的遍历●树和森林与二叉树之间的转换7-1 重点难点指导7-1-1 相关术语1．树的定义：树是n（n>=0）个结点的有限集T，T为空时称为空树，否则它满足如下两个条件：①有且仅有一个特定的称为根的结点；②其余的结点可分为m（m>=0）个互不相交的子集T1，T2，…，T m，其中每个子集本身又是一棵树，并称为根的子树。

要点：树是一种递归的数据结构。

2．结点的度：一个结点拥有的子树数称为该结点的度。

3．树的度：一棵树的度指该树中结点的最大度数。

如图7-1所示的树为3度树。

4．分支结点：度大于0的结点为分支结点或非终端结点。

如结点a、b、c、d。

5．叶子结点：度为0的结点为叶子结点或终端结点。

如e、f、g、h、i。

6．结点的层数：树是一种层次结构，根结点为第一层，根结点的孩子结点为第二层，…依次类推，可得到每一结点的层次。

7．兄弟结点：具有同一父亲的结点为兄弟结点。

如b、c、d；e、f；h、i。

8．树的深度：树中结点的最大层数称为树的深度或高度。

9．有序树：若将树中每个结点的子树看成从左到右有次序的（即不能互换），则称该树为有序树，否则称为无序树。

10．森林：是m棵互不相交的树的集合。

7-1-2 树的存储结构1．双亲链表表示法以图7-1所示的树为例。

（1）存储思想:因为树中每个元素的双亲是惟一的，因此对每个元素，将其值和一个指向双亲的指针parent构成一个元素的结点，再将这些结点存储在向量中。

（2）存储示意图:-1 data:parent:（3）注意: Parrent域存储其双亲结点的存储下标，而不是存放结点值。

下面的存储是不正确的：-1 data:parent:2．孩子链表表示法（1）存储思想：将每个数据元素的孩子拉成一个链表，链表的头指针与该元素的值存储为一个结点，树中各结点顺序存储起来，一般根结点的存储号为0。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

D
(a) 带权路径长度为36
2
C 4
D
75
A
B
(b) 带权路径长度为46
7
A 5
B 2
4
C
D
(c) 带权路径长度为35
WPL(a)=7×2＋5×2＋2×2＋4×2＝36 WPL(b)=4×2＋7×3＋5×3＋2×1＝46 WPL(c)=7×1＋5×2＋2×3＋4×3＝35
第十七讲
问题2: 什么样的树的带权路径长度最小？例如：给定一个权值序列{2, 3, 4, 7}，可构造如图6.29所示的多种二叉树的形态。
（1）用给定的n个权值{w1, w2, …, wn}对应的n个结点构成n 棵二叉树的森林F={T1, T2, …, Tn}，其中每一棵二叉树T i(1≤i≤n)都只有一个权值为wi的根结点，其左、右子树为空。
（2）在森林F中选择两棵根结点权值最小的二叉树，作为一棵新二叉树的左、右子树，标记新二叉树的根结点权值为其左右子树的根结点权值之和。
第十七讲
树与森林的遍历
第十七讲
1. 树的遍历方法主要有以下两种： 1）若树非空，则遍历方法为： (1) 访问根结点。 (2) 从左到右，依次先根遍历根结点的每一棵子树。例如，图6.21中树的先根遍历序列为ABECFHGD。
第十七讲
2）若树非空，则遍历方法为：（1）从左到右，依次后根遍历根结点的每一棵子树。
（2）访问根结点。例如，图6.21中树的后根遍历序列为EBHFGCDA。
第十七讲
2. 森林的遍历森林的遍历方法主要有以下三种： 1）若森林非空，则遍历方法为： (1) 访问森林中第一棵树的根结点。 (2) 先序遍历第一棵树的根结点的子树森林。 (3) 先序遍历除去第一棵树之后剩余的树构成的森林。例如，图6.24(a)中森林的先序遍历序列为ABCDEFGHIJ。
第十七讲
由图6.27可知，结点n对应的路径长度为［log2n］，所以前n项 n
之和为 [log 2 k ] 。
k 1
20 0 21 1 22 2 2h h
h
[log 2 k] (h为树的深度)，所以完
k 1
全二叉树具有最小路径长度的性质，但不具有唯一性。有些树
第十七讲
作业：
1.二叉树的层次遍历算法（二叉链表存储）； 2.求二叉树中最大结点值（二叉链表存储）。
第十七讲哈夫曼树及其应用
第十七讲
1. 哈夫曼树
1. 路径是指从一个结点到另一个结点之间的分支序列，路径长度是指从一个结点到另一个结点所经过的分支数目。树的路径长度是从树根到每一结点的路径长度之和。
0.1 5
I3
0.0 6
0.0 9
0.0 3
0.0 3 0.0 4
0.0 5
I7
I6
I5
I4
图6.30 构造哈夫曼树示例
第十七讲
表 6 – 3 指令的哈夫曼编码
指令 I1 I2 I3 I4 I5 I6 I7
使用频率(Pi） 0 10
110 11100 11101 11110 11111
第十七讲
可以验证，该编码是前缀编码。若一段程序有1000条指令，其中I1大约有400条，I2大约有300条，I3大约有150条，I4大约有50条，I5大约有40条，I6大约有30条，I7大约有30条。对于定长编码，该段程序的总位数大约为3×1000＝3000。采用哈夫曼编码后，该段程序的总位数大约为 1×400 ＋ 2×300 ＋ 3×150＋5×（50＋40＋30＋30）＝2200。可见，哈夫曼编码中虽然大部分编码的长度大于定长编码的长度3，却使得程序的总位数变小了。可以算出该哈夫曼编码的平均码长为：
第十七讲
2 34 7 (a) W P L＝ 2×2＋ 2×3＋ 2×4＋ 2×7＝ 32
2
3
4
7
(b) W P L＝ 1×2＋ 2×3＋ 3×4＋ 3×7＝ 41
7
4
3
2
(c) W P L＝ 1×7＋ 2×4＋ 3×3＋ 3×2＝ 7＋ 8＋ 9＋ 6＝ 30
第十七讲
4. 哈夫曼树构造哈夫曼算法的步骤如下：
使用频率(Pi） 0.40 0.30 0.15 0.05 0.04 0.03 0.03
第十七讲
表 6 – 2 指令的变长编码
指令 I1 I2 I3 I4 I5 I6 I7
使用频率(Pi） 0 1 00 01
000 001 010
第十七讲
1.0 0
0.6 0
0.4 0
0.3 0
I1
0.3 0
I2
0.1 5
并不是完全二叉树，但也可以具有最小路径长度，如图所示。
A
ABCB来自CDE
D
E
(a) P L＝ 0＋ 1＋ 1＋ 2＋ 2＝ 6
(b) P L＝ 0＋ 1＋ 1＋ 2＋ 2＝ 6
第十七讲
2. 在实际的应用中，人们常常给树的每个结点赋予一个具有某种实际意义的实数，我们称该实数为这个结点的权。在树形结构中，我们把从树根到某一结点的路径长度与该结点的权的乘积，叫做该结点的带权路径长度。
第十七讲
（3）从F中删除被选中的那两棵二叉树，同时把新构成的二叉树加入到森林F中。
（4）重复（2）、（3）操作，直到森林中只含有一棵二叉树为止，此时得到的这棵二叉树就是哈夫曼树。
第十七讲
6.5.2 哈夫曼编码
表 6 – 1 指令的使用频率
指令 I1 I2 I3 I4 I5 I6 I7
第十七讲
3. 树的带权路径长度
树的带权路径长度为树中所有叶子结点的带权路径长度之和，通常记为：
n
WPL Wi 1i
i 1
其中n为叶子结点的个数，wi为第i个叶子结点的权值，li 为第i个叶子结点的路径长度。
例如，图 6.26中三棵二叉树的带权路径长度分别为：
第十七讲
7
5
2
4
A
B
C
第十七讲
2）若森林非空，则遍历方法为： (1) 中序遍历森林中第一棵树的根结点的子树森林。 (2) 访问第一棵树的根结点。 (3) 中序遍历除去第一棵树之后剩余的树构成的森林。
例如，图6.24(a)中森林的中序遍历序列为 BCDAFEHJIG。
第十七讲
3）若森林非空，则遍历方法为： (1) 后序遍历森林中第一棵树的根结点的子树森林。 (2) 后序遍历除去第一棵树之后剩余的树构成的森林。 (3) 访问第一棵树的根结点。
第十七讲
问题1: 什么样的二叉树的路径长度PL最小？路径长度为0的结点至多只有1个（根）；路径长度为1的结点至多只有2个；路径长度为2的结点至多只有4个；依此类推，路径长度为k的结点至多只有2k个, 所以n个结点二叉树其路径长度至少等于如下所示序列的前n项之和。
结点路径长度0，1， 1， 2，2，2，2， 3， 3， 3， 3， 3， 3， 3， 3， 4，… 结点数n n=1 n=2 n=3 n=4 n=5 n=6 n=7 n=8 … n=15

树与森林的遍历