数据结构第五章知识点总结

合集下载

数据结构各章概要

数据结构各章概要数据结构是计算机科学中非常重要的一个学科，其主要研究各种数据的组织方式和操作方法。

善于运用合适的数据结构可以提高算法的效率，并优化程序的性能。

本文将对数据结构的各个章节进行概要介绍，帮助读者了解不同章节的主要内容和应用。

第一章：引论在引论章节，我们将引入数据结构的基本概念和术语，例如什么是数据、数据项、数据对象等等。

同时，还将介绍数据结构的分类和基本操作，如搜索、遍历、插入、删除和排序。

这些基础知识是后续章节的基础。

第二章：线性表线性表是数据结构中最简单、最基本的一种结构。

其特点是数据元素之间的前驱和后继关系非常明确。

线性表可以用数组和链表两种方式实现。

在本章节中，我们将分别介绍顺序表和链表的实现原理、插入、删除、合并以及应用场景。

第三章：栈和队列栈和队列是两种特殊的线性表结构，它们对数据的访问具有限制性。

栈具有“先进后出”的特点，而队列则具有“先进先出”的特点。

在本章节中，我们将介绍栈和队列的实现方式以及常见的应用场景，如递归、表达式求值、广度优先搜索等。

第四章：串串是由零个或多个字符组成的有限序列，其长度可以为零。

在本章节中，我们将介绍串的定义和操作，包括字符串的模式匹配、模式识别和编辑操作。

串的相关算法在文本处理、计算机网络等领域具有广泛的应用。

第五章：数组和广义表数组是一种在内存中以连续方式存储的数据结构，它具有高效的随机访问特性。

广义表是线性表的一种扩展，可以包含表结构、原子结构以及其他广义表。

本章节将介绍数组和广义表的定义、操作和应用。

第六章：树树是一种非线性的数据结构，具有分层次、递归和层次遍历等特点。

在本章节中，我们将介绍树的基本概念、二叉树、树的遍历算法、平衡树以及树的应用，如编译器中的语法树、文件系统的目录结构等。

第七章：图图是一种复杂的非线性数据结构，由顶点集合和边集合组成。

在本章节中，我们将介绍图的各种表示方式，图的遍历算法、最短路径算法以及常用的图算法，如最小生成树算法和拓扑排序。

数据结构复习笔记

第一章概论1.数据：信息的载体,能被计算机识别、存储和加工处理;2.数据元素：数据的基本单位,可由若干个数据项组成,数据项是具有独立含义的最小标识单位;3.数据结构：数据之间的相互关系,即数据的组织形式;它包括：1数据的逻辑结构,从逻辑关系上描述数据,与数据存储无关,独立于计算机；2数据的存储结构,是逻辑结构用计算机语言的实现,依赖于计算机语言;3数据的运算,定义在逻辑结构上,每种逻辑结构都有一个运算集合;常用的运算：检索/插入/删除/更新/排序;4.数据的逻辑结构可以看作是从具体问题抽象出来的数学模型;数据的存储结构是逻辑结构用计算机语言的实现;5.数据类型：一个值的集合及在值上定义的一组操作的总称;分为：原子类型和结构类型;6.抽象数据类型：抽象数据的组织和与之相关的操作;优点：将数据和操作封装在一起实现了信息隐藏;7. 抽象数据类型ADT：是在概念层上描述问题；类：是在实现层上描述问题；在应用层上操作对象类的实例解决问题;8.数据的逻辑结构,简称为数据结构,有：1线性结构,若结构是非空集则仅有一个开始和终端结点,并且所有结点最多只有一个直接前趋和后继;2非线性结构,一个结点可能有多个直接前趋和后继;9.数据的存储结构有：1顺序存储,把逻辑相邻的结点存储在物理上相邻的存储单元内;2链接存储,结点间的逻辑关系由附加指针字段表示;3索引存储,存储结点信息的同时,建立附加索引表,有稠密索引和稀疏索引;4散列存储,按结点的关键字直接计算出存储地址;10.评价算法的好坏是：算法是正确的；执行算法所耗的时间；执行算法的存储空间辅助存储空间；易于理解、编码、调试;11.算法的时间复杂度Tn：是该算法的时间耗费,是求解问题规模n的函数;记为On;时间复杂度按数量级递增排列依次为：常数阶O1、对数阶Olog2n、线性阶On、线性对数阶Onlog2n、平方阶On^2、立方阶On^3、……k次方阶On^k、指数阶O2^n;13.算法的空间复杂度Sn：是该算法的空间耗费,是求解问题规模n的函数;12.算法衡量：是用时间复杂度和空间复杂度来衡量的,它们合称算法的复杂度;13. 算法中语句的频度不仅与问题规模有关,还与输入实例中各元素的取值相关;第二章线性表1.线性表：是由nn≥0个数据元素组成的有限序列;3.顺序表：把线性表的结点按逻辑次序存放在一组地址连续的存储单元里;4.顺序表结点的存储地址计算公式：Locai=Loca1+i-1C；1≤i≤n5.顺序表上的基本运算public interface List {链表：只有一个链域的链表称单链表;在结点中存储结点值和结点的后继结点的地址,data next data是数据域,next是指针域;1建立单链表;时间复杂度为On;加头结点的优点：1链表第一个位置的操作无需特殊处理；2将空表和非空表的处理统一; 2查找运算;时间复杂度为On;public class SLNode implements Node {private Object element;private SLNode next;public SLNodeObject ele, SLNode next{= ele;= next;}public SLNode getNext{return next;}public void setNextSLNode next{= next;}public Object getData {return element;}public void setDataObject obj {element = obj;}}public class ListSLinked implements List {private SLNode head; etData==ereturn p;else p = ;return null;}etData;.getNext;size--;return obj;}etNext;size--;return true;}return false;}环链表：是一种首尾相连的链表;特点是无需增加存储量,仅对表的链接方式修改使表的处理灵活方便;8.空循环链表仅由一个自成循环的头结点表示;9.很多时候表的操作是在表的首尾位置上进行,此时头指针表示的单循环链表就显的不够方便,改用尾指针rear来表示单循环链表;用头指针表示的单循环链表查找开始结点的时间是O1,查找尾结点的时间是On；用尾指针表示的单循环链表查找开始结点和尾结点的时间都是O1;10.在结点中增加一个指针域,prior|data|next;形成的链表中有两条不同方向的链称为双链表;public class DLNode implements Node {private Object element;private DLNode pre;private DLNode next;public DLNodeObject ele, DLNode pre, DLNode next{= ele;= pre;= next;}public DLNode getNext{return next;}public void setNextDLNode next{= next;}public DLNode getPre{return pre;}public void setPreDLNode pre{= pre;}public Object getData {return element;}public void setDataObject obj {element = obj;}}public class LinkedListDLNode implements LinkedList {private int size; etPrenode;node;size++;return node;}etNextnode;node;size++;return node;}etNext;.setPre;size--;return obj;}序表和链表的比较1基于空间的考虑：顺序表的存储空间是静态分配的,链表的存储空间是动态分配的;顺序表的存储密度比链表大;因此,在线性表长度变化不大,易于事先确定时,宜采用顺序表作为存储结构;2基于时间的考虑：顺序表是随机存取结构,若线性表的操作主要是查找,很少有插入、删除操作时,宜用顺序表结构;对频繁进行插入、删除操作的线性表宜采用链表;若操作主要发生在表的首尾时采用尾指针表示的单循环链表;12.存储密度=结点数据本身所占的存储量/整个结点结构所占的存储总量存储密度：顺序表=1,链表<1;第三章栈和队列1.栈是限制仅在表的一端进行插入和删除运算的线性表又称为后进先出表LIFO表;插入、删除端称为栈顶,另一端称栈底;表中无元素称空栈;2.栈的基本运算有：1initstacks,构造一个空栈；2stackemptys,判栈空；3stackfulls,判栈满；4pushs,x,进栈；5pops,退栈；6stacktops,取栈顶元素;3.顺序栈：栈的顺序存储结构称顺序栈;4.当栈满时,做进栈运算必定产生空间溢出,称“上溢”;当栈空时,做退栈运算必定产生空间溢出,称“下溢”;上溢是一种错误应设法避免,下溢常用作程序控制转移的条件;5.在顺序栈上的基本运算：public interface Stack {栈：栈的链式存储结构称链栈;栈顶指针是链表的头指针;7.链栈上的基本运算：public class StackSLinked implements Stack {private SLNode top; 列是一种运算受限的线性表,允许删除的一端称队首,允许插入的一端称队尾;队列又称为先进先出线性表,FIFO表;9.队列的基本运算：1initqueueq,置空队；2queueemptyq,判队空；3queuefullq,判队满；4enqueueq,x,入队；5dequeueq,出队；6queuefrontq,返回队头元素;10.顺序队列：队列的顺序存储结构称顺序队列;设置front和rear指针表示队头和队尾元素在向量空间的位置;11.顺序队列中存在“假上溢”现象,由于入队和出队操作使头尾指针只增不减导致被删元素的空间无法利用,队尾指针超过向量空间的上界而不能入队;12.为克服“假上溢”现象,将向量空间想象为首尾相连的循环向量,存储在其中的队列称循环队列;i=i+1%queuesize13.循环队列的边界条件处理：由于无法用front==rear来判断队列的“空”和“满”;解决的方法有：1另设一个布尔变量以区别队列的空和满；2少用一个元素,在入队前测试rear在循环意义下加1是否等于front；3使用一个记数器记录元素总数;14.循环队列的基本运算：public interface Queue {队列：队列的链式存储结构称链队列,链队列由一个头指针和一个尾指针唯一确定;16.链队列的基本运算：public class QueueSLinked implements Queue {private SLNode front;private SLNode rear;private int size;public QueueSLinked {front = new SLNode;rear = front;size = 0;}etData;}}第四章串1.串：是由零个或多个字符组成的有限序列；包含字符的个数称串的长度；2.空串：长度为零的串称空串；空白串：由一个或多个空格组成的串称空白串；子串：串中任意个连续字符组成的子序列称该串的子串；主串：包含子串的串称主串；子串的首字符在主串中首次出现的位置定义为子串在主串中的位置；3.空串是任意串的子串；任意串是自身的子串；串常量在程序中只能引用但不能改变其值；串变量取值可以改变；4.串的基本运算1intstrlenchars;求串长;2charstrcpycharto,charfrom;串复制;3charstrcatcharto,charfrom;串联接;4intstrcmpchars1,chars2;串比较;5charstrchrchars,charc;字符定位;5.串的存储结构：1串的顺序存储：串的顺序存储结构称顺序串;按存储分配不同分为：1静态存储分配的顺序串：直接用定长的字符数组定义,以“\0”表示串值终结;definemaxstrsize256typedefcharseqstringmaxstrsize;seqstrings;不设终结符,用串长表示;Typedefstruct{Charchmaxstrsize;Intlength;}seqstring;以上方式的缺点是：串值空间大小是静态的,难以适应插入、链接等操作;2动态存储分配的顺序串：简单定义：typedefcharstring;复杂定义：typedefstruct{charch;intlength;}hstring;2串的链式存储：串的链式存储结构称链串;链串由头指针唯一确定;类型定义：typedefstructnode{chardata;structnodenext;}linkstrnode;typedeflinkstrnodelinkstring;linkstrings;将结点数据域存放的字符个数定义为结点的大小;结点大小不为1的链串类型定义：definenodesize80typedefstructnode{chardatanodesize;structnodenext;}linkstrnode;6.串运算的实现1顺序串上的子串定位运算;1子串定位运算又称串的模式匹配或串匹配;主串称目标串；子串称模式串; 2朴素的串匹配算法;时间复杂度为On^2;比较的字符总次数为n-m+1m; Intnaivestrmatchseqstringt,seqstringp{inti,j,k;intm=;intn=;fori=0;i<=n-m;i++{j=0;k=i;whilej<m&&k==j{j++;k++;}ifj==mreturni;}return–1;}2链串上的子串定位运算;时间复杂度为On^2;比较的字符总次数为n-m+1m;LinkstrnodelilnkstrmatchlinkstringT,linkstringP {linkstrnodeshift,t,p;shift=T;t=shift;p=P;whilet&&p{ift->data==p->data{t=t->next;p=p->next;}else{shift=shift->next;t=shift;p=P;}}ifp==NULLreturnshift;elsereturnNULL;}第五章多维数组和广义表1.多维数组：一般用顺序存储的方式表示数组;2.常用方式有：1行优先顺序,将数组元素按行向量排列；2列优先顺序,将数组元素按列向量排列;3.计算地址的函数：LOCAij=LOCAc1c2+i-c1d2-c2+1+j-c2d4.矩阵的压缩存储：为多个非零元素分配一个存储空间；对零元素不分配存储空间;1对称矩阵：在一个n阶的方阵A中,元素满足Aij=Aji0<=i,j<=n-1;称为对称矩阵;元素的总数为：nn+1/2;设：I=i或j中大的一个数；J=i或j中小的一个数；则：k=II+1/2+J;地址计算：LOCAij=LOCsak=LOCsa0+kd=LOCsa0+II+1/2+Jd2三角矩阵：以主对角线划分,三角矩阵有上三角和下三角；上三角的主对角线下元素均为常数c；下三角的主对角线上元素均为常数c;元素总数为：nn+1/2+1;以行优先顺序存放的Aij与SAk的关系：上三角阵：k=i2n-i+1/2+j-i;下三角阵：k=ii+1/2+j;3对角矩阵：所有的非零元素集中在以主对角线为中心的带状区域,相邻两侧元素均为零;|i-j|>k-1/2以行优先顺序存放的Aij与SAk的关系：k=2i+j;5.稀疏矩阵：当矩阵A中有非零元素S个,且S远小于元素总数时,称为稀疏矩阵;对其压缩的方法有顺序存储和链式存储;1三元组表：将表示稀疏矩阵的非零元素的三元组行号、列号、值按行或列优先的顺序排列得到的一个结点均是三元组的线性表,将该表的线性存储结构称为三元组表;其类型定义：definemaxsize10000typedefintdatatype;typedefstruct{inti,j;datatypev;}trituplenode;typedefstruct{trituplenodedatamaxsize;intm,n,t;}tritupletable;2带行表的三元组表：在按行优先存储的三元组表中加入一个行表记录每行的非零元素在三元组表中的起始位置;类型定义：definemaxrow100typedefstruct{tritulpenodedatamaxsize;introwtabmaxrow;intm,n,t;}rtritulpetable;6.广义表：是线性表的推广,广义表是n个元素的有限序列,元素可以是原子或一个广义表,记为LS;7.若元素是广义表称它为LS的子表;若广义表非空,则第一个元素称表头,其余元素称表尾;8.表的深度是指表展开后所含括号的层数;9.把与树对应的广义表称为纯表,它限制了表中成分的共享和递归；10.允许结点共享的表称为再入表；11.允许递归的表称为递归表；12.相互关系：线性表∈纯表∈再入表∈递归表；13.广义表的特殊运算：1取表头headLS；2取表尾tailLS;第六章树1.树：是n个结点的有限集T,T为空时称空树,否则满足：1有且仅有一个特定的称为根的结点；2其余结点可分为m个互不相交的子集,每个子集本身是一棵树,并称为根的子树;2.树的表示方法：1树形表示法；2嵌套集合表示法；3凹入表表示法；4广义表表示法；3.一个结点拥有的子树数称为该结点的度；一棵树的度是指树中结点最大的度数;4.度为零的结点称叶子或终端结点；度不为零的结点称分支结点或非终端结点5.根结点称开始结点,根结点外的分支结点称内部结点；6.树中某结点的子树根称该结点的孩子；该结点称为孩子的双亲；7.树中存在一个结点序列K1,K2,…Kn,使Ki为Ki+1的双亲,则称该结点序列为K1到Kn的路径或道路；8.树中结点K到Ks间存在一条路径,则称K是Ks的祖先,Ks是K的子孙；9.结点的层数从根算起,若根的层数为1,则其余结点层数是其双亲结点层数加1；双亲在同一层的结点互为堂兄弟；树中结点最大层数称为树的高度或深度；10.树中每个结点的各个子树从左到右有次序的称有序树,否则称无序树；11.森林是m棵互不相交的树的集合;12.二叉树：是n个结点的有限集,它或为空集,或由一个根结点及两棵互不相交的、分别称为该根的左子树和右子树的二叉树组成;13.二叉树不是树的特殊情况,这是两种不同的数据结构；它与无序树和度为2的有序树不同;14.二叉树的性质：1二叉树第i层上的结点数最多为2^i-1；2深度为k的二叉树至多有2^k-1个结点；3在任意二叉树中,叶子数为n0,度为2的结点数为n2,则n0=n2+1；15.满二叉树是一棵深度为k的且有2^k-1个结点的二叉树；16.完全二叉树是至多在最下两层上结点的度数可以小于2,并且最下层的结点集中在该层最左的位置的二叉树；17.具有N个结点的完全二叉树的深度为log2N取整加1；18.二叉树的存储结构1顺序存储结构：把一棵有n个结点的完全二叉树,从树根起自上而下、从左到右对所有结点编号,然后依次存储在一个向量b0~n中,b1~n存放结点,b0存放结点总数;各个结点编号间的关系：1i=1是根结点；i>1则双亲结点是i/2取整；2左孩子是2i,右孩子是2i+1；要小于n3i>n/2取整的结点是叶子；4奇数没有右兄弟,左兄弟是i-1；5偶数没有左兄弟,右兄弟是i+1；2链式存储结构结点的结构为：lchild|data|rchild；相应的类型说明：typedefchardata;typedefstructnode{datatypedata;structnodelchild,rchild;}bintnode;typedefbintnodebintree;19.在二叉树中所有类型为bintnode的结点和一个指向开始结点的bintree类型的头指针构成二叉树的链式存储结构称二叉链表;20.二叉链表由根指针唯一确定;在n个结点的二叉链表中有2n个指针域,其中n+1个为空;21.二叉树的遍历方式有：前序遍历、中序遍历、后序遍历;时间复杂度为On;22.线索二叉树：利用二叉链表中的n+1个空指针域存放指向某种遍历次序下的前趋和后继结点的指针,这种指针称线索;加线索的二叉链表称线索链表;相应二叉树称线索二叉树;23.线索链表结点结构：lchild|ltag|data|rtag|rchild；ltag=0,lchild是指向左孩子的指针；ltag=1,lchild是指向前趋的线索；rtag=0,rchild是指向右孩子的指针；rtag=1,rchild是指向后继的线索；24.查找p在指定次序下的前趋和后继结点;算法的时间复杂度为Oh;线索对查找前序前趋和后序后继帮助不大;25.遍历线索二叉树;时间复杂度为On;26.树、森林与二叉树的转换1树、森林与二叉树的转换1树与二叉树的转换：1}所有兄弟间连线；2}保留与长子的连线,去除其它连线;该二叉树的根结点的右子树必为空;2森林与二叉树的转换：1}将所有树转换成二叉树；2}将所有树根连线;2二叉树与树、森林的转换;是以上的逆过程;27.树的存储结构1双亲链表表示法：为每个结点设置一个parent指针,就可唯一表示任何一棵树;Data|parent2孩子链表表示法：为每个结点设置一个firstchild指针,指向孩子链表头指针,链表中存放孩子结点序号;Data|firstchild;3双亲孩子链表表示法：将以上方法结合;Data|parent|firstchild4孩子兄弟链表表示法：附加两个指向左孩子和右兄弟的指针;Leftmostchild|data|rightsibling28.树和森林的遍历：前序遍历一棵树等价于前序遍历对应二叉树；后序遍历等价于中序遍历对应二叉树;29.最优二叉树哈夫曼树：树的路径长度是从树根到每一结点的路径长度之和;将树中的结点赋予实数称为结点的权;30.结点的带权路径是该结点的路径长度与权的乘积;树的带权路径长度又称树的代价,是所有叶子的带权路径长度之和;31.带权路径长度最小的二叉树称最优二叉树哈夫曼树;32.具有2n-1个结点其中有n个叶子,并且没有度为1的分支结点的树称为严格二叉树;33.哈夫曼编码34.对字符集编码时,要求字符集中任一字符的编码都不是其它字符的编码前缀,这种编码称前缀码;35.字符出现频度与码长乘积之和称文件总长；字符出现概率与码长乘积之和称平均码长；36.使文件总长或平均码长最小的前缀码称最优前缀码37.利用哈夫曼树求最优前缀码,左为0,右为1;编码平均码长最小；没有叶子是其它叶子的祖先,不可能出现重复前缀;第七章图1.图：图G是由顶点集V和边集E组成,顶点集是有穷非空集,边集是有穷集；中每条边都有方向称有向图；有向边称弧；边的始点称弧尾；边的终点称弧头；G中每条边都没有方向的称无向图;3.顶点n与边数e的关系：无向图的边数e介于0~nn-1/2之间,有nn-1/2条边的称无向完全图；有向图的边数e介于0~nn-1之间,有nn-1条边的称有向完全图；4.无向图中顶点的度是关联与顶点的边数；有向图中顶点的度是入度与出度的和;所有图均满足：所有顶点的度数和的一半为边数;5.图GV,E,如V’是V的子集,E’是E的子集,且E’中关联的顶点均在V’中,则G’V’,E’是G的子图;6.在有向图中,从顶点出发都有路径到达其它顶点的图称有根图；7.在无向图中,任意两个顶点都有路径连通称连通图；极大连通子图称连通分量；8.在有向图中,任意顺序两个顶点都有路径连通称强连通图；极大连通子图称强连通分量；9.将图中每条边赋上权,则称带权图为网络;10.图的存储结构：1邻接矩阵表示法：邻接矩阵是表示顶点间相邻关系的矩阵;n个顶点就是n阶方阵;无向图是对称矩阵；有向图行是出度,列是入度;2邻接表表示法：对图中所有顶点,把与该顶点相邻接的顶点组成一个单链表,称为邻接表,adjvex|next,如要保存顶点信息加入data；对所有顶点设立头结点,vertex|firstedge,并顺序存储在一个向量中；vertex保存顶点信息,firstedge保存邻接表头指针;11.邻接矩阵表示法与邻接表表示法的比较：1邻接矩阵是唯一的,邻接表不唯一；2存储稀疏图用邻接表,存储稠密图用邻接矩阵；3求无向图顶点的度都容易,求有向图顶点的度邻接矩阵较方便；4判断是否是图中的边,邻接矩阵容易,邻接表最坏时间为On；5求边数e,邻接矩阵耗时为On^2,与e无关,邻接表的耗时为Oe+n；12.图的遍历：1图的深度优先遍历：类似与树的前序遍历;按访问顶点次序得到的序列称DFS序列;对邻接表表示的图深度遍历称DFS,时间复杂度为On+e;对邻接矩阵表示的图深度遍历称DFSM,时间复杂度为On^2;2图的广度优先遍历：类似与树的层次遍历;按访问顶点次序得到的序列称BFS序列;对邻接表表示的图广度遍历称BFS,时间复杂度为On+e;对邻接矩阵表示的图广度遍历称BFSM,时间复杂度为On^2;13.将没有回路的连通图定义为树称自由树;14.生成树：连通图G的一个子图若是一棵包含G中所有顶点的树,该子图称生成树;有DFS生成树和BFS生成树,BFS生成树的高度最小;非连通图生成的是森林;15.最小生成树：将权最小的生成树称最小生成树;是无向图的算法1普里姆算法：1确定顶点S、初始化候选边集T0~n-2；formvex|tovex|lenght2选权值最小的Ti与第1条记录交换；3从T1中将tovex取出替换以下记录的fromvex计算权；若权小则替换,否则不变；4选权值最小的Ti与第2条记录交换；5从T2中将tovex取出替换以下记录的fromvex计算权；若权小则替换,否则不变；6重复n-1次;初始化时间是On,选轻边的循环执行n-1-k次,调整轻边的循环执行n-2-k；算法的时间复杂度为On^2,适合于稠密图;2克鲁斯卡尔算法：1初始化确定顶点集和空边集；对原边集按权值递增顺序排序；2取第1条边,判断边的2个顶点是不同的树,加入空边集,否则删除；3重复e次;对边的排序时间是Oelog2e；初始化时间为On；执行时间是Olog2e；算法的时间复杂度为Oelog2e,适合于稀疏图;16.路径的开始顶点称源点,路径的最后一个顶点称终点；17.单源最短路径问题：已知有向带权图,求从某个源点出发到其余各个顶点的最短路径；18.单目标最短路径问题：将图中每条边反向,转换为单源最短路径问题；19.单顶点对间最短路径问题：以分别对不同顶点转换为单源最短路径问题；20.所有顶点对间最短路径问题：分别对图中不同顶点对转换为单源最短路径问题；21.迪杰斯特拉算法：1初始化顶点集Si,路径权集Di,前趋集Pi；2设置Ss为真,Ds为0；3选取Di最小的顶点加入顶点集；4计算非顶点集中顶点的路径权集；5重复3n-1次;算法的时间复杂度为On^2;22.拓扑排序：对一个有向无环图进行拓扑排序,是将图中所有顶点排成一个线性序列,满足弧尾在弧头之前;这样的线性序列称拓扑序列;1无前趋的顶点优先：总是选择入度为0的结点输出并删除该顶点的所有边;设置各个顶点入度时间是On+e,设置栈或队列的时间是On,算法时间复杂度为On+e;2无后继的顶点优先：总是选择出度为0的结点输出并删除该顶点的所有边;设置各个顶点出度时间是On+e,设置栈或队列的时间是On,算法时间复杂度为On+e;求得的是逆拓扑序列;第八章排序1.文件：由一组记录组成,记录有若干数据项组成,唯一标识记录的数据项称关键字；2.排序是将文件按关键字的递增减顺序排列；3.排序文件中有相同的关键字时,若排序后相对次序保持不变的称稳定排序,否则称不稳定排序；4.在排序过程中,文件放在内存中处理不涉及数据的内、外存交换的称内排序,反之称外排序；5.排序算法的基本操作：1比较关键字的大小；2改变指向记录的指针或移动记录本身;6.评价排序方法的标准：1执行时间；2所需辅助空间,辅助空间为O1称就地排序；另要注意算法的复杂程度;7.若关键字类型没有比较运算符,可事先定义宏或函数表示比较运算;8.插入排序1直接插入排序算法中引入监视哨R0的作用是：1保存Ri的副本；2简化边界条件,防止循环下标越界;关键字比较次数最大为n+2n-1/2；记录移动次数最大为n+4n-1/2；算法的最好时间是On；最坏时间是On^2；平均时间是On^2；是一种就地的稳定的排序；2希尔排序实现过程：是将直接插入排序的间隔变为d;d的取值要注意：1最后一次必为1；2避免d 值互为倍数；关键字比较次数最大为n^；记录移动次数最大为^；算法的平均时间是On^；是一种就地的不稳定的排序；9.交换排序1冒泡排序实现过程：从下到上相邻两个比较,按小在上原则扫描一次,确定最小值,重复n-1次;关键字比较次数最小为n-1、最大为nn-1/2；记录移动次数最小为0,最大为3nn-1/2；算法的最好时间是On；最坏时间是On^2；平均时间是On^2；是一种就地的稳定的排序；2快速排序实现过程：将第一个值作为基准,设置i,j指针交替从两头与基准比较,有交换后,交换j,i;i=j时确定基准,并以其为界限将序列分为两段;重复以上步骤;关键字比较次数最好为nlog2n+nC1、最坏为nn-1/2；算法的最好时间是Onlog2n；最坏时间是On^2；平均时间是Onlog2n；辅助空间为Olog2n；是一种不稳定排序；10.选择排序1直接选择排序实现过程：选择序列中最小的插入第一位,在剩余的序列中重复上一步,共重复n-1次;关键字比较次数为nn-1/2；记录移动次数最小为0,最大为3n-1；算法的最好时间是On^2；最坏时间是On^2；平均时间是On^2；是一种就地的不稳定的排序；2堆排序。

《数据结构及其应用》笔记含答案第五章_树和二叉树

第5章树和二叉树一、填空题1、指向结点前驱和后继的指针称为线索。

二、判断题1、二叉树是树的特殊形式。

（）2、完全二叉树中，若一个结点没有左孩子，则它必是叶子。

（）3、对于有N个结点的二叉树，其高度为。

（）4、满二叉树一定是完全二叉树，反之未必。

（）5、完全二叉树可采用顺序存储结构实现存储，非完全二叉树则不能。

（）6、若一个结点是某二叉树子树的中序遍历序列中的第一个结点，则它必是该子树的后序遍历序列中的第一个结点。

（）7、不使用递归也可实现二叉树的先序、中序和后序遍历。

（）8、先序遍历二叉树的序列中，任何结点的子树的所有结点不一定跟在该结点之后。

（）9、赫夫曼树是带权路径长度最短的树，路径上权值较大的结点离根较近。

（）110、在赫夫曼编码中，出现频率相同的字符编码长度也一定相同。

（）三、单项选择题1、把一棵树转换为二叉树后，这棵二叉树的形态是（A）。

A．唯一的Ｂ．有多种C．有多种，但根结点都没有左孩子Ｄ．有多种，但根结点都没有右孩子解释：因为二叉树有左孩子、右孩子之分，故一棵树转换为二叉树后，这棵二叉树的形态是唯一的。

2、由3个结点可以构造出多少种不同的二叉树？（D）A．2 B．3 C．4 D．5解释：五种情况如下：3、一棵完全二叉树上有1001个结点，其中叶子结点的个数是（D）。

A．250 B． 500 C．254 D．501解释：设度为0结点（叶子结点）个数为A，度为1的结点个数为B，度为2的结点个数为C，有A=C+1，A+B+C=1001，可得2C+B=1000，由完全二叉树的性质可得B=0或1，又因为C为整数，所以B=0，C=500，A=501，即有501个叶子结点。

4、一个具有1025个结点的二叉树的高h为（C）。

A．11 B．10 C．11至1025之间 D．10至1024之间解释：若每层仅有一个结点，则树高h为1025；且其最小树高为⎣log21025⎦ + 1=11，即h在11至1025之间。

课程的知识点总结

课程的知识点总结第一章：导论本章将介绍课程的基本内容和学习目标，包括课程的背景和意义、学习目的、学习方法和要求等内容。

学完本章后，学生应该对整个课程有一个初步的了解和认识，为后续的学习打好基础。

第二章：数据结构概述本章将介绍数据结构的基本概念和分类，包括数据结构的定义、逻辑结构和存储结构、数据类型、抽象数据类型等内容。

学完本章后，学生应该对数据结构的基本概念有一个清晰的认识，为后续的学习打下基础。

第三章：线性表本章将介绍线性表的存储结构和常用操作，包括顺序表、链表、栈和队列等内容。

学生应该掌握线性表的定义和特点，熟练掌握线性表的存储结构和操作方法，并能够运用线性表解决实际问题。

第四章：树和二叉树本章将介绍树和二叉树的基本概念和性质，包括树的定义和基本术语、二叉树的定义和性质、二叉树的遍历和线索化等内容。

学生应该掌握树和二叉树的基本概念和性质，熟练掌握树和二叉树的存储结构和操作方法，并能够运用树和二叉树解决实际问题。

第五章：图本章将介绍图的基本概念和性质，包括图的定义和术语、图的存储结构、图的遍历和最短路径求解等内容。

学生应该掌握图的基本概念和性质，熟练掌握图的存储结构和操作方法，并能够运用图解决实际问题。

第六章：排序本章将介绍排序的基本概念和分类，包括插入排序、选择排序、冒泡排序、快速排序、归并排序等内容。

学生应该掌握不同排序算法的原理和实现方法，熟练掌握排序算法的时间复杂度和空间复杂度，并能够根据具体问题选择合适的排序算法。

第七章：查找本章将介绍查找的基本概念和分类，包括顺序查找、折半查找、哈希查找、二叉查找树等内容。

学生应该掌握不同查找算法的原理和实现方法，熟练掌握查找算法的时间复杂度和空间复杂度，并能够根据具体问题选择合适的查找算法。

第八章：高级数据结构本章将介绍高级数据结构的基本概念和应用，包括堆、图的最小生成树和最短路径、哈希表、并查集等内容。

学生应该掌握不同高级数据结构的特点和应用场景，熟练掌握高级数据结构的操作方法，并能够运用高级数据结构解决实际问题。

数据结构第五章树答案

第五章树(答案)一、选择题1、二叉树的第i 层最多有（）个结点。

A ．2i B. 2i C. 2i-1 D.2i -12.对于一棵满二叉树，高度为h ，共有n 个结点，其中有m 个叶子结点，则（）A ．n=h+m B.h+m=2n C.m=h-1 D.n=2h -1 3.在一棵二叉树中，共有16个度为2的结点，则其共有（）个叶子结点。

A ．15 B.16 C.17 D.184. 一棵完全二叉树中根结点的编号为1，而且编号为23的结点有左孩子但没有右孩子，则此树中共有（）个结点。

A ．24 B.45 C.46 D.47 5.下述编码那一组不是前缀码（）A ．00,01,10,11 B.0,1,00,11 C.0,10,110,111 D.1,01,001,000 6.某二叉树的中序序列和后序序列相同，则这棵二叉树必然是（）A ．空树B ．空树或任一结点均无左孩子的非空二叉树C ．空树或任一结点均无右孩子的非空二叉树D ．空树或仅有一个结点的二叉树7.设n,m 为一棵二叉树上的两个结点，在中序遍历时，n 在m 前的条件是（）A ．n 在m 的右边 B.n 是m 的祖先C ．n 在m 的左边 D.n 是m 的子孙8、假定中根遍历二叉树的定义如下：若二叉树为非空二叉树，则中根遍历根的右子树；访问根结点；中根遍历根的左子树。

按此定义遍历下图所示的二叉树，遍历的结果为： A 、 DBEAFHGC A B 、 C GHFADBE B C C 、 E BDAFHGC E D FD 、 FHGCADBE GH9、文中出现的字母为A 、B 、C 、D 和E ，每个字母在电文中出现的次数分别为9、27、3、5和11。

按哈夫曼编码（构造时左小右大），则字母C 的编码应是：A 、10B 、0110C 、1110D 、1100 10、设树T 的度为4，其中度为1，2，3和4的结点个数分别为4，2，1，1 则T 中的叶子数为（）A ．5B ．6C ．7D ．8 11．算术表达式a+b*（c+d/e ）转为后缀表达式后为（）A ．ab+cde/*B ．abcde/+*+C ．abcde/*++D ．12. 设有一表示算术表达式的二叉树（见下图），它所表示的算术表达式是（）A. A*B+C/(D*E)+(F-G)B. (A*B+C)/(D*E)+(F-G)C. (A*B+C)/(D*E+（F-G ）)D. A*B+C/D*E+F-G13．已知一算术表达式的中缀形式为 A+B*C-D/E ，后缀形式为ABC*+DE/-，其前缀形式为( ) A ．-A+B*C/DE B. -A+B*CD/E C ．-+*ABC/DE D. -+A*BC/DE14．若一棵二叉树具有10个度为2的结点，5个度为1的结点，则度为0的结点个数是（）A ．9B ．11C ．15D ．不确定15．树的后根遍历序列等同于该树对应的二叉树的( ).A. 先序序列B. 中序序列C. 后序序列16．已知一棵二叉树的前序遍历结果为ABCDEF,中序遍历结果为CBAEDF,则后序遍历的结果为（）。

数据结构知识点总结 (2)

数据结构知识点概括第一章概论数据就是指能够被计算机识别、存储和加工处理的信息的载体。

数据元素是数据的基本单位，可以由若干个数据项组成。

数据项是具有独立含义的最小标识单位。

数据结构的定义：·逻辑结构：从逻辑结构上描述数据，独立于计算机。

·线性结构：一对一关系。

·线性结构：多对多关系。

·存储结构：是逻辑结构用计算机语言的实现。

·顺序存储结构：如数组。

·链式存储结构：如链表。

·索引存储结构：·稠密索引：每个结点都有索引项。

·稀疏索引：每组结点都有索引项。

·散列存储结构：如散列表。

·数据运算。

·对数据的操作。

定义在逻辑结构上，每种逻辑结构都有一个运算集合。

·常用的有：检索、插入、删除、更新、排序。

数据类型：是一个值的集合以及在这些值上定义的一组操作的总称。

·结构类型：由用户借助于描述机制定义，是导出类型。

抽象数据类型ADT：·是抽象数据的组织和与之的操作。

相当于在概念层上描述问题。

·优点是将数据和操作封装在一起实现了信息隐藏。

程序设计的实质是对实际问题选择一种好的数据结构，设计一个好的算法。

算法取决于数据结构。

算法是一个良定义的计算过程，以一个或多个值输入，并以一个或多个值输出。

评价算法的好坏的因素：·算法是正确的；·执行算法的时间；·执行算法的存储空间（主要是辅助存储空间）；·算法易于理解、编码、调试。

时间复杂度：是某个算法的时间耗费，它是该算法所求解问题规模n的函数。

渐近时间复杂度：是指当问题规模趋向无穷大时，该算法时间复杂度的数量级。

评价一个算法的时间性能时，主要标准就是算法的渐近时间复杂度。

算法中语句的频度不仅与问题规模有关，还与输入实例中各元素的取值相关。

时间复杂度按数量级递增排列依次为：常数阶O（1）、对数阶O（log2n）、线性阶O（n）、线性对数阶O（nlog2n）、平方阶O（n^2）、立方阶O（n^3）、……k次方阶O（n^k）、指数阶O（2^n）。

数据结构第五章参考答案

习题51.填空题（1）已知二叉树中叶子数为50，仅有一个孩子的结点数为30，则总结点数为（___________）。

答案：129（2）3个结点可构成（___________）棵不同形态的二叉树。

答案：5（3）设树的度为5，其中度为1~5的结点数分别为6、5、4、3、2个，则该树共有（___________）个叶子。

答案：31（4）在结点个数为n（n>1）的各棵普通树中，高度最小的树的高度是（___________），它有（___________）个叶子结点，（___________）个分支结点。

高度最大的树的高度是（___________），它有（___________）个叶子结点，（___________）个分支结点。

答案：2 n-1 1 n 1 n-1（5）深度为k的二叉树，至多有（___________）个结点。

答案：2k-1（6）（7）有n个结点并且其高度为n的二叉树的数目是（___________）。

答案：2n-1（8）设只包含根结点的二叉树的高度为0，则高度为k的二叉树的最大结点数为（___________），最小结点数为（___________）。

答案：2k+1-1 k+1（9）将一棵有100个结点的完全二叉树按层编号，则编号为49的结点为X，其双亲PARENT （X）的编号为（）。

答案：24（10）已知一棵完全二叉树中共有768个结点，则该树中共有（___________）个叶子结点。

答案：384（11）（12）已知一棵完全二叉树的第8层有8个结点，则其叶子结点数是（___________）。

答案：68（13）深度为8（根的层次号为1）的满二叉树有（___________）个叶子结点。

答案：128（14）一棵二叉树的前序遍历是FCABED，中序遍历是ACBFED，则后序遍历是（___________）。

答案：ABCDEF（15）某二叉树结点的中序遍历序列为ABCDEFG，后序遍历序列为BDCAFGE，则该二叉树结点的前序遍历序列为（___________），该二叉树对应的树林包括（___________）棵树。

数据结构知识点总结归纳整理

第1章绪论1.1 数据结构的基本概念数据元是数据的基本单位，一个数据元素可由若干个数据项完成，数据项是构成数据元素的不可分割的最小单位。

例如，学生记录就是一个数据元素，它由学号、姓名、性别等数据项组成。

数据对象是具有相同性质的数据元素的集合，是数据的一个子集。

数据类型是一个值的集合和定义在此集合上一组操作的总称。

•原子类型：其值不可再分的数据类型•结构类型：其值可以再分解为若干成分（分量）的数据类型•抽象数据类型：抽象数据组织和与之相关的操作抽象数据类型（ADT）是指一个数学模型以及定义在该模型上的一组操作。

抽象数据类型的定义仅取决于它的一组逻辑特性，而与其在计算机内部如何表示和实现无关。

通常用（数据对象、数据关系、基本操作集）这样的三元组来表示。

#关键词：数据，数据元素，数据对象，数据类型，数据结构数据结构的三要素：1.逻辑结构是指数据元素之间的逻辑关系，即从逻辑关系上描述数据，独立于计算机。

分为线性结构和非线性结构，线性表、栈、队列属于线性结构，树、图、集合属于非线性结构。

2.存储结构是指数据结构在计算机中的表示（又称映像），也称物理结构，包括数据元素的表示和关系的表示，依赖于计算机语言，分为顺序存储（随机存取）、链式存储（无碎片）、索引存储（检索速度快）、散列存储（检索、增加、删除快）。

3.数据的运算：包括运算的定义和实现。

运算的定义是针对逻辑结构的，指出运算的功能；运算的实现是针对存储结构的，指出运算的具体操作步骤。

1.2 算法和算法评价算法是对特定问题求解步骤的一种描述，有五个特性：有穷性、确定性、可行性、输入、输出。

一个算法有零个或多个的输入，有一个或多个的输出。

时间复杂度是指该语句在算法中被重复执行的次数，不仅依赖于问题的规模n，也取决于待输入数据的性质。

一般指最坏情况下的时间复杂度。

空间复杂度定义为该算法所耗费的存储空间。

算法原地工作是指算法所需辅助空间是常量，即O(1)。

第2章线性表2.1 线性表的定义和基本操作线性表是具有相同数据类型的n个数据元素的有限序列。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第五章数组
一、数组不能做插入和删除，只能做取值和赋值操作。

二、数组只能采取顺序存储（行优先和列优先）
三、数组行优先计算公式（下标从0和1开始）
数组列优先计算公式（下标从0和1开始）
四、为什么要对特殊矩阵进行压缩存储？
答：主要为了节省存储空间。

、
五、对称矩阵和三角矩阵各长什么样？
六、F[k]，对称矩阵的压缩存储所需存储空间至少n(n+1)/2。

存储计算公式。

三角矩阵的压缩存储所需存储空间至少n(n+1)/2+1。

七、对称矩阵的压缩存储可以存其下三角上的元素或其上三角上的元素。

了解公式
八、三角矩阵的压缩存储可以存其下三角上的元素或其上三角上的元素。

但是必须多一个单元存常数C. 了解公式
九、稀疏矩阵长什么样？
十、稀疏矩阵存储方法有两种：三元组表和十字链表
十一、了解广义表，了解广义表取表头和表尾操作。