大学数据结构期末知识点重点总结(考试专用)
数据结构期末复习汇总

数据结构期末复习汇总数据结构是计算机科学中十分重要的概念之一,它是指数据对象以及数据对象之间的关系、操作和操作规则的集合。
在计算机科学的学习中,掌握数据结构是至关重要的一步。
为了帮助大家复习期末考试,以下是一些数据结构的重要知识点的总结。
一、线性表线性表是最简单的一种数据结构,它是一种有序的数据元素集合。
线性表的特点是元素之间的关系是一对一的关系,每个元素都与它的前驱和后继相连接。
1.数组:数组是最常见的线性表结构,它由相同类型的数据元素组成,这些元素通过索引来访问。
2.链表:链表是另一种常见的线性表结构,它由节点组成,每个节点包含了数据以及一个指向下一个节点的指针。
二、栈和队列栈和队列是常用的线性结构,它们在操作上有一些限制。
1.栈:栈是一种具有后进先出(LIFO)特性的线性表。
栈中的元素只能在栈顶进行插入和删除操作。
2.队列:队列是一种具有先进先出(FIFO)特性的线性表。
队列中的元素只能在队尾进行插入操作,在队头进行删除操作。
三、树和二叉树树是一种非线性的数据结构,它由节点和边组成。
树的一个节点可以有多个子节点,但是每个节点只能有一个父节点。
1.二叉树:二叉树是一种特殊的树结构,每个节点最多只能有两个子节点。
2.二叉树:二叉树是一种特殊的二叉树,它满足左子树的所有节点的值都小于根节点的值,右子树的所有节点的值都大于根节点的值。
四、图图是一种非常重要的非线性结构,它由节点和边组成。
图的节点之间可以有多种不同的关系。
1.有向图:有向图是一种图结构,图的边有方向,从一个节点到另一个节点。
2.无向图:无向图是一种图结构,图的边没有方向。
五、排序和算法排序算法是对一组数据进行排序的算法,算法是找到目标元素在一组数据中的位置的算法。
1.冒泡排序:冒泡排序是一种交换排序算法,其核心思想是比较相邻的元素并进行交换,将最大(或最小)元素逐渐“冒泡”到数组的末尾。
2.快速排序:快速排序是一种分治排序算法,其核心思想是通过选择一个基准元素,将数组划分为两个子数组,其中一个子数组的所有元素都小于基准元素,另一个子数组的所有元素都大于基准元素,然后对两个子数组进行递归排序。
数据结构期末复习重点知识点总结

数据结构期末复习重点知识点总结一、数据结构概述数据结构是计算机科学中一门关于数据组织、存储和管理的学科。
它涉及到各种数据类型和它们之间的关系,以及对这些数据类型进行有效操作和处理的算法。
二、基本数据结构1. 数组- 数组是一种线性数据结构,用于存储相同类型的数据元素。
- 数组的特点是随机访问和连续存储。
- 数组的插入和删除操作需要移动其他元素,时间复杂度为O(n)。
2. 链表- 链表是一种线性数据结构,通过节点之间的指针链接来组织数据。
- 链表的特点是插入和删除操作简单,时间复杂度为O(1)。
- 链表分为单链表、双向链表和循环链表等不同类型。
3. 栈- 栈是一种具有后进先出(LIFO)特性的数据结构。
- 栈的操作主要包括压栈(Push)和弹栈(Pop)两个操作。
- 栈常用于表达式求值、递归算法的实现等场景。
4. 队列- 队列是一种具有先进先出(FIFO)特性的数据结构。
- 队列的操作主要包括入队(Enqueue)和出队(Dequeue)两个操作。
- 队列常用于实现缓冲区、消息队列等场景。
5. 树- 树是一种非线性的数据结构,由节点和边组成。
- 树的节点具有层级关系,由根节点、子节点和叶节点等组成。
- 常见的树结构有二叉树、红黑树、B树等。
6. 图- 图是一种非线性的数据结构,由节点和边组成。
- 图的节点之间可以有多对多的关系。
- 图的遍历方式有深度优先搜索(DFS)和广度优先搜索(BFS)。
三、常见的数据结构算法1. 排序算法- 冒泡排序、插入排序、选择排序等简单但效率较低的排序算法。
- 快速排序、归并排序、堆排序等高效的排序算法。
- 基数排序、桶排序等适用于特定场景的排序算法。
2. 查找算法- 顺序查找、二分查找等常用的查找算法。
- 树结构相关的查找算法,如二叉搜索树、红黑树等。
- 哈希查找、索引查找等高效的查找算法。
3. 图算法- Dijkstra算法、Bellman-Ford算法等最短路径算法。
数据结构复习资料复习提纲知识要点归纳

数据结构复习资料复习提纲知识要点归纳数据结构复习资料:复习提纲知识要点归纳一、数据结构概述1. 数据结构的定义和作用2. 常见的数据结构类型3. 数据结构与算法的关系二、线性结构1. 数组的概念及其特点2. 链表的概念及其分类3. 栈的定义和基本操作4. 队列的定义和基本操作三、树结构1. 树的基本概念及定义2. 二叉树的性质和遍历方式3. 平衡二叉树的概念及应用4. 堆的定义和基本操作四、图结构1. 图的基本概念及表示方法2. 图的遍历算法:深度优先搜索和广度优先搜索3. 最短路径算法及其应用4. 最小生成树算法及其应用五、查找与排序1. 查找算法的分类及其特点2. 顺序查找和二分查找算法3. 哈希查找算法及其应用4. 常见的排序算法:冒泡排序、插入排序、选择排序、归并排序、快速排序六、高级数据结构1. 图的高级算法:拓扑排序和关键路径2. 并查集的定义和操作3. 线段树的概念及其应用4. Trie树的概念及其应用七、应用案例1. 使用数据结构解决实际问题的案例介绍2. 如何选择适合的数据结构和算法八、复杂度分析1. 时间复杂度和空间复杂度的定义2. 如何进行复杂度分析3. 常见算法的复杂度比较九、常见问题及解决方法1. 数据结构相关的常见问题解答2. 如何优化算法的性能十、总结与展望1. 数据结构学习的重要性和难点2. 对未来数据结构的发展趋势的展望以上是数据结构复习资料的复习提纲知识要点归纳。
希望能够帮助你进行复习和回顾,加深对数据结构的理解和掌握。
在学习过程中,要注重理论与实践相结合,多进行编程练习和实际应用,提高数据结构的实际运用能力。
祝你复习顺利,取得好成绩!。
数据结构期末复习总结

第1章绪论1.数据(Data) :是描述客观事物的数字、字符以及所有能输入到计算机中并能被计算机接受的各种符号集合的统称。
包括数值数据和非数值数据(字符串、图形、图像、音频、视频)。
2.数据元素(Data Element) :表示一个事物的一组数据称为一个数据元素(结点顶点、记录);数据元素是数据的基本单位。
3.数据项(Data Item):是数据元素中有独立含义的、不可分割的最小标识单位(字段、域、属性)。
一个数据元素可由若干个数据项组成。
4.数据对象(Data Object):是性质相同的数据元素的集合,是数据的一个子集。
如字符集合C ={A,B,C,…} 。
数据(Data) :是描述客观事物的数字、字符以及所有能输入到计算机中并能被计算机接受的各种符号集合的统称。
包括数值数据和非数值数据(字符串、图形、图像、音频、视频)。
数据元素(Data Element) :表示一个事物的一组数据称为一个数据元素(结点、顶点、记录);数据元素是数据的基本单位。
数据项(Data Item):是数据元素中有独立含义的、不可分割的最小标识单位(字段、域、属性)。
一个数据元素可由若干个数据项组成。
数据对象(Data Object):是性质相同的数据元素的集合,是数据的一个子集。
如字符集合C ={A,B,C,…} 。
●数据的逻辑结构指数据元素之间的逻辑关系,用一个数据元素的集合和定义在此集合上的若干关系来表示。
●四种逻辑结构:集合、线性结构、树型结构、图状结构。
●数据结构的形式定义是一个二元组:Data-Structure=(D,S)其中:D是数据元素的有限集,S是D上关系的有限集。
例1:设数据逻辑结构B=(K,R)K={k1, k2, …, k9}R={ <k1, k3>,<k1, k8>,<k2, k3>,<k2, k4>,<k2, k5>,<k3, k9>,<k5, k6>,<k8, k9>,<k9, k7>,<k4, k7>,<k4, k6>有时候关系图不唯一(一般是无向图)●数据结构在计算机内存中的存储包括数据元素的存储和元素之间的关系的表示。
数据结构期末概念总结

数据结构期末概念总结第一部分:基本概念和算法复杂度分析1. 数据结构的定义和分类2. 算法的定义和特性3. 算法复杂度分析的方法和技巧4. 时间复杂度和空间复杂度的计算和比较5. 最坏情况、平均情况和最好情况的复杂度分析6. Big-O符号和渐进记号法的使用和解读第二部分:线性数据结构1. 数组和链表的定义、特性和比较2. 栈和队列的定义、特性和应用3. 双向链表和循环链表的定义、特性和应用4. 线性数据结构的遍历和操作算法5. 线性数据结构的实现和优化技巧第三部分:树和二叉树1. 树的定义、特性和应用2. 二叉树的定义、特性和分类3. 二叉树的遍历算法(前序、中序、后序、层序)4. 二叉搜索树的定义、特性和操作算法5. 平衡二叉树和AVL树的定义、特性和操作算法6. 堆和二叉堆的定义、特性和应用第四部分:图1. 图的定义、特性和分类2. 图的表示方法(邻接矩阵、邻接表、哈希表)3. 图的遍历算法(深度优先搜索、广度优先搜索)4. 最短路径算法(Dijkstra算法、Floyd-Warshall算法)5. 最小生成树算法(Prim算法、Kruskal算法)第五部分:高级数据结构1. 哈希表的定义、特性和应用2. 字典树的定义、特性和应用3. 线段树的定义、特性和应用4. 并查集的定义、特性和应用第六部分:高级算法思想1. 分治算法和递归思想2. 动态规划算法和状态转移方程3. 贪心算法和贪心选择策略4. 回溯算法和剪枝技巧在本篇文章中,我从基本概念和算法复杂度分析开始,系统地总结了数据结构课程的内容。
通过对线性数据结构(数组、链表、栈、队列)、树和二叉树、图、高级数据结构(哈希表、字典树、线段树、并查集)以及高级算法思想的介绍,读者们可以对数据结构的主要概念有一个全面的了解。
当然,数据结构不仅仅是掌握概念,更重要的是能够灵活运用这些概念解决实际问题。
因此,读者们在学习数据结构的过程中,一定要多做练习和实践,深入理解每种数据结构的应用场景和实现细节。
数据结构必考知识点总结

数据结构必考知识点总结在准备考试时,了解数据结构的基本概念和相关算法是非常重要的。
以下是一些数据结构的必考知识点总结:1. 基本概念数据结构的基本概念是非常重要的,包括数据、数据元素、数据项、数据对象、数据类型、抽象数据类型等的概念。
了解这些概念有助于更好地理解数据结构的本质和作用。
2. 线性表线性表是数据结构中最基本的一种,它包括顺序表和链表两种实现方式。
顺序表是将数据元素存放在一块连续的存储空间内,而链表是将数据元素存放在若干个节点中,每个节点包含数据和指向下一个节点的指针。
了解线性表的概念和基本操作是非常重要的。
3. 栈和队列栈和队列是两种特殊的线性表,它们分别具有后进先出和先进先出的特性。
栈和队列的实现方式有多种,包括数组和链表。
掌握栈和队列的基本操作和应用是数据结构的基本内容之一。
4. 树结构树是一种非线性的数据结构,它包括二叉树、多路树、二叉搜索树等多种形式。
了解树的基本定义和遍历算法是必考的知识点。
5. 图结构图是一种非线性的数据结构,它包括有向图和无向图两种形式。
了解图的基本概念和相关算法是非常重要的,包括图的存储方式、遍历算法、最短路径算法等。
6. 排序算法排序是一个非常重要的算法问题,掌握各种排序算法的原理和实现方式是必不可少的。
常见的排序算法包括冒泡排序、选择排序、插入排序、快速排序、归并排序等。
7. 查找算法查找是另一个重要的算法问题,包括顺序查找、二分查找、哈希查找、树查找等。
了解各种查找算法的原理和实现方式是必考的知识点之一。
8. 算法复杂度分析算法的时间复杂度和空间复杂度是评价算法性能的重要指标,掌握复杂度分析的方法和技巧是非常重要的。
9. 抽象数据类型ADT是数据结构的一种概念模型,它包括数据的定义和基本操作的描述。
了解ADT的概念和实现方式是非常重要的。
10. 动态存储管理动态存储管理是数据结构中一个重要的问题,包括内存分配、内存释放、内存回收等。
了解动态存储管理的基本原理和实现方式是必考的知识点之一。
(完整word版)大学数据结构期末知识点重点总结(考试专用)

第一章概论1。
数据结构描述的是按照一定逻辑关系组织起来的待处理数据元素的表示及相关操作,涉及数据的逻辑结构、存储结构和运算2。
数据的逻辑结构是从具体问题抽象出来的数学模型,反映了事物的组成结构及事物之间的逻辑关系可以用一组数据(结点集合K)以及这些数据之间的一组二元关系(关系集合R)来表示:(K, R)结点集K是由有限个结点组成的集合,每一个结点代表一个数据或一组有明确结构的数据关系集R是定义在集合K上的一组关系,其中每个关系r(r∈R)都是K×K上的二元关系3.数据类型a。
基本数据类型整数类型(integer)、实数类型(real)、布尔类型(boolean)、字符类型(char)、指针类型(pointer)b。
复合数据类型复合类型是由基本数据类型组合而成的数据类型;复合数据类型本身,又可参与定义结构更为复杂的结点类型4.数据结构的分类:线性结构(一对一)、树型结构(一对多)、图结构(多对多)5。
四种基本存储映射方法:顺序、链接、索引、散列6。
算法的特性:通用性、有效性、确定性、有穷性7.算法分析:目的是从解决同一个问题的不同算法中选择比较适合的一种,或者对原始算法进行改造、加工、使其优化8.渐进算法分析a.大Ο分析法:上限,表明最坏情况b.Ω分析法:下限,表明最好情况c.Θ分析法:当上限和下限相同时,表明平均情况第二章线性表1.线性结构的基本特征a.集合中必存在唯一的一个“第一元素”b。
集合中必存在唯一的一个“最后元素"c.除最后元素之外,均有唯一的后继d。
除第一元素之外,均有唯一的前驱2.线性结构的基本特点:均匀性、有序性3。
顺序表a.主要特性:元素的类型相同;元素顺序地存储在连续存储空间中,每一个元素唯一的索引值;使用常数作为向量长度b。
线性表中任意元素的存储位置:Loc(ki)= Loc(k0)+ i * L(设每个元素需占用L个存储单元)c. 线性表的优缺点:优点:逻辑结构与存储结构一致;属于随机存取方式,即查找每个元素所花时间基本一样缺点:空间难以扩充d.检索:ASL=【Ο(1)】e。
大一上学期末数据结构与算法课程重点整理

大一上学期末数据结构与算法课程重点整理数据结构与算法是计算机科学与技术专业的重要基础课程,通过学习该课程可以帮助同学们更好地理解计算机程序的设计与实现。
在大一上学期末,我们对数据结构与算法的重点内容进行了整理和总结,以便同学们复习和备考。
以下是本学期末数据结构与算法课程的重点整理内容。
一、数据结构1. 线性表线性表是最基本、最简单、也是最常用的一种数据结构。
线性表的顺序存储结构和链式存储结构是线性表的两种存储结构。
线性表的相关操作包括插入、删除、查找等。
2. 栈与队列栈和队列是两种特殊的线性表。
栈是一种后进先出(LIFO)的数据结构,而队列是一种先进先出(FIFO)的数据结构。
栈和队列的应用广泛,包括表达式求值、递归函数的实现等。
3. 树与二叉树树是一种非线性的数据结构,树中的节点之间存在一对多的关系。
二叉树是树的一种特殊形式,每个节点最多只有两个子节点。
二叉树的遍历包括前序、中序和后序三种方式。
4. 图图是一种非线性的数据结构,由节点和边组成。
图的表示方式有邻接矩阵和邻接表两种,图的遍历包括深度优先搜索(DFS)和广度优先搜索(BFS)两种方式。
二、算法1. 排序算法排序算法是常见的算法之一,包括冒泡排序、选择排序、插入排序、快速排序、归并排序等。
不同的排序算法有不同的时间复杂度和空间复杂度,适用于不同的应用场景。
2. 查找算法查找算法用于在数据集合中寻找特定的元素,包括顺序查找、二分查找、哈希查找等。
不同的查找算法适用于不同的数据结构和数据规模。
3. 字符串匹配算法字符串匹配算法用于在文本中寻找特定的字符串模式,包括朴素算法、KMP算法、Boyer-Moore算法等。
不同的字符串匹配算法有不同的时间复杂度和空间复杂度。
4. 动态规划动态规划是一种解决多阶段决策问题的优化方法,通过将问题分解成子问题,然后保存子问题的解来避免重复计算。
动态规划在实际应用中有着广泛的应用,包括最短路径、最优子结构等问题的求解。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.. ;.. 第一章 概论 1.数据结构描述的是按照一定逻辑关系组织起来的待处理数据元素的表示及相关操作,涉及数据的逻辑结构、存储结构和运算 2.数据的逻辑结构是从具体问题抽象出来的数学模型,反映了事物的组成结构及事物之间的逻辑关系 可以用一组数据(结点集合K )以及这些数据之间的 一组二元关系(关系集合R )来表示:(K, R) 结点集K 是由有限个结点组成的集合,每一个结点代表一个数据或一组有明确结构的数据 关系集R 是定义在集合K 上的一组关系,其中每个关系r (r ∈R )都是K ×K 上的二元关系 3.数据类型 a.基本数据类型 整数类型(integer)、实数类型(real)、布尔类型(boolean)、字符类型(char )、指针类型(pointer ) b.复合数据类型 复合类型是由基本数据类型组合而成的数据类型;复合数据类型本身,又可参与定义结构更为复杂的结点类型 4.数据结构的分类:线性结构(一对一)、树型结构(一对多)、图结构(多对多) 5.四种基本存储映射方法:顺序、链接、索引、散列 6.算法的特性:通用性、有效性、确定性、有穷性 7.算法分析:目的是从解决同一个问题的不同算法中选择比较适合的一种,或者对原始算法进行改造、加工、使其优化 8.渐进算法分析 a .大Ο分析法:上限,表明最坏情况 b .Ω分析法:下限,表明最好情况 c .Θ分析法:当上限和下限相同时,表明平均情况 第二章 线性表 1.线性结构的基本特征 a.集合中必存在唯一的一个“第一元素” b.集合中必存在唯一的一个“最后元素” c.除最后元素之外,均有唯一的后继 d.除第一元素之外,均有唯一的前驱 2.线性结构的基本特点:均匀性、有序性 3.顺序表 a.主要特性:元素的类型相同;元素顺序地存储在连续存储空间中,每一个元素唯一的索引值;使用常数作为向量长度 b. 线性表中任意元素的存储位置:Loc(ki) = Loc(k0) + i * L (设每个元素需占用L 个存储单元) c. 线性表的优缺点: 优点:逻辑结构与存储结构一致;属于随机存取方式,即查找每个元素所花时间基本一样 缺点:空间难以扩充 d.检索:ASL=【Ο(1)】 e .插入:插入前检查是否满了,插入时插入处后的表需要复制【Ο(n )】 f.删除:删除前检查是否是空的,删除时直接覆盖就行了【Ο(n )】 4.链表 4.1单链表 a.特点:逻辑顺序与物理顺序有可能不一致;属于顺序存取的存储结构,即存取每个数据元素所花费的时间不相等 b.带头结点的怎么判定空表:head 和tail 指向单链表的头结点 c.链表的插入(q->next=p->next; p->next=q;)【Ο(n )】 d.链表的删除(q=p->next; p->next = q->next; delete q;)【Ο(n )】 e.不足:next 仅指向后继,不能有效找到前驱 4.2双链表 a.增加前驱指针,弥补单链表的不足 b.带头结点的怎么判定空表:head 和tail 指向单链表的头结点 c.插入:(q->next = p->next; q->prev = p; p->next = q; q->next->prev = q;) d.删除:(p->prev->next = p->next; p->next->prev = p->prev; p->prev = p->next = NULL; delete p;) 4.3顺序表和链表的比较 4.3.1主要优点 a.顺序表的主要优点 没用使用指针,不用花费附加开销;线性表元素的读访问非常简洁便利 b.链表的主要优点 无需事先了解线性表的长度;允许线性表的长度有很大变化;能够适应经常插入删除内部元素的情况 4.3.2应用场合的选择 a.不宜使用顺序表的场合 经常插入删除时,不宜使用顺序表;线性表的最大长度也是一个重要因素 b.不宜使用链表的场合 当不经常插入删除时,不应选择链表;当指针的存储开销与整个结点内容所占空间相 比其比例较大时,应该慎重选择 第三章 栈与队列 1.栈 a.栈是一种限定仅在一端进行插入和删除操作的线性表;其特点后进先出;插入:入栈(压栈);删除:出栈(退栈);插入、删除一端被称为栈顶(浮动),另一端称为栈底(固定);实现分为顺序栈和链式栈两种 b.应用: 1)数制转换 while (N) { N%8入栈; N=N/8;} while (栈非空){ 出栈; 输出;} 2)括号匹配检验 不匹配情况:各类括号数量不同;嵌套关系不正确 算法: 逐一处理表达式中的每个字符ch : ch=非括号:不做任何处理 ch=左括号:入栈 ch=右括号:if (栈空) return false else { 出栈,检查匹配情况, if (不匹配) return false } 如果结束后,栈非空,返回false 3)表达式求值 3.1中缀表达式: 计算规则:先括号内,再括号外;同层按照优先级,即先乘*、除/,后加+、减-;相同优先级依据结合律,左结合律即为先左后右 3.2后缀表达式: <表达式> ::= <项><项> + | <项> <项>-|<项> <项> ::= <因子><因子> * |<因子><因子>/|<因子> <因子> ::= <常数> • <常数> ::= <数字>|<数字><常数> <数字> ∷= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 3.3中缀表达式转换为后缀表达式 InfixExp 为中缀表达式,PostfixExp 为后缀表达式 初始化操作数栈OP ,运算符栈OPND ;OPND.push('#'); 读取InfixExp 表达式的一项 操作数:直接输出到PostfixExp 中; 操作符: 当‘(’:入OPND; 当‘)’:OPND 此时若空,则出错;OPND 若非空,栈中元 素依次弹出,输入PostfixExpz 中,直到遇到‘(’为止;若 为‘(’,弹出即可 当‘四则运算符’:循环(当栈非空且栈顶不是‘(’&& 当前运算符优先级>栈顶运算符优先级),反复弹出栈顶运 算符并输入到PostfixExp 中,再将当前运算符压入栈 3.4后缀表达式求值 初始化操作数栈OP ; while (表达式没有处理完) { item = 读取表达式一项; 操作数:入栈OP ; 运算符:退出两个操作数, 计算,并将结果入栈} c.递归使用的场合:定义是递归的;数据结构是递归的;解决问题的方法是递归的 2.队列 a.若线性表的插入操作在一端进行,删除操作在另一端进行,则称此线性表为队列 b.循环队列判断队满对空: 队空:front==rear ;队满:(rear+1)%n==front 第五章 二叉树 1.概念 a. 一个结点的子树的个数称为度数 b.二叉树的高度定义为二叉树中层数最大的叶结点的层数加1 c.二叉树的深度定义为二叉树中层数最大的叶结点的层数 d.如果一棵二叉树的任何结点,或者是树叶,或者恰有两棵非空子树,则此二叉树称作满二叉树 e.如果一颗二叉树最多只有最下面的两层结点度数可以小于2;最下面一层的结点都集中在该层最左边的位置上,则称此二叉树为完全二叉树 f.当二叉树里出现空的子树时,就增加新的、特殊的结点——空树叶组成扩充二叉树,扩充二叉树是满二叉树 外部路径长度E :从扩充的二叉树的根到每个外部结点(新增的空树叶)的路径长度之和 内部路径长度I :扩充的二叉树中从根到每个内部结点(原来二叉树结点)的路径长度之和 2.性质 a. 二叉树的第i 层(根为第0层,i ≥0)最多有2^i 个结点 b. 深度为k 的二叉树至多有2k+1-1个结点 c. 任何一颗二叉树,度为0的结点比度为2的结点多一个。
n0 = n2 + 1 d. 满二叉树定理:非空满二叉树树叶数等于其分支结点数加1 e. 满二叉树定理推论:一个非空二叉树的空子树(指针)数目等于其结点数加1 f. 有n 个结点(n>0)的完全二叉树的高度为⌈log2(n+1)⌉,深度为⌈log2(n+1)⌉− g. 对于具有n 个结点的完全二叉树,结点按层次由左到右编号,则有: 1) 如果i = 0为根结点;如果i>0,其父结点编号是 (i-1)/2 2) 当2i+1<n ,i 结点的左子结点是2i+1;否则i 结点没有左子结点 3) 当2i+2<n ,i 结点的右子结点是2i+2;否则i 结点没有右子结点 3.周游(重点为由前序中序/中序后序求得二叉树) a.深度优先周游二叉树,可以有下列三种周游顺序:(实现:栈) 1) 前序周游(tLR 次序):访问根结点;前序周游左子树;前序周游右子树 2) 中序周游(LtR 次序):中序周游左子树;访问根结点;中序周游右子树 3) 后序周游(LRt 次序):后序周游左子树;后序周游右子树;访问根结点 b. 广度周游二叉树:从二叉树的顶层(根结点)开始,自上至下逐层遍历;在同一层中,按照从左到右的顺序对结点逐一访问(实现:队列) 4.存储 链式存储结构, 顺序存储结构(仅限完全二叉树:因为完全二叉树排列紧凑) 5.二叉搜索树(BST ) a.判定:是一颗空树;或者是具有下列性质的二叉树: 对于任何一个结点,设其值为K ,则该结点的 左子树(若不空)的所有结点的值都小于K ; 右子树(若不空)的所有结点的值都大于K ; 它的左右子树也分别为二叉搜索树 b.性质:按照中序周游将各结点打印出来,得到的排列按照由小到大有序 c.检索: 从根结点开始,在二叉搜索树中检索值K 如果根结点储存的值为K ,则检索结束 如果K 小于根结点的值,则只需检索左子树 如果K 大于根结点的值,则只检索右子树 该过程一直持续到找到K 或者遇上叶子结点 如果遇上叶子结点仍没有发现K ,则查找失败 **查找关键码:把查找时所经过的点一次写出 d.插入: 用待插入结点与树根比较,若待插入的关键值小于树根的关键值,就进入左子树,否则进入右子树;在子树中,按照同样的方式沿检索路径直到叶结点,将新结点插入到二叉搜索树的叶子结点位置 e.创建:从空的BST 开始,将关键码按BST 定义一次插入 f.删除: 与插入相反,删除在查找成功之后进行,并且要求在删除二叉排序树上某个结点之后,仍然保持二叉排序树的特性,删除过程分为如下情况: 1)被删除的结点是叶子:直接将其删除即可 2)被删除的结点只有左子树或只有右子树:直接将要删除的点删除后,将该点的左(右)孩子和上面结点相连 3)被删除结点有左、右子树:若p 有左右子树,则在左子树里找中序周游的最后一个结点r ,将r 的右指针置成指向p 的右子树的根,用结点p 的左子树的根去代替被删除的结点p 6.堆 a.最小/大堆定义: 最小堆:是个关键码序列{k0, k1…kn-1},具有如下特性(i=0,1,…,⌊n/2⌋-1) k i ≤ k 2i+1(左孩子) k i ≤ k 2i+2(右孩子) (即父≤2个孩子) 类似可以定义最大堆 k i ≥ k 2i+1 k i ≥ k 2i+2 (即父≥2个孩子) b.建“初堆”:按序列建立完全二叉树,从其中最后一个有孩子的结点开始按堆的定义调整 c.插入:插入点追加到最后,自下而上依次比较父与子,直到满足堆的定义 d.删除:用最后结点替换被删结点,自上至下调整成堆 e.移出最小/大值:可以将堆中最后一个位置上的元素(数组中实际的最后一个元素)移到根的位置上,利用从左开始向下筛选对堆重新调整 7.Huffman 树 a.概念 路径:从树中一个结点到另一个结点之间的分支构成这两个结点间的路径 结点路径长度:从根结点到该结点的路径上分支的数目 树的路径长度:树中每个结点的路径长度之和 b.带权的路径长度 树中所有叶子结点的带权路径长度之和 =其中: :权值 :结点到根的路径长度 c.编码:左0右1 d.如何构建:选取序列中最小的相加生成树如此反复 第六章 树 1.概念 若<k ,k'>∈N ,则称k 是k'的父结 点,k'是的子结点 若有序对<k ,k'>及<k ,k ″>∈N , 则称k'k ″互为兄弟 若有一条由 k 到达ks 的路径,则 称k 是的祖先,ks 是k 的子孙 2.树/森林与二叉树的相互转换 a.树转换成二叉树 加线: 在树中所有兄弟结点之间加一连线 抹线: 对每个结点,除了其最左孩子外,与其余孩 子之间的连线 旋转: 45° b.二叉树转化成树 加线:若p 结点是双亲结点的左孩子,则将的右孩子,右孩子的右孩子,所有右孩子,都与p 的双亲用线连起来 线 调整:将结点按层次排列,形成树结构 c.森林转换成二叉树 将各棵树分别转换成二叉树 将每棵树的根结点用线相连 为轴心,顺时针旋转,构成二叉树型结构 d.二叉树转换成森林 抹线:将二叉树中根结点与其右孩子连线,及沿右分支搜索到 的所有右孩子间连线全部抹掉,使之变成孤立的二叉树 还原:将孤立的二叉树还原成树 3.周游 a.先根(次序)周游 若树不空,则先访问根结点,然后依次先根周游各棵子树 b.后根(次序)周游 若树不空,则先依次后根周游各棵子树,然后访问根结点 c.按层次周游 若树不空,则自上而下自左至右访问树中每个结点 4.存储结构 “左子/右兄”二叉链表表示法:结点左指针指向孩子,右结点指向右兄弟,按树结构存储,无孩子或无右兄弟则置空 5. “UNION/FIND 算法”(等价类) 判断两个结点是否在同一个集合中,查找一个给定结点的根结点的过程称为FIND 归并两个集合,这个归并过程常常被称为UNION “UNION/FIND ”算法用一棵树代表一个集合,如果两个结点在同一棵树中,则认为它们在同一个集合中;树中的每个结点(除根结点以外)有仅且有一个父结点;结点中仅需保存父指针信息,树本身可以 存储为一个以其结点为元素的数组 6.树的顺序存储结构 a. 带右链的先根次序表示法 在带右链的先根次序表示中,结点按先根次序顺序存储在一片连续的存储单元中 每个结点除包括结点本身数据外,还附加两个表示结构的信息字段,结点的形式为:info 是结点的数据;rlink 是右指针,指向结点的下一个兄弟;ltag 是一个左标记,当结点没有子结点(即对应二 叉树中结点没有左子结点时),ltag 为 1,否则为 0 b. 带双标记位的先根次序表示法 规定当结点没有下一个兄弟(即对应的二叉树中结点没有右子结点时)rtag 为1,否则为0 c. 带双标记位的层次次序表示法 结点按层次次序顺序存储在一片连续的存储单元中 第七章 图 1.定义 a.假设图中有n 个顶点,e 条边: 含有e=n(n-1)/2条边的无向图称作完全图 含有e=n(n-1) 条弧的有向图称作有向完全图 若边或弧的个数e < nlogn ,则称作稀疏图,否则称作稠密图 b. 顶点的度(TD)=出度(OD)+入度(ID) 顶点的出度: 以顶点v 为弧尾的弧的数目 顶点的入度: 以顶点v 为弧头的弧的数目 c.连通图、连通分量 若图G 中任意两个顶点之间都有路径相通,则称此图为连通图 若无向图为非连通图,则图中各个极大连通子图称作此图的连通分量 d.强连通图、强连通分量 对于有向图,若任意两个顶点之间都存在一条有向路径,则称此有向图为强连通图 否则,其各个极大强连通子图称作它的强连通分量 e.生成树、生成森林 假设一个连通图有n 个顶点和e 条边,其中n-1条边和n 个顶点构成一个极小连通子图,称该极小连通子图为此连通图的生成树 对非连通图,则将由各个连通分量构成的生成树集合称做此非连通图的生成森林 2.存储结构 a.相邻矩阵表示法 表示顶点间相邻关系的矩阵 若G 是一个具有n 个顶点的图,则G 的相邻矩阵是如下定义的n ×n 矩阵: A[i,j]=1,若(Vi, Vj)(或<Vi, Vj>)是图G 的边 A[i,j]=0,若(Vi, Vj)(或<Vi, Vj>)不是图G 的边 b.邻接表表示法 为图中每个顶点建立一个单链表,第i 个单链表中的结点表示依附于顶点Vi 的边(有向图中指以Vi 为尾的弧)(建立单链表时按结点顺序建立) 3.周游 a. 深度优先周游: 从图中某个顶点V0出发,访问此顶点,然后依次从V0的各个未被访问的邻接点出发,深度优先搜索遍历图中的其余顶点,直至图中所有与V0有路径相通的顶点都被访问到为止 b. 广度优先周游: 从图中的某个顶点V0出发,并在访问此顶点之后依次访问V0的所有未被访问过的邻接点,随后按这些顶点被访问的先后次序依次访问它们的邻接点,直至图中所有与V0有路径相通的顶点都被访问到为止,若此时图中尚有顶点未被访问,则另选图中一个未曾被访问的顶点作起始点,重复上述过程,直至图中所有顶点都被访问到为止 4.拓扑排序 拓扑排序的方法是:1)选择一个入度为0的顶点且输出之 2)从图中删掉此顶点及所有的出边 3)回到第1步继续执行,直至图空或者图不空但找不到无前驱(入度为0)的顶点为止 5.单源最短路径(Dijkstra 算法) 6.每对顶点间的最短路径(Floyd 算法) 7.最小生成树 a.Prim 算法 b.Kruskal 算法 c.两种算法比较:Prim 算法适合稠密图,Kruskal 算法适合稀疏图 第八章 内排序 算法 最大时间 平均时间 直接插入排序 Θ(n2) Θ(n2) 冒泡排序 Θ(n2) Θ(n2) 直接选择排序 Θ(n2) Θ(n2) Shell 排序 Θ(n3/2) Θ(n3/2) 快速排序 Θ(n2) Θ(nlog n) 归并排序 Θ(nlog n) Θ(nlog n) 堆排序 Θ(nlog n) Θ(nlog n) 桶式排序 Θ(n+m) Θ(n+m) 基数排序 Θ(d ·(n+r)) Θ(d ·(n+r)) 最小时间 S(n) 稳定性 Θ(n) Θ(1) 稳定 Θ(n) Θ(1) 稳定 Θ(n2) Θ(1) 不稳定 Θ(n3/2) Θ(1) 不稳定 Θ(nlog n) Θ(log n) 不稳定 Θ(nlog n) Θ(n) 稳定 Θ(nlog n) Θ(1) 不稳定 Θ(n+m) Θ(n+m) 稳定 Θ(d ·(n+r)) Θ(n+r) 稳定 第十章 检索 1.平均检索长度(ASL )是待检索记录集合中元素规模n 的函数, 其定义为: ASL= Pi 为检索第i 个元素的概率;Ci 为找到第i 个元素所需的比较次数 2.散列 a.除余法 用关键码key 除以M(取散列表长度),并取余数作为散列地址 散列函数为:hash(key) = key mod M b.解决冲突的方法 开散列方法:把发生冲突的关键码存储在散列表主表之外(在主表外拉出单链表) 闭散列方法:把发生冲突的关键码存储在表中另一个位置上 c.线性探查 基本思想:如果记录的基位置存储位置被占用,就在表中下移,直到找到一个空存储位置;依次探查下述地址单元:d0+1,d0+2,...,m-1,0, 1,..., d0-1;用于简单线性探查的探查函数是:p(K, i) = i d.散列表的检索 1.假设给定的值为K ,根据所设定的散列函数h ,计算出散列地址h(K) 2. 如果表中该地址对应的空间未被占用,则检索失败,否则将该地址中的值与K 比较 3. 若相等则检索成功;否则,按建表时设定的处理冲突方法查找探查序列的下一个地址,如此反复下去,直到某个地址空间未被占用(可以插入),或者关键码比较相等(有重复记录,不需插入)为止 e.散列表的删除:删除后在删除地点应加上墓碑(被删除标记) f.散列表的插入:遇到墓碑不停止,知道找到真正的空位置 第十一章 索引技术 1.概念: a.主码:数据库中的每条记录的唯一标识 b.辅码:数据库中可以出现重复值的码 2.B 树 a.定义:B 树定义:一个m 阶B 树满足下列条件: (1) 每个结点至多有m 个子结点; (2) 除根和叶外 其它每个结点至少有⌈⌉个子结点; (3) 根结点至少有两个子结点 例外(空树,or 独根) (4) 所有的叶在同一层,可以有⌈⌉- 1到m-1个关键码 (5) 有k 个子结点的非根结点恰好包含k-1个关键码 b.查找 在根结点所包含的关键码K1,…,Kj 中查找给定的关键码值(用顺序检索(key 少)/二分检索(key 多));找到:则检索成功;否则,确定要查的关键码值是在某个Ki 和Ki+1之间,于是取pi 所指结点继续查找;如果pi 指向外部结点,表示检索失败. c.插入 找到的叶是插入位置,若插入后该叶中关键码个数<m,插入完成;否则分裂,中间为分界码(插入到父结点),若父结点上溢则继续向上分裂 d.删除 删除的关键码不在叶结点层:先把此关键码与它在B 树里的后继对换位置,然后再删除该关键码(叶中删) 删除的关键码在叶结点层:删除后关键码个数不小于⌈⌉- 1——直接删除 关键码个数小于⌈⌉- 1,如果兄弟结点关键码个数不等于⌈⌉- 1——从兄弟结点移若干个关键码到该结点中来(父结点中的一个关键码要做相应变化) 如果兄弟结点关键码个数等于⌈⌉- 1——合并。