数据结构(c语言版)复习知识点

第一章绪论

1.1数据、数据元素、数据项、数据结构等基本概念

1.数据（data）：客观事物的符号表示，在计算机科学中指所有能输入计算机中并被计算机处理的符号总称。整数、浮点数、字符串、声音、图像。

2.数据元素（dataelement）：数据的基本单位，在计算机程序中通常作为一个整体进行考虑和处理。

3.一个数据元素可能由若干个数据项（dataitem）组成。数据元素是一个数据整体中相对独立的单位。但它还可以分割成若干个具有不同属性的项（字段）。故不是组成数据的最小单位。数据项是构成数据的最小单位。

4.数据对象（dataobject）：性质相同的数据元素的集合，是数据的一个子集。

5.数据结构（datastructure）：数据元素以及数据元素之间存在的关系。

6.数据结构主要描述：数据元素之间的逻辑关系、数据在计算机系统中的存储方式和数据的运算，即数据的逻辑结构、存储结构和数据的操作集合

1.2数据结构的逻辑结构、存储结构的含义及其相互关系

1.数据的逻辑结构：用形式化方式描述数据元素间的关系。数据的逻辑结构独立于计算机，是数据本身所固有的。用于算法的设计。

两大类逻辑结构：线性结构（线性表、栈、队列、数组和串），非线性结构（树和图）。

2.数据的物理结构（也称存储结构）：数据在计算机中的具体表示。包括数据元素的表示和关系的表示。存储结构是逻辑结构在计算机存贮器中的映像，必须依赖于计算机。用于算法的实现。

数据的存储方式可分为如下两类：顺序存储、链接存储。

1.3算法

1.算法的定义：算法是对特定问题求解步骤的一种描述，是指令的有限序列。

2.算法的特性：

有穷性——算法必须在执行有穷步之后结束，而且每一步都可在有穷时间内完成

确定性——每条指令无二义性。并且，相同的输入只能得到相同的输出；

可行性——算法中描述的每一操作，都可以通过已实现的基本运算来实现。

输入——算法有零至多个输入。输出——算法有一个至多个输出

3.算法效率的度量：时间复杂度和空间复杂度及计算。

第二章线性表

2.1线性表的逻辑结构特征

存在唯一的一个被称作第一个的数据元素；存在唯一的一个被称作最后一个的数据元素；除第一个元素之外，集合中的每个数据元素均只有一个前驱；除最后一个元素之外，集合中的每个数据元素均只有一个后继。

2.2线性表的顺序存储结构

1.用一组连续的存储单元依次存储线性表的数据元素。在线性表的顺序存储表示中，只要确定了线性表的起始位置，线性表中任一数据元素都可随机存取。线性表的顺序存储结构是一种随机存取的存储结构。

LOC(ai+1)=LOC(ai)+1

LOC(ai+1)=LOC(a1)+i*1

LOC(ai)表示元素ai的存储位置；LOC(a1)表示第一个数据元素的存储位置，通常称为线性表的起始位置或基地址每个数据元素占用1个存储单元。

2.线性顺序表上的插入是指在第i(1≤i≤n+1)个位置插入一个新的数据元素，需将第i至第n共(n-i+1)个元素后移

注意：

顺序表中数据区域有listSize个存储单元，所以在向顺序表中做插入时先检查表空间是否满了，在表满的情况下不能再做插入，否则产生溢出错误。

要检验插入位置的有效性，这里i的有效范围是：1<=i<=n+1，其中n为原表长。

注意数据的移动方向

算法时间复杂度

移动元素个数：n-i+1

平均移动元素个数：n/2

T（n）=O（n）；

3.线性顺序表上的删除是指第i(1≤i≤n)个数据元素删除掉，需将第i+1至第n共（n-i)个元素前移

注意：

删除第i个元素，i的取值为1<=i<=n,否则第i个元素不存在，因此，要检查删除位置的有效性。

当表空时不能做删除。

删除ai之后，该数据已不存在，如果需要，先取出ai，再做删除。

算法时间复杂度：

移动元素个数：n-i

平均移动元素个数：（n-1）/2

T（n）=O（n）；

4.线性表的顺序存储。

优点：逻辑相邻，物理相邻可以实现数据元素的随机存取；

缺点：在作插入或是删除操作时，需要移动大量数据元素

2.3线性表的链式存储结构

1.线性表链式存储结构的特点：用一组任意的存储单元存储线性表的数据元素。在线性表的链式存储中，在进行插入或是删除操作时，不需要进行数据元素的移动，但不能实现数据元素的随机存取。

2.线性链表的表示：数据元素、数据元素之间的关系；数据域存储数据元素，指针域存储数据元

素之间的关系：直接后继的存储位置，线性链表：每个节点只包含一个指针域

3.假定指针p指向线性链表中的第i个数据元素，则p->next为指向线性链表中第i+1个数据元素的指针。即p->data为ai，p->next->data为ai+1。

(*p)表示p所指向的结点

(*p).data p->data表示p指向结点的数据域

(*p).next p->next表示p指向结点的指针域

4.在单链表中查找第i个元素

StatusgetElem_L(LinkListL,inti,ElemType&e){ //获取线性链表中的第i个数据元素p=L->next;j=1;

while(p&&j

{

p=p->next;++j;

}

if(!p‖j>i)returnERROR;

returnp->data;

}//GetElem_L

5.在单链表中插入数据元素

S->next=P->next；

P->next=S;

StatuslistInsert_L(LinkList&L,inti,ElemTypee){

p=L;j=0;

while(p&&jnext;++j；

}

if(!p‖j>i-1)returnERROR;

s=(LinkList)malloc(sizeof(LNode));s->data=e;

s->next=p->next;p->next=s;

return OK;

}

6.在单链表中删除数据元素

P-＞next=P-＞next-＞next; 或

q=p->next;

p->next=q->next;free(q);

StatuslistDelete_L(LinkList&L,inti){

p=L;j=0;

while(p->next&&j

p=p->next;++j;

}

if(!(p->next) ‖ j>i-1)

return ERROR;//删除位置不合理q

=p->next;

p->next=q->next;free(q);//删除并释放结点

return OK;

}//ListDelete_L

7.循环链表：表中最后一个结点的指针域指向头结点，整个链表形成一个环。

循环链表的操作和单链表基本一致，差别仅在于，判别链表中最后一个结点的条件不再是"后继是否为空"，而是"后继是否为头结点"。

(1)单链表p或p->next==NULL

(2)循环链表p->next==L

8.双向链表有两个指针域，一个指向直接前驱，一个指向直接后继。

1）向双向链表中插入一个结点：

s-＞prior=p-＞prior；

p-＞prior-＞next=s；

s-＞next=p；

p-＞prior=s；

2）向双向链表中插入一个结点：：

s-＞prior=p；

s-＞next=p->next；

p->next-＞prior=s；

p-＞next=s；

3）从双向链表中删除一个结点

①p-＞prior-＞next=p-＞next；

②p-＞next-＞prior=p-＞prior；

第三章栈和队列

3.1栈和队列的逻辑结构特征

1.栈（stack）和队列（queue）是两种重要的线性结构，特殊性在于其基本操作是线性表操作的子集，是操作受限的线性表（操作限定在两个端点进行），为具有限定性的数据结构。栈按“后进先出”的规则进行操作，队列按“先进先出”的规则进行操作。

2.栈是限定在表尾进行插入和删除操作的线性表。允许插入,删除的一端称为栈顶(top),另一端称为栈底(bottom)。

3.栈的基本运算主要有两个：Push(S,e)，进栈，插入（压入）元素e为新的栈顶元素，Pop(S)，出栈，删除（弹出）S的栈顶元素。如：若元素入栈的顺序为1234，为了得到1342出栈顺序，操作序列为：Push(S,1)，Pop(S)，Push(S,2)，Push(S,3)，Pop(S)，Push(S,4)，Pop(S)，Pop(S)。

3.2栈的顺序存储结构

1.顺序栈：利用一组地址连续的存储单元一次存放从栈底到栈顶的数据元素，用指针top指示栈顶元素在顺序栈中的位置。

能入栈;否则出现空间溢出，引起错误，这种现象称为上溢。

出栈和读栈顶元素操作，先判栈是否为空，为空时不能操作，否则产生错误。通常栈空时

常作为一种控制转移的条件。

2.用数组的索引值表示栈底和栈顶

top[0]表示第一个栈的栈顶;top[1]表示第二个栈的栈顶

栈空:top[0]=-1;top[1]=n

入栈:a[++top[0]]=e;a[--top[1]]=e

栈满:top[0]+1=top[1]

出栈:e=a[top[0]--];e=a[top[1]++]

4.关于顺序栈的说明:入栈时，首先判栈是否满了，栈满时，不能入栈;否则出现空间溢出，引起错误，这种现象称为上溢。出栈和读栈顶元素操作，先判栈是否为空，为空时不能操作，否则产生错误。通常栈空时常作为一种控制转移的条件。

3.3栈的顺序链式存储

入栈：

p=newLNode;//建新的结点

if(!p)exit(1);//存储分配失败

p->data=e;p->next=S->top;//链接到原来的栈顶

S->top=p;//移动栈顶指针

出栈：

if(!S->top)returnNULL;else

{e=S->top->data;//返回栈顶元素

q=S->top;

S->top=S->top->next;//修改栈顶指针

free(q);//释放被删除的结点空间

return e;

}

3.4栈的应用举例

1.数制转换

#defineNUM 10

voidconversion(intN，intr){

int s[NUM],top; /*定义一个顺序栈*/

int x;

top=-1; /*初始化栈*/

while(N){

s[++top]=N%r;/*余数入栈*/

N=N/r; /*商作为被除数继续*/

}

while(top!=-1){

x=s[top--];

printf(“%d”,x);

}

2.括号匹配的检验：

3.表达式求值：熟悉前缀、中缀和后缀表达式，表达式求值时栈的状态变化。

4.栈与递归的实现：熟悉使用递归解决

3.5队列的逻辑结构特征

队列:只允许在一端进行插入，而在另一端删除元素。允许插入的一端为队尾(rear),允

许删除的一端为队头(front)。

3.6队列的顺序存储结构

1.循环队列的顺序存储结构:队列存放数组被当作首尾相接的表处理。队头、队尾指针加1时用语言的取模(余数)运算实现。

队列初始化：front=rear=0;

队空条件：front==rear;

队满条件：(rear+1)%MAXQSIZE==front

队头指针进1:front=(front+1)%MAXQSIZE;

队尾指针进1:rear=(rear+1)%MAXQSIZE;

队中元素个数：（rear-front+MAXQSIZE）%MAXQSIZE

2.链式队列：

进队：

p=(QueuePtr)malloc(sizeof(QNode));

if(!p)return0;//存储分配失败

p->data=e; p->next=NULL;

Q->rear->next=p; Q.rear=p;

出队：

if(Q->front==Q->rear) returnNULL; p=Q->front->next; e=p->data;

Q->front->next=p->next;

if(Q->rear==p) Q->rear=Q->front; free(p); returne;

第四章串、数组和广义表

4.1串相关术语

串即字符串，是由零个或多个字符组成的有限序列，是数据元素为单个字符的特殊线性表。

串长：串中字符个数（n≥0）.n=0时称为空串。

空白串：由一个或多个空格符组成的串。

子串：串s中任意个连续的字符序列叫s的子串;s叫主串。

子串位置：子串的第一个字符的序号。

字符位置：字符在串中的序号

串相等：串长度相等，且对应位置上字符相等。

串的逻辑结构和线性表极为相似，区别仅在于串的数据对象约束为字符集；串的基本操作和线性表有很大差别。在线性表的基本操作中，大多以“单个元素”作为操作对象；在串的基本操作中，通常以“串的整体”作为操作对象。

4.2串的基本操作

熟悉以下操作的意义：

StrAssign(&T,chars)

StrCopy(&T,S)

DestroyString(&S)

StrEmpty(S)

StrCompare(S,T)

StrLength(S)

Concat(&T,S1,S2)

SubString(&Sub,S,pos,len)

Index(S,T,pos)

Replace(&S,T,V)

StrInsert(&S,pos,T)

StrDelete(&S,pos,len)

ClearString(&S)

4.3数组

1.二维数组的顺序存储结构及地址计算方式。

设一般的二维数组是A[c1..d1,c2..d2]，这里c1,c2不一定是0。L：单个元素长度

则行优先存储时的地址公式为：

LOC(aij)=LOC(c1，c2)+[(i-c1)*(d2-c2+1)+(j-c2)]*L

二维数组列优先存储的通式为：

LOC(aij)=LOC(ac1，c2)+[(j-c2)*(d1-c1+1)+(i-c1)]*L

2.对称矩阵的压缩存储：在对称矩阵中，只需存储对称矩阵的下半部分。

所需空间数为：n×（n+1）/2。

设一般的二维数组是A[c1..d1,c2..d2]，这里c1,c2不一定是0，对应一维存储空间SA的起始值是C3。

则行优先存储时的地址公式为：

3.三角矩阵：若n阶方阵中下(上)三角(不包括对角线)中的元均为常量c或0，则称为上(下) 三角矩阵；下三角矩阵：主队角线以上均为同一个常数；上三角矩阵，主队角线以下均为同一个常数。与对称矩阵类似，不同之处在于存完下三角中的元素之后，紧接着存储对角线上方的常量，因为是同一个常数，所以存一个即可，这样一共存储了n*(n+1)/2+1个元素，设存入数组：SA[n*(n+1)/2+1]中，这种的存储方式可节约n*(n-1)/2个存储单元。

4.理解下、上三角矩阵：SAk与ai,j的对应关系。

5.稀疏矩阵：将每个非零元素用一个三元组（i,j,aij）来表示，将三元组按行优先的顺序，同一行中列号从小到大的规律排列成一个线性表，称为三元组表，每个稀疏矩阵可用一个三元组表来表示。

4.4广义表

1.广义表是递归定义的线性结构，是线性表的推广，也称为列表(lists)

记为：LS=(1,2,...,n)。

2.广义表与线性表的区别和联系:广义表中元素既可以是原子类型，也可以是列表；当每个元素都为原子且类型相同时，就是线性表。

3.广义表LS=(1,2,…,n)的的性质:

1)广义表中的数据元素有相对次序;

2)广义表的长度定义为最外层包含元素个数;

3)广义表的深度定义为所含括弧的最大重数;

注意:“原子”的深度为0;“空表”的深度为1

4)广义表是一种多层次的数据结构。广义表的元素可以是单元素，也可以是子表，而子表

的元素还可以是子表，…。

5)广义表可以是递归的表。广义表的定义并没有限制元素的递归，即广义表也可以是其自

身的子表。

6)广义表可以为其他表所共享。

7) 任何一个非空广义表LS=( 1, 2,…, n)

均可分解为:表头Head(LS)=1和表尾Tail(LS)=( 2,…, n) 两部分.

任何一个非空表，表头可能是原子，也可能是列表；但表尾一定是列表

4.广义表的基本运算:广义表有两个重要的基本操作，即取头操作（Head）和取尾操作（Tail）。要熟悉这个两个操作，正确给出一个广义表的这两个操作的结果。

第五章树及二叉树

5.1树结构及基本概念

1.树具有下面两个特点：

树的根结点没有前驱结点，除根结点之外的所有结点有且只有一个前驱结点。

树中所有结点可以有零个或多个后继结点。

2.基本术语：

结点(node): 表示树中的元素，包括数据项及若干指向其子树的分支

结点的度(degree):结点拥有的子树数称为~

叶子(leaf):度为0的结点

孩子(child): 结点子树的根称为该结点的孩子

双亲(parents): 孩子结点的上层结点

兄弟(sibling): 同一双亲的孩子

树的度: 一棵树中最大的结点度数

结点的层次(level): 从根结点算起，根为第一层，它的孩子为第二层……

深度(depth): 树中结点的最大层次数

森林(forest): m(m0)棵互不相交的树的集合

5.2二叉树结构

1.定义:二叉树是n(n 0)个结点的有限集，它或为空树(n=0)，或由一个根结点和两棵分别

称为左子树和右子树的互不相交的二叉树构成

2.特点：每个结点至多有二棵子树(即不存在度大于2的结点)二叉树的子树有左、右之分，且其次序不能任意颠倒

3.基本形态:五种

4.二叉树的性质

性质1:在二叉树的第i层上至多有2i-1个结点。

性质2:深度为k的二叉树，至多有2k-1个结点。

性质3:对任意二叉树BT，若叶结点数为n0，度为2的结点数为n2，则：n0=n2+1

性质4:具有n个结点的完全二叉树的深度为log2n 1

性质5:如果对一棵有n个结点的完全二叉树的结点按层序编号，则对任一结点i(1i n)，有：

1)如果i=1，则结点i是二叉树的根，无双亲；如果i>1，则其双亲是结点i/2

2)如果2i>n，则结点i无左孩子；如果2i n，则其左孩子是结点2i

3)如果2i+1>n，则结点i无右孩子；如果2i+1n，则其右孩子是结点2i+1

5.几种特殊形式的二叉树：

满二叉树：一棵深度为k且有2k1个结点的二叉树称为~

特点：每一层上的结点数都是最大结点数

完全二叉树：深度为k，有n个结点的二叉树当且仅当其每一个结点都与深度为k的满二叉

树中编号从1至n的结点一一对应时，称为~

特点：叶子结点只可能在层次最大的两层上出现；对任一结点，若其右分支下子孙的最大层次为l，则其左分支下子孙的最大层次必为l或l+1

5.3二叉树存储

1.二叉树的顺序存储结构：按满二叉树的结点层次编号，依次存放二叉树中的数据元素

特点：结点间关系蕴含在其存储位置中；浪费空间，适于存满二叉树和完全二叉树

2.二叉树的链式存储结构（二叉链表）：在n个结点的二叉链表中，有n+1个空指针域

3.二叉树的链式存储结构（三叉链表）

5.4二叉树遍历

1.二叉树的遍历：

先序遍历(DLR)：先访问根结点,然后分别先序遍历左子树、右子树

中序遍历(LDR)：先中序遍历左子树，然后访问根结点，最后中序遍历右子树

后序遍历(LRD)：先后序遍历左、右子树，然后访问根结点

2.遍历的递归算法:

voidpreOrder(bt){/*先序遍历二叉树bt*/

if(bt){/*递归调用的结束条件为bt为空*/

visit(bt->data);/*访问结点的数据域*/

preorder(bt->lchild);/*先序递归遍历bt的左子树*/

preorder(bt->rchild);/*先序递归遍历bt的右子树*/ }

}

voidinOrder(bt){/*中序遍历二叉树bt*/

if(bt){/*递归调用的结束条件为bt为空*/

inOrder(bt->lchild); /*中序递归遍历bt的左子树*/

visit(bt->data); /*访问结点的数据域*/

inOrder(bt->rchild); /*中序递归遍历bt的右子树*/

}

void p ostOrder(bt){/*后序遍历二叉树bt*/

if(bt){/*递归调用的结束条件为bt为空*/

postOrder(bt->lchild);/*后序递归遍历bt的右子树*/

postOrder(bt->rchild);/*后序递归遍历bt的右子树*/

visit(bt->data); /*访问结点的数据域*/

}

5.5线索二叉树

1.线索二叉树的定义

前驱与后继：在二叉树的先序、中序或后序遍历序列中两个相邻的结点互称为~

线索：指向前驱或后继结点的指针称为~

线索二叉树：加上线索的二叉链表表示的二叉树叫~

线索化：对二叉树按某种遍历次序使其变为线索二叉树的过程叫~

2.线索二叉树的实现

在有n个结点的二叉链表中必定有n+1个空链域。在线索二叉树的结点中增加两个标志域ltag :若ltag=0,lchild域指向左孩子；若ltag=1,lchild域指向其前驱

rtag :若rtag=0,rchild域指向右孩子；若rtag=1,rchild域指向其后继

3.在中序线索二叉树中找结点后继的方法

rt=1,则rc域直接指向其后继

rt=0,则结点的后继应是其右子树的左链尾（lt=1)的结点

4.在中序线索二叉树中找结点前驱的方法：

lt=1,则lc域直接指向其前驱

lt=0,则结点的前驱应是其左子树的右链尾（rt=1)的结点

5.6树和森林

1.树和森林与二叉树之间的转换方法: 孩子兄弟表示法

5.7赫夫曼树

1.赫夫曼树(Huffman)——带权路径长度最短的树

2.赫夫曼算法

1）根据给定的n个权值构成n棵二叉树的集合F，其中每棵二叉树中只有一个带权值的结点；

2）在F中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树，且置新的二叉树的根结点的权值为其左、右子树上根结点的权值之和；

3）在F中删除这两棵树，同时将新得到的二叉树加入到F中；

4）重复2)和3)，直到F中只含一棵树为止

3.Huffman编码：数据通信用的二进制编码

1）思想：根据字符出现频率编码，使电文总长最短

2）编码：根据字符出现频率构造Huffman树，然后将树中结点引向其左孩子的分支标“0”，引向其右孩子的分支标“1”；每个字符的编码即为从根到每个叶子的路径上得到的0、1序列

3）译码：从Huffman树根开始，从待译码电文中逐位取码。若编码是“0”，则向左走；若编码是“1”，则向右走，一旦到达叶子结点，则译出一个字符；再重新从根出发，直到电文结束第六章图

6.1图的术语

图的常用术语及含义:有向图、无向图、完全图、有向完全图、稀疏图、稠密图、网、邻接点、路径、简单路径、回路或环、简单回路、连通、连通图、强连通图、生成树。用n表示

图中顶点数目，用e表示图中边或弧的数目：0≤e≤?*n(n-1)（无向图），0≤e≤n(n-1)

（有向图）

6.2图的邻接矩阵存储表示

1.图的数组(邻接矩阵)存储表示

2.图的邻接矩阵存储方法具有以下特点：

（1）无向图的邻接矩阵一定是一个对称矩阵。因此，在具体存放邻接矩阵时只需存放上（或下）三角矩阵的元素即可。

（2）对于无向图，邻接矩阵的第i行（或第i列）非零元素的个数正好是第i个顶点的度TD(vi)。（3）对于有向图，邻接矩阵的第i行（或第i列）非零元素的个数正好是第i个顶点的出度OD(vi)（或入度ID(vi)）。

3.图的邻接矩阵存储方法的优点：用邻接矩阵方法存储图，很容易确定图中任意两个顶点之间是否有边相连

4.图的邻接矩阵存储方法的局限性：要确定图中有多少条边，则必须按行、按列对每个元素进行检测，所花费的时间代价很大。存储空间为O(n2),适用于稠密图。图的邻接表存储表示6.3图的邻接表存储表示

1.邻接表(AdjacencyList)是图的一种顺序存储与链式存储结合的存储方法。

对于图G中的每个顶点vi，将所有邻接于vi的顶点vj链成一个单链表，这个单链表就称为顶点vi的邻接表，再将所有顶点的邻接表表头放到数组中，就构成了图的邻接表。

2.邻接表表示中包括两种结点结构：

3.邻接表表示法的优点：在邻接表上容易找到任一顶点的第一个邻接点和下一个邻接点

4.邻接表表示法的局限性：要判定任意两个顶点（vi和vj）之间是否有边或弧相连，则需搜索第i个或第j个链表，因此，不及邻接矩阵方便

6.4图的遍历

1.图的深度优先遍历(depth-firstsearch，DFS)：假设初始状态是图中所有顶点未曾被访问，则深度优先搜索可从图中某个顶点v出发，访问此顶点；然后依次从v的未被访问的邻接点出发深度优先遍历图；直至图中所有和v有路径相通的顶点都被访问到；若此时图中尚有顶点未被访问，则另选图中一个未曾被访问的顶点作起始点，重复上述过程，直至图中所有顶点都被访问到为止。

2.图的广度优先遍历(breadth-firstsearch，BFS)：假设从图中某顶点v出发，在访问了v

之后依次访问v的各个未曾访问过的邻接点；然后分别从这些邻接点出发依次访问它们的邻接点，并使“先被访问的顶点的邻接点”先于“后被访问的顶点的邻接点”被访问；直至图中所有已被访问的顶点的邻接点都被访问到。若此时图中尚有顶点未被访问，则另选图中一个未曾被访问的顶点作起始点，重复上述过程，直至图中所有顶点都被访问到为止。

6.5最小生成树

1.生成树

1)一个连通图的生成树是由n-1条边且包含G的所有顶点的树组成。

2)可按深度或广度优先遍历来创建生成树。

3)由深度优先遍历得到的为深度优先生成树；

4)由广度优先遍历得到的为广度优先生成树。

5)对于非连通图，通过这样的遍历，将得到的是生成森林。

2.最小生成树：如果无向连通图是一个网，那么，它的所有生成树中必有一棵边的权值总和最

小的生成树，我们称这棵生成树为最小生成树，简称为最小生成树

3.普里姆算法的基本思想:取图中任意一个顶点v作为生成树的根，之后往生成树上添加新的顶点w。在添加的顶点w和已经在生成树上的顶点v之间必定存在一条边，并且该边的权值在所有连通顶点v和w之间的边中取值最小。之后继续往生成树上添加顶点，直至生成树上含有n-1

个顶点为止。

4.克鲁斯卡尔算法：先构造一个只含n个顶点的子图SG，然后从权值最小的边开始，若它的添

加不使SG中产生回路，则在SG上加上这条边，如此重复，直至加上n-1条边为止。

5.普里姆算法：时间复杂度：O(n2)，适应范围：稠密图克鲁斯卡尔算法：时间复杂度：O(eloge),适应范围：稀疏图

6.6拓扑排序

1.拓扑排序:

按照有向图给出的次序关系，将图中顶点排成一个线性序列，对于有向图中没有限定次序关系的顶点，则可以人为加上任意的次序关系。由此所得顶点的线性序列称之为拓扑有序序

列

2.检查有向图中是否存在回路的方法之一，是对有向图进行拓扑排序。

3.AOV网:用顶点表示活动,边表示活动间的先后关系的有向图称为顶点活动网,简称AOV网

4.拓扑排序算法

1)从有向图中选取一个没有前驱的顶点，并输出之;

2)从有向图中删去此顶点以及所有以它为尾的弧;

重复上述两步，直至图空，或者图不空但找不到无前驱的顶点为止。

6.7关键路径

1.若在带权的有向图中，以：顶点表示事件；有向边表示活动；边上的权值表示活动的开销（如该活动持续的时间）。则此带权的有向图称为AOE(activityonedge)网。

2.由于AOE网中的某些活动能够同时进行，故完成整个工程所必须花费的时间应该为：源点到终点的最大路径长度（这里的路径长度是指该路径上的各个活动所需时间之和）。

1）具有最大路径长度的路径称为关键路径。

2）关键路径上的活动称为关键活动。

3）关键路径长度是整个工程所需的最短工期。这就是说，要缩短整个工期，必须加快关键活动的进度。

4）利用AOE网进行工程管理时要需解决的主要问题是：确定关键路径，以找出哪些活动是影响工程进度的关键活动。

3.AOE网具有以下两个性质：

①只有在某顶点所代表的事件发生后，从该顶点出发的各有向边所代表的活动才能开始。

②只有在进入一某顶点的各有向边所代表的活动都已经结束，该顶点所代表的事件才能发生。

4.求关键路径的算法讨论

ve(0)=0,ve(k)=maxj{ve(j)+dut()}--拓扑有序

vl(n-1)=ve(n-1),vl(j)=mink{vl(k)-dut()}–逆拓扑有序

e(i)=ve(j)

l(i)=vl(k)-dut()

第七章查找

7.1顺序查找

1.顺序查找又称线性查找，是最基本的查找方法之一。

2.查找表结构：以顺序表或线性链表表示

3.基本思想：从一端开始向另一端，逐个进行记录的关键字和给定值的比较，若某个记录的关键字和给定值比较相等，则查找成功；反之，若直至另一端，其关键字和给定值比较都不等，则表明表中没有所查记录，查找不成功。

4.哨兵的作用：免去查找过程中每一步都要检测整个表是否查找完毕。

5.平均查找长度(ASL)：

查找成功时：(n+1)/2

查找不成功时：n+1

平均查找长度:3(n+1)/4

6.顺序查找缺点:当n很大时，平均查找长度较大，效率低

顺序查找优点:对表中数据元素的存储没有要求。另外，对于线性链表，只能进行顺序查找。7.2折半查找(二分查找)

1.查找表结构：以顺序表且有序表表示

2.基本思想：查找区间逐步缩小(折半)

3.能够画出其判定树：

4.平均查找长度: ASL bs约等于log2(n+1)-1

7.3二叉排序树(二叉查找树)

1.定义(递归)：或者是一棵空树，或者是具有如下特性的二叉树：若它的左子树不空，则左子树上所有结点的值均小于根结点的值；若它的右子树不空，则右子树上所有结点的值均大于根结点的值；它的左、右子树也分别是二叉排序树

2.对二叉排序树进行中序遍历，便可得到一个按关键字有序的序列，

3.查找方法与算法

①若查找树为空，查找失败。

②查找树非空，将给定值key与查找树的根结点关键字比较。

③若相等，查找成功，结束查找过程，否则：

a．当key小于根结点关键字，查找将在以左孩子为根的子树上继续进行，转①

b．当key大于根结点关键字，查找将在以右孩子为根的子树上继续进行，转①

4.二叉排序树的插入

新插入的结点一定是一个新添加的叶子结点,并且是查找不成功时查找路径上访问的最后一个结点的左孩子或右孩子结点.

5.二叉排序树的删除

假设被删结点为*p，其双亲结点为*f，

1)*p为叶子结点：删去*p，并修改*f的孩子域。

2)*p只有左子树PL或只有右子树PR：令PL或PR直接成为*f的子树

3)*p的左子树PL和右子树PR均不为空

方法1、令*p的中序遍历的直接前驱替代*p，再从二叉排序树中删去它的直接前驱。

方法2、与方法3对称，令*p的中序遍历的直接后继替代*p，再从二叉排序树中删去它的直接后继。

6.二叉排序树的查找分析:与给定值比较的关键字个数不超过二叉排序树的深度

7.4平衡二叉树(AVL树)

1.定义(递归):

或者是一棵空树，或者是具有如下特性的二叉排序树：

左子树和右子树的深度之差的绝对值不超过1；

数据结构C语言版期末考试试题(有答案)

“数据结构”期末考试试题一、单选题(每小题2分，共12分) 1．在一个单链表HL中，若要向表头插入一个由指针p指向的结点，则执行( )。 A． HL＝ps p一>next＝HL B． p一>next＝HL；HL＝p3 C． p一>next＝Hl；p＝HL； D． p一>next＝HL一>next;HL一>next＝p； 2．n个顶点的强连通图中至少含有( )。 A.n—l条有向边 B.n条有向边 C.n(n—1)／2条有向边 D.n(n一1)条有向边 3.从一棵二叉搜索树中查找一个元素时，其时间复杂度大致为( )。 A.O(1) B.O(n) C.O(1Ogzn) D.O(n2) 4．由权值分别为3，8，6，2，5的叶子结点生成一棵哈夫曼树，它的带权路径长度为( )。 A．24 B．48 C． 72 D． 53 5．当一个作为实际传递的对象占用的存储空间较大并可能需要修改时，应最好把它说明为( )参数，以节省参数值的传输时间和存储参数的空间。 A.整形 B.引用型 C.指针型 D.常值引用型· 6．向一个长度为n的顺序表中插人一个新元素的平均时间复杂度为( )。 A．O(n) B．O(1) C．O(n2) D．O(10g2n) 二、填空题(每空1分，共28分) 1．数据的存储结构被分为——、——、——和——四种。 2．在广义表的存储结构中，单元素结点与表元素结点有一个域对应不同，各自分别为——域和——域。 3．——中缀表达式 3十x*(2.4／5—6)所对应的后缀表达式为————。 4．在一棵高度为h的3叉树中，最多含有——结点。 5．假定一棵二叉树的结点数为18，则它的最小深度为——，最大深度为——· 6．在一棵二叉搜索树中，每个分支结点的左子树上所有结点的值一定——该结点的值，右子树上所有结点的值一定——该结点的值。 7．当向一个小根堆插入一个具有最小值的元素时，该元素需要逐层——调整，直到被调整到——位置为止。 8．表示图的三种存储结构为——、——和———。 9．对用邻接矩阵表示的具有n个顶点和e条边的图进行任一种遍历时，其时间复杂度为——，对用邻接表表示的图进行任一种遍历时，其时间复杂度为——。 10．从有序表(12，18，30，43，56，78，82，95)中依次二分查找43和56元素时，其查找长度分别为——和——· 11．假定对长度n＝144的线性表进行索引顺序查找，并假定每个子表的长度均

(完整版)数据结构---C语言描述-(耿国华)-课后习题答案

第一章习题答案 2、××√ 3、（1）包含改变量定义的最小范围（2）数据抽象、信息隐蔽（3）数据对象、对象间的关系、一组处理数据的操作（4）指针类型（5）集合结构、线性结构、树形结构、图状结构（6）顺序存储、非顺序存储（7）一对一、一对多、多对多（8）一系列的操作（9）有限性、输入、可行性 4、（1）A（2）C（3）C 5、语句频度为1+（1+2）+（1+2+3）+…+（1+2+3+…+n）第二章习题答案 1、（1）一半，插入、删除的位置（2）顺序和链式，显示，隐式（3）一定，不一定（4）头指针，头结点的指针域，其前驱的指针域 2、（1）A（2）A：E、A B：H、L、I、E、A C：F、M D：L、J、A、G或J、A、G （3）D（4）D（5）C（6）A、C 3、头指针：指向整个链表首地址的指针，标示着整个单链表的开始。头结点：为了操作方便，可以在单链表的第一个结点之前附设一个结点，该结点的数据域可以存储一些关于线性表长度的附加信息，也可以什么都不存。首元素结点：线性表中的第一个结点成为首元素结点。 4、算法如下： int Linser(SeqList *L,int X) { int i=0,k; if(L->last>=MAXSIZE-1) { printf(“表已满无法插入”)； return(0); } while(i<=L->last&&L->elem[i]last;k>=I;k--) L->elem[k+1]=L->elem[k]; L->elem[i]=X;

L->last++; return(1); } 5、算法如下： #define OK 1 #define ERROR 0 Int LDel(Seqlist *L,int i,int k) { int j; if(i<1||(i+k)>(L->last+2)) { printf(“输入的i，k值不合法”); return ERROR; } if((i+k)==(L->last+2)) { L->last=i-2; ruturn OK; } else {for(j=i+k-1;j<=L->last;j++) elem[j-k]=elem[j]; L->last=L->last-k; return OK; } } 6、算法如下： #define OK 1 #define ERROR 0 Int Delet(LInkList L,int mink,int maxk) { Node *p,*q; p=L; while(p->next!=NULL) p=p->next; if(minknext->data>=mink)||(p->data<=maxk)) { printf(“参数不合法”); return ERROR; } else { p=L; while(p->next-data<=mink)

数据结构c语言版试题大全含答案

1 绪论沈阳理工大学应用技术学院信息与控制学院计算机科学与技术教研室 2011-5-8

(完整版)非常实用的数据结构知识点总结

数据结构知识点概括第一章概论数据就是指能够被计算机识别、存储和加工处理的信息的载体。数据元素是数据的基本单位，可以由若干个数据项组成。数据项是具有独立含义的最小标识单位。数据结构的定义： ·逻辑结构：从逻辑结构上描述数据，独立于计算机。·线性结构：一对一关系。 ·线性结构：多对多关系。 ·存储结构：是逻辑结构用计算机语言的实现。·顺序存储结构：如数组。 ·链式存储结构：如链表。 ·索引存储结构：·稠密索引：每个结点都有索引项。 ·稀疏索引：每组结点都有索引项。 ·散列存储结构：如散列表。 ·数据运算。 ·对数据的操作。定义在逻辑结构上，每种逻辑结构都有一个运算集合。 ·常用的有：检索、插入、删除、更新、排序。数据类型：是一个值的集合以及在这些值上定义的一组操作的总称。 ·结构类型：由用户借助于描述机制定义，是导出类型。抽象数据类型ADT：·是抽象数据的组织和与之的操作。相当于在概念层上描述问题。 ·优点是将数据和操作封装在一起实现了信息隐藏。程序设计的实质是对实际问题选择一种好的数据结构，设计一个好的算法。算法取决于数据结构。算法是一个良定义的计算过程，以一个或多个值输入，并以一个或多个值输出。评价算法的好坏的因素：·算法是正确的； ·执行算法的时间； ·执行算法的存储空间（主要是辅助存储空间）； ·算法易于理解、编码、调试。时间复杂度：是某个算法的时间耗费，它是该算法所求解问题规模n的函数。渐近时间复杂度：是指当问题规模趋向无穷大时，该算法时间复杂度的数量级。评价一个算法的时间性能时，主要标准就是算法的渐近时间复杂度。算法中语句的频度不仅与问题规模有关，还与输入实例中各元素的取值相关。时间复杂度按数量级递增排列依次为：常数阶O（1）、对数阶O（log2n）、线性阶O（n）、线性对数阶O（nlog2n）、平方阶O （n^2）、立方阶O（n^3）、……k次方阶O（n^k）、指数阶O（2^n）。

数据结构(c语言版)期末考试复习试题

《数据结构与算法》（c语言版）期末考复习题一、选择题。 1．在数据结构中，从逻辑上可以把数据结构分为 C 。 A．动态结构和静态结构B．紧凑结构和非紧凑结构 C．线性结构和非线性结构D．内部结构和外部结构 2．数据结构在计算机内存中的表示是指 A 。 A．数据的存储结构B．数据结构C．数据的逻辑结构D．数据元素之间的关系 3．在数据结构中，与所使用的计算机无关的是数据的 A 结构。 A．逻辑B．存储C．逻辑和存储D．物理 4．在存储数据时，通常不仅要存储各数据元素的值，而且还要存储 C 。A．数据的处理方法B．数据元素的类型 C．数据元素之间的关系D．数据的存储方法 5．在决定选取何种存储结构时，一般不考虑 A 。 A．各结点的值如何B．结点个数的多少 C．对数据有哪些运算D．所用的编程语言实现这种结构是否方便。 6．以下说法正确的是 D 。 A．数据项是数据的基本单位

B．数据元素是数据的最小单位 C．数据结构是带结构的数据项的集合 D．一些表面上很不相同的数据可以有相同的逻辑结构 7．算法分析的目的是 C ，算法分析的两个主要方面是 A 。（1）A．找出数据结构的合理性B．研究算法中的输入和输出的关系C．分析算法的效率以求改进C．分析算法的易读性和文档性（2）A．空间复杂度和时间复杂度B．正确性和简明性 C．可读性和文档性D．数据复杂性和程序复杂性 8．下面程序段的时间复杂度是O(n2) 。 s =0; for( I =0; i

数据结构c语言版期末考试复习试题

《数据结构与算法》复习题一、选择题。 1在数据结构中，从逻辑上可以把数据结构分为 C 。 A ?动态结构和静态结构B.紧凑结构和非紧凑结构 C.线性结构和非线性结构 D.内部结构和外部结构 2?数据结构在计算机内存中的表示是指_A_。 A .数据的存储结构B.数据结构 C .数据的逻辑结构 D .数据元素之间的关系 3.在数据结构中，与所使用的计算机无关的是数据的A结构。 A .逻辑 B .存储C.逻辑和存储 D .物理 4.在存储数据时，通常不仅要存储各数据元素的值，而且还要存储_C A .数据的处理方法 B .数据元素的类型 C.数据元素之间的关系 D .数据的存储方法 5.在决定选取何种存储结构时，一般不考虑A A .各结点的值如何C.对数据有哪些运算 B .结点个数的多少 D .所用的编程语言实现这种结构是否方 6.以下说法正确的是D A .数据项是数据的基本单位 B .数据元素是数据的最小单位 C.数据结构是带结构的数据项的集合 D .一些表面上很不相同的数据可以有相同的逻辑结构 7.算法分析的目的是 C ，算法分析的两个主要方面是 A 。 (1) A .找出数据结构的合理性B.研究算法中的输入和输出的关系 C .分析算法的效率以求改进C.分析算法的易读性和文档性 (2) A .空间复杂度和时间复杂度B.正确性和简明性 &下面程序段的时间复杂度是0( n2) s =0; for( I =0; i

数据结构复习要点(整理版).docx

第一章数据结构概述基本概念与术语 1．数据：数据是对客观事物的符号表示，在计算机科学中是指所有能输入到计算机中并被计算机程序所处理的符号的总称。 2. 数据元素：数据元素是数据的基本单位，是数据这个集合中的个体，也称之为元素，结点，顶点记录。 (补充：一个数据元素可由若干个数据项组成。数据项是数据的不可分割的最小单位。 ) 3．数据对象：数据对象是具有相同性质的数据元素的集合，是数据的一个子集。(有时候也叫做属性。) 4．数据结构：数据结构是相互之间存在一种或多种特定关系的数据元素的集合。 (1)数据的逻辑结构：数据的逻辑结构是指数据元素之间存在的固有逻辑关系，常称为数据结构。数据的逻辑结构是从数据元素之间存在的逻辑关系上描述数据与数据的存储无关，是独立于计算机的。依据数据元素之间的关系，可以把数据的逻辑结构分成以下几种： 1. 集合：数据中的数据元素之间除了“同属于一个集合“的关系以外，没有其他关系。 2. 线性结构：结构中的数据元素之间存在“一对一“的关系。若结构为非空集合，则除了第一个元素之外，和最后一个元素之外，其他每个元素都只有一个直接前驱和一个直接后继。 3. 树形结构：结构中的数据元素之间存在“一对多“的关系。若数据为非空集，则除了第一个元素 (根)之外，其它每个数据元素都只有一个直接前驱，以及多个或零个直接后继。 4. 图状结构：结构中的数据元素存在“多对多”的关系。若结构为非空集，折每个数据可有多个(或零个)直接后继。 (2)数据的存储结构：数据元素及其关系在计算机内的表示称为数据的存储结构。想要计算机处理数据，就必须把数据的逻辑结构映射为数据的存储结构。逻辑结构可以映射为以下两种存储结构： 1. 顺序存储结构：把逻辑上相邻的数据元素存储在物理位置也相邻的存储单元中，借助元素在存储器中的相对位置来表示数据之间的逻辑关系。 2. 链式存储结构：借助指针表达数据元素之间的逻辑关系。不要求逻辑上相邻的数据元素物理位置上也相邻。 5. 时间复杂度分析：1.常量阶：算法的时间复杂度与问题规模n 无关系T(n)=O(1) 2. 线性阶：算法的时间复杂度与问题规模 n 成线性关系T(n)=O(n) 3. 平方阶和立方阶：一般为循环的嵌套，循环体最后条件为i++ 时间复杂度的大小比较： O(1)< O(log 2 n)< O(n )< O(n log 2 n)< O(n2)< O(n3)< O(2 n )

2021年自考02331数据结构重点总结最终修订

自考02331数据构造重点总结(最后修订) 第一章概论 1.瑞士计算机科学家沃思提出：算法+数据构造=程序。算法是对数据运算描述，而数据构造涉及逻辑构造和存储构造。由此可见，程序设计实质是针对实际问题选取一种好数据构造和设计一种好算法，而好算法在很大限度上取决于描述实际问题数据构造。 2.数据是信息载体。数据元素是数据基本单位。一种数据元素可以由若干个数据项构成，数据项是具备独立含义最小标记单位。数据对象是具备相似性质数据元素集合。 3.数据构造指是数据元素之间互有关系，即数据组织形式。数据构造普通涉及如下三方面内容：数据逻辑构造、数据存储构造、数据运算 ①数据逻辑构造是从逻辑关系上描述数据，与数据元素存储构造无关，是独立于计算机。数据逻辑构造分类：线性构造和非线性构造。线性表是一种典型线性构造。栈、队列、串等都是线性构造。数组、广义表、树和图等数据构造都是非线性构造。 ②数据元素及其关系在计算机内存储方式，称为数据存储构造（物理构造）。数据存储构造是逻辑构造用计算机语言实现，它依赖于计算机语言。 ③数据运算。最惯用检索、插入、删除、更新、排序等。 4.数据四种基本存储办法：顺序存储、链接存储、索引存储、散列存储（1）顺序存储：普通借助程序设计语言数组描述。（2）链接存储：普通借助于程序语言指针来描述。（3）索引存储：索引表由若干索引项构成。核心字是能唯一标记一种元素一种或各种数据项组合。（4）散列存储：该办法基本思想是：依照元素核心字直接计算出该元素存储地址。 5.算法必要满足5个准则：输入，0个或各种数据作为输入；输出，产生一种或各种输出；有穷性，算法执行有限步后结束；拟定性，每一条指令含义都明确；可行性，算法是可行。算法与程序区别：程序必要依赖于计算机程序语言，而一种算法可用自然语言、计算机程序语言、数学语言或商定符号语言来描述。当前惯用描述算法语言有两类：类Pascal和类C。 6.评价算法优劣：算法"对的性"是一方面要考虑。此外，重要考虑如下三点： ①执行算法所耗费时间，即时间复杂性； ②执行算法所耗费存储空间，重要是辅助空间，即空间复杂性； ③算法应易于理解、易于编程，易于调试等，即可读性和可操作性。

数据结构(C语言版)(第2版)课后习题答案

数据结构（C语言版）（第2版）课后习题答案李冬梅 2015.3

目录第1章绪论 (1) 第2章线性表 (5) 第3章栈和队列 (13) 第4章串、数组和广义表 (26) 第5章树和二叉树 (33) 第6章图 (42) 第7章查找 (54) 第8章排序 (65)

第1章绪论 1．简述下列概念：数据、数据元素、数据项、数据对象、数据结构、逻辑结构、存储结构、抽象数据类型。答案：数据：是客观事物的符号表示，指所有能输入到计算机中并被计算机程序处理的符号的总称。如数学计算中用到的整数和实数，文本编辑所用到的字符串，多媒体程序处理的图形、图像、声音、动画等通过特殊编码定义后的数据。数据元素：是数据的基本单位，在计算机中通常作为一个整体进行考虑和处理。在有些情况下，数据元素也称为元素、结点、记录等。数据元素用于完整地描述一个对象，如一个学生记录，树中棋盘的一个格局（状态）、图中的一个顶点等。数据项：是组成数据元素的、有独立含义的、不可分割的最小单位。例如，学生基本信息表中的学号、姓名、性别等都是数据项。数据对象：是性质相同的数据元素的集合，是数据的一个子集。例如：整数数据对象是集合N={0，±1，±2，…}，字母字符数据对象是集合C={‘A’，‘B’，…，‘Z’，‘a’，‘b’，…，‘z’}，学生基本信息表也可是一个数据对象。数据结构：是相互之间存在一种或多种特定关系的数据元素的集合。换句话说，数据结构是带“结构”的数据元素的集合，“结构”就是指数据元素之间存在的关系。逻辑结构：从逻辑关系上描述数据，它与数据的存储无关，是独立于计算机的。因此，数据的逻辑结构可以看作是从具体问题抽象出来的数学模型。存储结构：数据对象在计算机中的存储表示，也称为物理结构。抽象数据类型：由用户定义的，表示应用问题的数学模型，以及定义在这个模型上的一组操作的总称。具体包括三部分：数据对象、数据对象上关系的集合和对数据对象的基本操作的集合。 2．试举一个数据结构的例子，叙述其逻辑结构和存储结构两方面的含义和相互关系。答案：例如有一张学生基本信息表，包括学生的学号、姓名、性别、籍贯、专业等。每个学生基本信息记录对应一个数据元素，学生记录按顺序号排列，形成了学生基本信息记录的线性序列。对于整个表来说，只有一个开始结点(它的前面无记录)和一个终端结点(它的后面无记录)，其他的结点则各有一个也只有一个直接前趋和直接后继。学生记录之间的这种关系就确定了学生表的逻辑结构，即线性结构。这些学生记录在计算机中的存储表示就是存储结构。如果用连续的存储单元(如用数组表示)来存放这些记录，则称为顺序存储结构；如果存储单元不连续，而是随机存放各个记录，然后用指针进行链接，则称为链式存储结构。即相同的逻辑结构，可以对应不同的存储结构。 3．简述逻辑结构的四种基本关系并画出它们的关系图。

数据结构(C语言版)期末复习

数据结构（C语言版）期末复习汇总第一章绪论数据结构：是一门研究非数值计算程序设计中的操作对象，以及这些对象之间的关系和操作的学科。数据结构分为：逻辑结构、物理结构、操作三部分逻辑结构：集合、线性结构、树形结构、图（网）状结构物理结构（存储结构）：顺序存储结构、链式存储结构算法：是为了解决某类问题而规定的一个有限长的操作序列。算法五个特性：有穷性、确定性、可行性、输入、输出评价算法优劣的基本标准（4个）：正确性、可读性、健壮性、高效性及低存储量语句频度的计算。算法的时间复杂度：常见有：O(1)，O(n)，O(n2)，O(log2n)，O(nlog2n)，O(2n) 第二章线性表线性表的定义和特点：线性表：由n(n≥0)个数据特性相同的元素构成的有限序列。线性表中元素个数n(n≥0)定义为线性表的长度，n=0时称为空表。非空线性表或线性结构，其特点：（1）存在唯一的一个被称作“第一个”的数据元素；（2）存在唯一的一个被称作“最有一个”的数据元素；（3）除第一个之外，结构中的每个数据元素均只有一个前驱；（4）除最后一个之外，结构中的每个数据元素均只有一个后继。顺序表的插入：共计n个元素，在第i位插入，应移动（n-i+1）位元素。顺序表的删除：共计n个元素，删除第i位，应移动（n-i）位元素。线性表的两种存储方式：顺序存储、链式存储。顺序存储概念：以一组连续的存储空间存放线性表；优点：逻辑相邻，物理相邻；可随机存取任一元素；存储空间使用紧凑；缺点：插入、删除操作需要移动大量的元素；预先分配空间需按最大空间分配，利用不充分；表容量难以扩充；操作：查找、插入、删除等查找： ListSearch(SqlList L,ElemType x,int n) { int i; for (i=0;i

大学数据结构期末知识点重点总结

第一章概论 1.数据结构描述的是按照一定逻辑关系组织起来的待处理数据元素的表示及相关操作，涉及数据的逻辑结构、存储结构和运算 2.数据的逻辑结构是从具体问题抽象出来的数学模型，反映了事物的组成结构及事物之间的逻辑关系可以用一组数据（结点集合K）以及这些数据之间的一组二元关系（关系集合R）来表示：(K, R) 结点集K是由有限个结点组成的集合，每一个结点代表一个数据或一组有明确结构的数据关系集R是定义在集合K上的一组关系，其中每个关系r（r∈R）都是K×K上的二元关系 3.数据类型 a.基本数据类型整数类型(integer)、实数类型(real)、布尔类型(boolean)、字符类型（char）、指针类型（pointer）b.复合数据类型复合类型是由基本数据类型组合而成的数据类型；复合数据类型本身，又可参与定义结构更为复杂的结点类型 4.数据结构的分类：线性结构（一对一）、树型结构（一对多）、图结构（多对多） 5.四种基本存储映射方法：顺序、链接、索引、散列 6.算法的特性：通用性、有效性、确定性、有穷性 7.算法分析：目的是从解决同一个问题的不同算法中选择比较适合的一种，或者对原始算法进行改造、加工、使其优化 8.渐进算法分析 a．大Ο分析法：上限，表明最坏情况 b．Ω分析法：下限，表明最好情况 c．Θ分析法：当上限和下限相同时，表明平均情况第二章线性表 1.线性结构的基本特征 a.集合中必存在唯一的一个“第一元素” b.集合中必存在唯一的一个“最后元素” c.除最后元素之外，均有唯一的后继 d.除第一元素之外，均有唯一的前驱 2.线性结构的基本特点:均匀性、有序性 3.顺序表 a.主要特性：元素的类型相同；元素顺序地存储在连续存储空间中，每一个元素唯一的索引值；使用常数作为向量长度 b. 线性表中任意元素的存储位置：Loc(ki) = Loc(k0) + i * L（设每个元素需占用L个存储单元） c. 线性表的优缺点：优点：逻辑结构与存储结构一致；属于随机存取方式，即查找每个元素所花时间基本一样缺点：空间难以扩充 d.检索：ASL=【Ο（1）】 e.插入：插入前检查是否满了，插入时插入处后的表需要复制【Ο（n）】 f.删除：删除前检查是否是空的，删除时直接覆盖就行了【Ο（n）】 4.链表 4.1单链表 a.特点：逻辑顺序与物理顺序有可能不一致；属于顺序存取的存储结构，即存取每个数据元素所花费的时间不相等 b.带头结点的怎么判定空表：head和tail指向单链表的头结点 c.链表的插入（q->next=p->next; p->next=q;）【Ο（n）】 d.链表的删除（q=p->next; p->next = q->next; delete q;）【Ο（n）】 e.不足：next仅指向后继，不能有效找到前驱 4.2双链表 a.增加前驱指针，弥补单链表的不足 b.带头结点的怎么判定空表:head和tail指向单链表的头结点 c.插入：（q->next = p->next; q->prev = p; p->next = q; q->next->prev = q;） d.删除：（p->prev->next = p->next; p->next->prev = p->prev; p->prev = p->next = NULL; delete p;） 4.3顺序表和链表的比较 4.3.1主要优点 a.顺序表的主要优点没用使用指针，不用花费附加开销；线性表元素的读访问非常简洁便利 b.链表的主要优点无需事先了解线性表的长度；允许线性表的长度有很大变化；能够适应经常插入删除内部元素的情况 4.3.2应用场合的选择 a.不宜使用顺序表的场合经常插入删除时，不宜使用顺序表；线性表的最大长度也是一个重要因素 b.不宜使用链表的场合当不经常插入删除时，不应选择链表；当指针的存储开销与整个结点内容所占空间相比其比例较大时，应该慎重选择第三章栈与队列 1.栈 a.栈是一种限定仅在一端进行插入和删除操作的线性表；其特点后进先出；插入：入栈（压栈）；删除：出栈（退栈）；插入、删除一端被称为栈顶（浮动），另一端称为栈底（固定）；实现分为顺序栈和链式栈两种 b.应用： 1）数制转换 while (N) { N%8入栈； N=N/8;} while (栈非空){ 出栈；输出；} 2）括号匹配检验不匹配情况：各类括号数量不同；嵌套关系不正确算法：逐一处理表达式中的每个字符ch： ch=非括号：不做任何处理 ch=左括号：入栈 ch=右括号：if (栈空) return false else { 出栈，检查匹配情况， if (不匹配) return false } 如果结束后，栈非空，返回false 3）表达式求值 3.1中缀表达式：计算规则：先括号内，再括号外；同层按照优先级，即先乘*、除/,后加+、减-；相同优先级依据结合律，左结合律即为先左后右 3.2后缀表达式： <表达式> ::= <项><项> + | <项><项>－|<项> <项> ::= <因子><因子> * |<因子><因子>/|<因子> <因子> ::= <常数> ?<常数> ::= <数字>|<数字><常数> <数字> ∷= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 3.3中缀表达式转换为后缀表达式 InfixExp为中缀表达式，PostfixExp为后缀表达式初始化操作数栈OP，运算符栈OPND； OPND.push('#'); 读取InfixExp表达式的一项操作数：直接输出到PostfixExp中；操作符：当‘（’：入OPND; 当‘）’：OPND此时若空，则出错；OPND若非空，栈中元素依次弹出，输入PostfixExpz 中，直到遇到‘（’为止；若为‘（’，弹出即可当‘四则运算符’：循环（当栈非空且栈顶不是 ‘（’&& 当前运算符优先级>栈顶运算符优先级），反复弹出栈顶运算符并输入到 PostfixExp中，再将当前运算符压入栈 3.4后缀表达式求值初始化操作数栈OP； while （表达式没有处理完) { item = 读取表达式一项; 操作数：入栈OP；运算符：退出两个操作数，计算，并将结果入栈} c.递归使用的场合：定义是递归的；数据结构是递归的；解决问题的方法是递归的 2.队列 a.若线性表的插入操作在一端进行，删除操作在另一端进行，则称此线性表为队列 b.循环队列判断队满对空：队空：front==rear；队满： (rear+1)%n==front 第五章二叉树 1.概念 a. 一个结点的子树的个数称为度数 b.二叉树的高度定义为二叉树中层数最大的叶结点的层数加1 c.二叉树的深度定义为二叉树中层数最大的叶结点的层数 d.如果一棵二叉树的任何结点，或者是树叶，或者恰有两棵非空子树，则此二叉树称作满二叉树 e.如果一颗二叉树最多只有最下面的两层结点度数可以小于2；最下面一层的结点都集中在该层最左边的位置上，则称此二叉树为完全二叉树 f.当二叉树里出现空的子树时，就增加新的、特殊的结点——空树叶组成扩充二叉树，扩充二叉树是满二叉树外部路径长度E：从扩充的二叉树的根到每个外部结点（新增的空树叶）的路径长度之和内部路径长度I：扩充的二叉树中从根到每个内部结点（原来二叉树结点）的路径长度之和 2.性质 a. 二叉树的第i层（根为第0层，i≥0）最多有 2^i个结点 b. 深度为k的二叉树至多有2k+1-1个结点 c. 任何一颗二叉树，度为0的结点比度为2的结点多一个。n0 = n2 + 1 d. 满二叉树定理：非空满二叉树树叶数等于其分支结点数加1 e. 满二叉树定理推论：一个非空二叉树的空子树(指针)数目等于其结点数加1 f. 有n个结点（n>0）的完全二叉树的高度为 ?log2(n+1)?，深度为?log2(n+1)?? g. 对于具有n个结点的完全二叉树，结点按层次由左到右编号，则有： 1) 如果i = 0为根结点；如果i>0，其父结点编号是(i-1)/2 2) 当2i+1∈N，则称k是k'的父结点，k'是的子结点若有序对及∈N，则称k' k″互为兄弟若有一条由k到达ks的路径，则称k是的祖先，ks是k的子孙 2.树/森林与二叉树的相互转换 a.树转换成二叉树加线: 在树中所有兄弟结点之间加一连线抹线: 对每个结点，除了其最左孩子外，与其余孩子之间的连线旋转: 45° b.二叉树转化成树加线：若p结点是双亲结点的左孩子，则将的右孩子，右孩子的右孩子，所有右孩子，都与p的双亲用线连起来线调整：将结点按层次排列，形成树结构 c.森林转换成二叉树将各棵树分别转换成二叉树将每棵树的根结点用线相连为轴心，顺时针旋转，构成二叉树型结构 d.二叉树转换成森林抹线：将二叉树中根结点与其右孩子连线，及沿右分支搜索到的所有右孩子间连线全部抹掉，使之变成孤立的二叉树还原：将孤立的二叉树还原成树 3.周游 a.先根(次序)周游若树不空，则先访问根结点，然后依次先根周游各棵子树 b.后根(次序)周游若树不空，则先依次后根周游各棵子树，然后访问根结点 c.按层次周游若树不空，则自上而下自左至右访问树中每个结点 4.存储结构 “左子/右兄”二叉链表表示法：结点左指针指向孩子，右结点指向右兄弟，按树结构存储，无孩子或无右兄弟则置空 5. “UNION/FIND算法”（等价类）判断两个结点是否在同一个集合中，查找一个给定结点的根结点的过程称为FIND 归并两个集合，这个归并过程常常被称为 UNION “UNION/FIND”算法用一棵树代表一个集合，如果两个结点在同一棵树中，则认为它们在同一个集合中；树中的每个结点（除根结点以外）有仅且有一个父结点；结点中仅需保存父指针信息，树本身可以存储为一个以其结点为元素的数组 6.树的顺序存储结构 a. 带右链的先根次序表示法在带右链的先根次序表示中，结点按先根次序顺序存储在一片连续的存储单元中每个结点除包括结点本身数据外，还附加两个表示结构的信息字段，结点的形式为: info是结点的数据；rlink是右指针，指向结点的下一个兄弟；ltag是一个左标记，当结点没有子结点（即对应二叉树中结点没有左子结点时），ltag为1，否则为0 b. 带双标记位的先根次序表示法规定当结点没有下一个兄弟（即对应的二叉树中结点没有右子结点时）rtag为1，否则为0 c. 带双标记位的层次次序表示法结点按层次次序顺序存储在一片连续的存储单元中第七章图 1.定义 a.假设图中有n个顶点，e条边：含有e=n(n-1)/2条边的无向图称作完全图含有e=n(n-1) 条弧的有向图称作有向完全图若边或弧的个数e < nlogn，则称作稀疏图，否则称作稠密图 b. 顶点的度(TD)=出度(OD)+入度(ID) 顶点的出度: 以顶点v为弧尾的弧的数目顶点的入度: 以顶点v为弧头的弧的数目 c.连通图、连通分量若图G中任意两个顶点之间都有路径相通，则称此图为连通图若无向图为非连通图，则图中各个极大连通子图称作此图的连通分量 d.强连通图、强连通分量对于有向图，若任意两个顶点之间都存在一条有向路径，则称此有向图为强连通图否则，其各个极大强连通子图称作它的强连通分量 e.生成树、生成森林假设一个连通图有n个顶点和e条边，其中n-1 条边和n个顶点构成一个极小连通子图，称该极小连通子图为此连通图的生成树对非连通图，则将由各个连通分量构成的生成树集合称做此非连通图的生成森林 2.存储结构 a.相邻矩阵表示法表示顶点间相邻关系的矩阵若G是一个具有n个顶点的图，则G的相邻矩阵是如下定义的n×n矩阵： A[i,j]=1，若(Vi, Vj)(或)是图G的边 A[i,j]=0，若(Vi, Vj)(或)不是图G的边 b.邻接表表示法为图中每个顶点建立一个单链表，第i个单链表中的结点表示依附于顶点Vi的边（有向图中指以Vi为尾的弧）（建立单链表时按结点顺序建立） 3.周游 a. 深度优先周游：从图中某个顶点V0出发，访问此顶点，然后依次从V0的各个未被访问的邻接点出发，深度优先搜索遍历图中的其余顶点，直至图中所有与 V0有路径相通的顶点都被访问到为止 b. 广度优先周游：从图中的某个顶点V0出发，并在访问此顶点之后依次访问V0的所有未被访问过的邻接点，随后按这些顶点被访问的先后次序依次访问它们的邻接点，直至图中所有与V0有路径相通的顶点都被访问到为止，若此时图中尚有顶点未被访问，则另选图中一个未曾被访问的顶点作起始点，重复上述过程，直至图中所有顶点都被访问到为止 4.拓扑排序拓扑排序的方法是：1）选择一个入度为0的顶点且输出之 2）从图中删掉此顶点及所有的出边 3）回到第1步继续执行，直至图空或者图不空但找不到无前驱（入度为0）的顶点为止 5.单源最短路径（Dijkstra算法） 6.每对顶点间的最短路径（Floyd算法） 7.最小生成树 a.Prim算法 b.Kruskal算法 c.两种算法比较：Prim算法适合稠密图， Kruskal算法适合稀疏图第八章内排序算法最大时间平均时间直接插入排序 Θ(n2) Θ(n2) 冒泡排序Θ(n2) Θ(n2) 直接选择排序 Θ(n2) Θ(n2) Shell排序Θ(n3/2) Θ(n3/2) 快速排序Θ(n2) Θ(nlog n) 归并排序Θ(nlog n) Θ(nlog n) 堆排序Θ(nlog n) Θ(nlog n) 桶式排序Θ(n+m) Θ(n+m) 基数排序Θ(d·(n+r)) Θ(d·(n+r)) 最小时间S(n) 稳定性 Θ(n) Θ(1) 稳定 Θ(n) Θ(1) 稳定 Θ(n2) Θ(1) 不稳定 Θ(n3/2) Θ(1) 不稳定 Θ(nlog n) Θ(log n) 不稳定 Θ(nlog n) Θ(n) 稳定 Θ(nlog n) Θ(1) 不稳定 Θ(n+m) Θ(n+m) 稳定 Θ(d·(n+r)) Θ(n+r) 稳定第十章检索 1.平均检索长度（ASL）是待检索记录集合中元素规模n的函数，其定义为： ASL= Pi为检索第i个元素的概率;Ci为找到第i个元素所需的比较次数 2.散列 a.除余法用关键码key除以M(取散列表长度)，并取余数作为散列地址散列函数为：hash(key) ＝key mod M b.解决冲突的方法开散列方法：把发生冲突的关键码存储在散列表主表之外（在主表外拉出单链表）闭散列方法：把发生冲突的关键码存储在表中另一个位置上 c.线性探查基本思想：如果记录的基位置存储位置被占用，就在表中下移，直到找到一个空存储位置；依次探查下述地址单元：d0+1，d0+2，...，m-1， 0，1，...，d0-1；用于简单线性探查的探查函数是:p(K, i) = i d.散列表的检索 1.假设给定的值为K，根据所设定的散列函数h，计算出散列地址h(K) 2. 如果表中该地址对应的空间未被占用，则检索失败，否则将该地址中的值与K比较 3. 若相等则检索成功；否则，按建表时设定的处理冲突方法查找探查序列的下一个地址，如此反复下去，直到某个地址空间未被占用（可以插入），或者关键码比较相等（有重复记录，不需插入）为止 e.散列表的删除：删除后在删除地点应加上墓碑（被删除标记） f.散列表的插入：遇到墓碑不停止，知道找到真正的空位置第十一章索引技术 1.概念： a.主码：数据库中的每条记录的唯一标识 b.辅码：数据库中可以出现重复值的码 2.B树 a.定义：B树定义：一个m阶B树满足下列条件： (1) 每个结点至多有m个子结点； (2) 除根和叶外其它每个结点至少有??个子结点； (3) 根结点至少有两个子结点例外(空树，or独根) (4) 所有的叶在同一层,可以有??- 1到m-1个关键码 (5) 有k个子结点的非根结点恰好包含k-1个关键码 b.查找在根结点所包含的关键码K1，…，Kj中查找给定的关键码值(用顺序检索(key少)/二分检索 (key多))；找到：则检索成功;否则，确定要查的关键码值是在某个Ki和Ki+1之间，于是取 pi所指结点继续查找;如果pi指向外部结点，表示检索失败. c.插入找到的叶是插入位置，若插入后该叶中关键码个数