数据结构查找

合集下载

数据结构_查找原理及典型的查找算法

无法实现！因全部元素的定位只能从头指针head开始，是一种非随机存取结构。
3.对非线性(树)结构如何进行折半查找？可借助二叉排序树来查找（属动态查找表形式）。
9.1.2 有序表的查找
折半查找过程可以描述为一棵二叉树
折半查找的判定树如：（a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, a11）
总之：
二叉排序树既有类似于折半查找的特性，又采用了链表存储，它是动态查找表的一种适宜表示。
一、二叉排序树
（3）构造过程: 例：输入序列{45，12，37，3，53，100，24}
45
12
53
3
37
100
24
一、二叉排序树
（2）非递归查找过程 BiTree SearchBST(BiTree T,KeyType key){
CH9 查找
查找的基本概念 9.1 静态查找表
9.1.1 顺序查找 9.1.2 有序表的查找 9.1.3 索引顺序表的查找
9.2 动态查找表
9.2.1 二叉排序树和平衡二叉树 9.2.2 B－和B＋树
9.3 哈希表
查找的基本概念
1.查找表 2.查找
关键字主关键字次关键字
}
9.2.1 二叉排序树和平衡二叉树
一、二叉排序树二、平衡二叉树
一、二叉排序树
1.定义、特点、构造过程
（1）定义二叉排序树或者是一棵空树，或是具有下列性质的二叉树：
若左子树非空，则左子树上所有结点的值均小于它的根结点的值。
若右子树非空，则右子树上所有结点的值均大于它的根结点的值。
有序/无序表有序表
顺序/链式存储
顺序存储
分块查找介于二者之间表中元素逐段有序顺序/链式存储

大学数据结构课件--第9章查找

——这种既查找又插入的过程称为动态查找。
二叉排序树既有类似于折半查找的特性，又采用了链表存储，它是动态查找表的一种适宜表示。
注：若数据元素的输入顺序不同，则得到的二叉排序树形态也不同！
17
二、二叉树的插入和删除操作
1、二叉排序树的插入和查找操作
例：输入待查找的关键字序列=（45，24，53，12，90）
折半查找举例：
已知如下11个元素的有序表：
（05 13 19 21 37 56 64 75 80 88 92）, 请查找关键字为21和85的数据元素。
Low指向待查元素所在区间的下界
mid指向待查元素所在 high指向待查元素所
区间的中间位置
在区间的上界
8
9.1.2 折半查找（又称二分查找或对分查找）
balance。这样，可以得到AVL树的其它性质：
❖ 任一结点的平衡因子只能取：-1、0 或 1；如果树中任意一个结点的平衡因子的绝对值大于1，则这棵二叉树就失去平衡，不再是AVL树；
24
三、平衡二叉树
例：判断下列二叉树是否AVL树？
-1
1
-1
0
0
1
0
(a) 平衡树
2
-1
0
0
1
0
(b) 不是平衡树
（1）p为叶子结点，只需修改p双亲f的指针f->lchild=NULL或 f->rchild=NULL
（2）P只有左子树或右子树 ❖ P只有左子树，用P的左孩子代替P ❖ P只有右子树，用P的右孩子代替P
（3）P左、右子树均非空（P左子树的根C的右子树分支找到S，S的右子树为空） ❖ P的左子树成为双亲f的左子树，P的右子树成为S的右子树 ❖ S的左子树成为S的双亲Q的右子树，用S取代p；若C无右子树，用C取代p

数据结构(八)查找

122
99
250
110
300
280
类C程序实现： void InsertBST(*&t，key) //在二叉排序树中插入查找关键字key { if(t= = NULL){ t=new BiTree; t->lchild=t->rchild=NULL; t->data=key; return; } if(key<t->data ) InsertBST(t->lchild,key); else InsertBST (t->rchild, key ); } void CreateBiTree(tree,d[ ],n） //n个数据在数组d中，tree为二叉排序树根 { tree=NULL; for(i=0;i<n;i++) InsertBST(tree,d[i]); }
p q
void delete(*&p) { if(p->rchild = = NULL) { q=p; p=p->lchild; delete q; } else if(p->lchild= =NULL) { q=p; p=p->rchild; delete q; } else { q=p; s=p->lchild; while(s->rchild!=NULL) {q=s; s=s->rchild;} p->data=s->data; if(q!=p) q->rchild=s->lchild; else q->lchild=s->lchild; } delete s; }
在xL中选值最大的代替x，该数据按二叉排序树的性质应在最右边。
f x f s c

数据结构-查找

数据结构-查找写在前⾯：这些内容是以考研的⾓度去学习和理解的，很多考试中需要⽤到的内容在实际应⽤中可能⽤不上，⽐如其中的计算问题，但是如果掌握这些东西会帮你更好的理解这些内容。

这篇关于查找的博客也只是⽤来记录以便于后续复习的，所以很多地⽅只是浅谈，并没有代码的实现如果有缘发现这篇⽂章想要深⼊了解或者因为作者表达能⼒差⽽看不懂以及有错的地⽅，欢迎留⾔指出来，我会尽快去完善的，期待有缘⼈内容多和杂，如果有机会我进⼀步进⾏梳理，将其重新梳理⼀⽚⽂章(会更注重于代码)本来只是想简单写⼀下的，但是不⼩⼼就get不到重点了本来打算等逐步完善和优化后再发出来的，但那样继续往前总感觉有所顾及，所以就先给这⼏天查找的复习暂时告⼀段落吧。

导学概览总体(⼀)概念查找：在数据集合中查找特定元素的过程查找表(查找结构)：同⼀类型数据元素构成的集合静态查找表:只涉及查找，不存在修改适⽤：顺序查找，折半查找，散列查找等动态查找表:动态插⼊和删除，对查找表进⾏修改适⽤：⼆叉排序树，散列查找等所有数据结构都可以看作是查找表，对于折半查找和顺序查找这些都属于查找算法关键字：数据元素中唯⼀标识该元素的某数据项的值主关键字：此关键字能唯⼀表⽰⼀个数据元素次关键字：此关键字⽤以识别若⼲记录(⼀对多)说明：在查找表中每个数据元素就相当于⼀条记录，包含有不同的数据项，例如拿学⽣为例，⼀个学⽣作为数据元素，那么学号，⾝⾼，姓名就是这个元素中的数据项，每个学⽣都有特定的学号，因此学号可以作为关键字。

(当然如果数据项包含⾝份证号，你⽤⾝份证号⾛位关键字也可以)0x01平均查找长度(重点注意：作为查找算法效率衡量的主要指标，那么查找算法的性能分析肯定是重点分析平均查找长度的，因此必须熟练掌握。

提⼀嘴，算法效率的度量前⾯学过时间和空间复杂度，但是算法效率的度量不是只取决于时间和空间复杂度，针对不同的算法还可能会有其他⼀些辅助度量，如查找算法中的平均查找长度。

数据结构的查找算法

数据结构的查找算法在计算机科学中，数据结构是用于组织和存储数据的一种方式。

查找算法是数据结构中的重要部分，它用于在数据集合中搜索特定元素或信息。

本文将介绍几种常见的数据结构查找算法，包括线性查找、二分查找、哈希查找以及树结构的查找算法。

1. 线性查找线性查找是一种简单直观的查找方法，适用于无序的数据集合。

其基本思想是从数据集合的第一个元素开始逐个比较，直到找到目标元素或者遍历完整个数据集合。

由于线性查找需要遍历所有元素，所以时间复杂度为O(n)，其中n为数据集合的大小。

2. 二分查找二分查找是一种高效的查找算法，但它要求数据集合中的元素必须有序。

具体实现方式是将数据集合分为两半，然后与目标元素进行比较，不断缩小查找范围，直到找到目标元素或者确定目标元素不存在。

由于每次都将查找范围减小一半，所以时间复杂度为O(log n)，其中n为数据集合的大小。

3. 哈希查找哈希查找利用哈希函数将目标元素映射到哈希表中的特定位置，从而快速定位目标元素。

哈希表是一种以键-值对形式存储数据的数据结构，可以快速插入和删除元素，因此在查找时具有良好的性能。

哈希查找的时间复杂度为O(1)，但在处理哈希冲突时可能会影响性能。

4. 树结构的查找算法树是一种常见的数据结构，其查找算法主要包括二叉搜索树、平衡二叉搜索树以及B树和B+树。

二叉搜索树是一种有序的二叉树，左子树的所有节点值都小于根节点，右子树的所有节点值都大于根节点。

通过比较目标元素与节点的值，可以快速定位目标元素。

平衡二叉搜索树是为了解决二叉搜索树在某些情况下可能出现的退化情况，通过旋转操作保持树的平衡性。

B树和B+树是一种多路搜索树，它们可以减少磁盘I/O操作，适用于大规模数据的查找。

综上所述，数据结构的查找算法是计算机科学中的重要内容。

不同的查找算法适用于不同的场景，选择合适的算法可以提高查找效率。

在实际应用中，需要根据数据集合的特点及查找需求来选择合适的算法。

查找-数据结构

平均查找长度：为确定记录在查找表中的位置，需和给定值进行比较的关键字个数的期望值称为查找算法在查找成功时的平均查找长度，简称ASL。
对于含有n个记录的表，查找成功时的平均查找长度为： n ASL PiCi i 1
其找到中表：中Pi为其查关找键表字中与第给i定个值记相录等的的概第率，i个C记i为录时和给定值已进行过比较的关键字个数。
（1）若*p 为叶子结点，直接删除即可。
45
45
12
3
37
53
f
100
24
p
61
60
90
12
53
3
删除24
f->lchild = null; delete p;
37
100
61
60
90
78
78
（2）若*p结点只有左子树PL或只有右子树PR,此时只要令PL或PR直接成为*f的左子树即可
f
F
f
F
p
P
p
二叉排序树的插入
基本思想：
若二叉排序树为空，则待插结点作为根结点插入到空树中；
若待插结点的关键字值和根结点的关键字值相等，则说明树中已有此结点，无需插入；
若待插结点的关键字值小于根结点的关键字值，则将待插结点插入到根的左子树中；
若待插结点的关键字值大于根结点的关键字值，则将待插结点插入到根的右子树中；
mid low
mid low
mid low
mid low
mid
mid
mid
mid
6
3
9
1
47
10
2
58
11
由此可见，二分查找过程恰好是走了一条从判定树的根到被查结点的路径，比较的关键字个数恰为该结点在判定树中的层数。

数据结构之查找课件PPT课件

索引表的定义
struct indexterm {
keytype key; int low, high; }; typedef struct indexterm index[MAXITEM]; 这里的keytype可以是任何相应的数据类型，如int、float、或char等，在算法中，我们规定keytype缺省是int类型。
int blksearch (sqlist r, index idx, int k, bn)
{
/*bn为块的个数*/
int i, j, mid, low=1, high=bn, find=0;
while (low<=high && !find)
{
➢ 顺序查找的优点是算法简单、适应面广，且不要求表中数据有序。缺点是平均查找长度较大，特别是当n较大时，查找效率较低，不宜采用。
2.折半查找
➢ 折半查找又称二分查找(Birary search)。 ➢ 假设记录在查找表R[1…n]中按关键字排列有
序。首先用k与查找表中间元素的关键字比较，。。。。。。
➢ 在实际应用问题中，每个记录一般包含有多个数据域，查找是根据其中某一个指定的域进行的，这个作为查找依据的域称为关键字（key）。
➢ 顺序查找的线性表定义如下：
Typedef struct rectype {
keytype key; itemtype item1 …… }rectype;
➢ 比较结果有三种可能：
⑴ 如果r[m].key>k，说明如果存在欲查找的元素，该元素一定在数组的前半部分，查找范围缩小了一半，修改查找范围的的上界high=m-1，继续对数组的前半部分进行二分查找；

数据结构查找实验报告

数据结构查找实验报告一、实验目的本次实验的主要目的是深入理解和掌握常见的数据结构查找算法，包括顺序查找、二分查找、哈希查找等，并通过实际编程实现和性能比较，分析它们在不同数据规模和分布情况下的效率和适用场景。

二、实验环境本次实验使用的编程语言为 Python 38，开发环境为 PyCharm。

实验中所使用的数据集生成工具为 numpy 库。

三、实验原理1、顺序查找顺序查找是一种最简单的查找算法，它从数据结构的开头依次逐个比较元素，直到找到目标元素或遍历完整个数据结构。

其平均时间复杂度为 O(n)。

2、二分查找二分查找要求数据结构是有序的。

通过不断将查找区间缩小为原来的一半，直到找到目标元素或者确定目标元素不存在。

其时间复杂度为 O(log n)。

3、哈希查找哈希查找通过将元素映射到一个特定的哈希表中，利用哈希函数计算元素的存储位置，从而实现快速查找。

理想情况下，其平均时间复杂度为 O(1)，但在存在哈希冲突时，性能可能会下降。

四、实验步骤1、数据集生成使用 numpy 库生成不同规模和分布的数据集，包括有序数据集、无序数据集和具有一定重复元素的数据集。

2、顺序查找实现编写顺序查找算法的函数，接受数据集和目标元素作为参数，返回查找结果（是否找到及查找次数）。

3、二分查找实现实现二分查找算法的函数，同样接受数据集和目标元素作为参数，并返回查找结果。

4、哈希查找实现构建哈希表并实现哈希查找函数，处理哈希冲突的情况。

5、性能比较对不同规模和类型的数据集，分别使用三种查找算法进行查找操作，并记录每种算法的查找时间和查找次数。

五、实验结果与分析1、顺序查找在无序数据集中，顺序查找的性能表现较为稳定，查找时间随着数据规模的增大线性增长。

但在有序数据集中，其性能没有优势。

2、二分查找二分查找在有序数据集中表现出色，查找时间随着数据规模的增大增长缓慢，体现了对数级别的时间复杂度优势。

然而，在无序数据集中无法使用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

② 运算步骤：
(1) low =1,high =11 ,mid =6 ，待查范围是 [1,11]； (2) 若 ST.elem[mid].key < key，说明 key[ mid+1,high] ，则令：low =mid+1;重算 mid＝ (low+high)/2；. (3) 若 ST.elem[mid].key > key，说明key[low ,mid-1]，则令：high =mid–1;重算 mid ； (4)若 ST.elem[ mid ].key = key，说明查找成功，元素序号=mid; 结束条件：（1）查找成功： ST.elem[mid].key = key （2）查找不成功： high<low （意即区间长度小于0）
对索引表查找的ASL 对块内查找的ASL
n s ASLbs log 2 ( 1) s 2
n 1 (log2 n ASLbs ) 2
S为每块内部的记录个数，n/s即块的数目
例如当n=9，s=3时，ASLbs=3.5,而折半法为3.1,顺序法为5
9.3
动态查找表
特点：表结构在查找过程中动态生成。
这是查找成功的情况
讨论④ 顺序查找的特点：优点：算法简单，且对顺序结构或链表结构均适用。缺点： ASL 太长，时间效率太低。如何改进？
二、折半查找（又称二分查找或对分查找）
这是一种容易想到的查找方法。先给数据排序（例如按升序排好），形成有序表，然后再将key 与正中元素相比，若key小，则缩小至右半部内查找；再取其中值比较，每次缩小1/2的范围，直到查找成功或失败为止。对顺序表结构如何编程实现折半查找算法？ ——见下页之例，或见教材（P219）对单链表结构如何折半查找？ ——无法实现！因全部元素的定位只能从头指针head开始对非线性(树)结构如何折半查找？ ——可借助二叉排序树来查找（属动态查找表形式）。
（2）算法的实现：
技巧：把待查关键字key存入表头或表尾（俗称“哨兵”），这样可以加快执行速度。例：若将待查找的特定值key存入顺序表的首部（如0号单元），则顺序查找的实现方案为：从后向前逐个比较！
int Search_Seq( SSTable ST , KeyType key ){
//在顺序表ST中，查找关键字与key相同的元素；若成功，返回其位臵信息，否则返回0
其中： n是文件记录个数； Pi是查找第i个记录的查找概率（通常取等概率,即Pi =1/n）; Ci是找到第i个记录时所经历的比较次数。
物理意义：假设每一元素被查找的概率相同，则查找每一元素所需的比较次数之总和再取平均，即为ASL。显然，ASL值越小，时间效率越高。
9.2 静态查找表
静态查找表的抽象数据类型参见教材P216。针对静态查找表的查找算法主要有：
查找成功，返回 24 12 45 53 90
成功，返回
二叉排序树的查找&插入算法如何实现？查找算法参见教材P228算法9.5（a）;
插入算法参见教材P228算法9.5（b)_9.6;
一种“二合一”的算法如下：
BiTree SearchBST（BiTree T,KeyType key）
22 12 13 8
9 20 33 42 44 38 24 48 60 58 74查找步骤分两步进行： ① 对索引表使用折半查找法（因为索引表是有序表）； ② 确定了待查关键字所在的子表后，在子表内采用顺序查找法（因为各子表内部是无序表）；查找效率：ASL=Lb+Lw
折半查找举例：已知如下11个元素的有序表：（05 13 19 21 37 56 64 75 80 88 92）, 请查找关键字为21 和85的数据元素。
Low指向待查元素所在区间的下界 mid指向待查元素所在区间的中间位臵 high指向待查元素所在区间的上界
解：① 先设定3个辅助标志: low,high,mid，显然有：mid= (low+high)/2
return i; //若到达0号单元才结束循环，说明不成功，返回0值
(i=0)。成功时则返回找到的那个元素的位臵i。
} // Search_Seq
讨论① 查不到怎么办？ ——返回特殊标志，例如返回空记录或空指针。前例中设立了“哨
兵”，就是将关键字送入末地址ST.elem[0].key使之结束并返回 i=0。
查找成功
查找不成功 ——否则，称查找不成功（也应输出失败标志或失败位臵）
静态查找 ——只查找，不改变集合内的数据元素。
动态查找 ——既查找，又改变（增减）集合内的数据元素。关键字 ——记录中某个数据项的值，可用来识别一个记录
( 预先确定的记录的某种标志 )
主关键字 ——可以唯一标识一个记录的关键字次关键字 ——识别若干记录的关键字
全部比较总次数为1×20＋2×21＋3×22＋4×23…＋m×2m—1 ＝
三、分块查找（索引顺序查找）
这是一种顺序查找的另一种改进方法。先让数据分块有序，即分成若干子表，要求每个子表中的数值（用关键字更准确）都比后一块中数值小（但子表内部未必有序）。然后将各子表中的最大关键字构成一个索引表，表中还要包含每个子表的起始地址（即头指针）。例：索引表特点：块间有 48 86 最大关键字 22 序，块内无序起始地址 1 7 13
要求：对于给定值key,若表中存在其关键字等于key的记录，则查找成功返回；否则插入关键字等于key 的记录。
典型的动态表———二叉排序树一、二叉排序树的定义
二、二叉排序树的插入与删除
三、二叉排序树的查找分析
四、平衡二叉树
一、二叉排序树的定义
----或是一棵空树；或者是具有如下性质的非空二叉树：（1）左子树的所有结点均小于根的值；（2）右子树的所有结点均大于根的值；（3）它的左右子树也分别为二叉排序树。练：下列2种图形中，哪个不是二叉排序树？
ST.elem[0].key =key;
//设立哨兵，可免去查找过程中每一步都要检测是否查找完毕。当n>1000时，查找时间将减少一半。
for( i=ST.length; ST.elem[ i ].key!=key; - - i );
//不要用for(i=n; i>0; - -i) 或 for(i=1; i<=n; i++)
例如“学号”
例如“女”
讨论：
（1）查找的过程是怎样的？
给定一个值K，在含有n个记录的文件中进行搜索，寻找一个关键字值等于K的记录，如找到则输出该记录，否则输出查找不成功的信息。
（2）对查找表常用的操作有哪些？

查询某个“特定的”数据元素是否在表中；查询某个“特定的”数据元素的各种属性；在查找表中插入一元素；从查找表中删除一元素。查找方法取决于表中数据的排列方式;
讨论1：二叉排序树的插入和查找操作例：输入待查找的关键字序列=（45，24，53，45，12，24，90）则生成二叉排序树的过程为：
24 查找成功，返回查找成功，返回
45 53
12
90
如果待查找的关键字序列输入顺序为：（24，53， 45，45，12，24，90），则生成的二叉排查序树形态不同：找
一、顺序查找（线性查找）
二、折半查找（二分或对分查找）三、静态树表的查找四、分块查找（索引顺序查找）
一、顺序查找（ Linear search，又称线性查找）
顺序查找：即用逐一比较的办法顺序查找关键字，这显然是最直接的办法。对顺序结构如何线性查找？见下页之例或教材P216；对单链表结构如何线性查找？函数虽未给出，但也很容易编写；只要知道头指针head就可以“顺藤摸瓜”；对非线性树结构如何顺序查找?可借助各种遍历操作！（1）顺序表的机内存储结构： typedef struct { ElemType *elem; //表基址，0号单元留空。表容量为全部元素 int length; //表长，即表中数据元素个数 }SSTable;
// 在右子树中继续查找
} // SearchBST
Status SearchBST( BiTree T, KeyType key, BiTree f, BiTree &p) {
if (!T) { p = f；return FALSE；} // 查找不成功 else if EQ (key, T—>data.key) { p=T；return TRUE；} // 查找成功 else if LT (key, T—>data.key) return SearchBST(T—>lchild, key, T,p); // 在左子树中继续查找 else return SearchBST(T—>rchild, key, T, p); // 在右子树中继续查找 } // SearchBST
讨论② 查找效率怎样计算？
——用平均查找长度ASL衡量。
讨论③ 如何计算ASL？
分析：查找第1个元素所需的比较次数为1；查找第2个元素所需的比较次数为2； …… 查找第n个元素所需的比较次数为n；
未考虑查找不成功的情况：查找哨兵所需的比较次数为n+1
总计全部比较次数为：1＋2＋…＋n = (1+n)n/2 若求某一个元素的平均查找次数，还应当除以n（等概率），即： ASL＝（1＋n）/2 ，时间效率为 O(n)
数据结构课程的内容
第 9章
查找
9.1 基本概念
9.2 静态查找表 9.3 动态查找表 9.4 哈希表
教材第8、11和12章省略，因《操作系统》课程会涉及。
9.1 基本概念
查找
是一种数据结构
查找表 ——由同一类型的数据元素（或记录）构成的集合。 ——查询(Searching)特定元素是否在表中。 ——若表中存在特定元素，称查找成功，应输出该记录；