分块查找实现

合集下载

查找排序

Low指向待查元素所在区间的下界 mid指向待查元素所在区间的中间位臵 high指向待查元素所在区间的上界
解：① 先设定3个辅助标志: low,high,mid，显然有：mid= (low+high)/2 ② 运算步骤：
(1) low =1,high =11 ,故mid =6 ，待查范围是 [1,11]； (2) 若 S[mid] < key，说明 key[ mid+1,high] ，则令：low =mid+1;重算 mid＝ (low+high)/2；. (3) 若 S[mid] > key，说明key[low ,mid-1]，则令：high =mid–1;重算 mid ； (4)若 S[ mid ] = key，说明查找成功，元素序号=mid; 结束条件：（1）查找成功： S[mid] = key （2）查找不成功： high＜low （意即区间长度小于0）
while(low<=high)
{ mid=(low+high)/2; if(ST[mid].key= = key) return (mid); /*查找成功*/
else if( key< ST[mid].key) high=mid-1; /*在前半区间继续查找*/ else } return (0); /*查找不成功*/
4 5 6 7
0
1
2
90
10
(c)
20
40
K=90
80
30
60
Hale Waihona Puke 25(return i=0 )
6
讨论：怎样衡量查找效率？
——用平均查找长度（ASL）衡量。
如何计算ASL？

分块查找的原理

分块查找的原理分块查找是一种常用的查找算法，它将待查找的数据集合分成若干块，然后对每一块进行查找，从而提高查找效率。

本文将详细介绍分块查找的原理及其应用。

一、分块查找的原理分块查找是一种将顺序表分成若干块的查找方法。

首先将数据集合分成若干块，每一块包含一定数量的数据元素。

每一块的元素可以是有序的，也可以是无序的。

在进行查找时，首先确定待查找元素所在的块，然后在该块中进行查找。

如果待查找元素在当前块中存在，则查找成功；如果待查找元素不在当前块中，则需要在其他块中继续查找，直到找到为止。

为了提高查找效率，通常会对每一块的第一个元素建立一个索引表，该索引表记录了每一块的起始位置和结束位置。

通过索引表可以快速确定待查找元素所在的块。

二、分块查找的步骤分块查找的步骤如下：1. 将数据集合划分成若干块，并确定每一块的起始位置和结束位置。

2. 对每一块的元素进行排序（可选）。

3. 建立索引表，记录每一块的起始位置和结束位置。

4. 根据待查找元素的值，在索引表中确定待查找元素所在的块。

5. 在确定的块中进行查找，如果找到待查找元素，则查找成功；否则，继续在其他块中查找，直到找到为止。

三、分块查找的应用分块查找广泛应用于各种需要高效查找的场景，例如：1. 图书馆的图书分类系统：将图书按照不同的分类分成若干块，每一本书属于某个分类块。

读者在查找图书时，可以根据分类索引表快速定位到所需的分类块，然后在该块中查找目标图书。

2. 在有序链表中查找：将有序链表按照一定规则（如元素大小）划分成若干块，每一块包含一定数量的链表节点。

通过建立索引表，可以快速定位到待查找元素所在的块，然后在该块中进行查找。

3. 股票价格查询系统：将股票按照行业、市值等特征分成若干块，每一块包含一定数量的股票。

用户可以通过选择特定的行业或市值范围，快速定位到所需的块，然后在该块中查找目标股票。

四、分块查找的优缺点分块查找具有以下优点：1. 查找效率较高：通过分块和索引表，可以快速定位到待查找元素所在的块，从而减少了查找的范围。

数据结构复习题及答案5篇

数据结构复习题及答案5篇第一篇：数据结构复习题及答案、数据结构复习题及答案中南大学现代远程教育课程考试（专科）复习题及参考答案数据结构一、判断题：1．数组是一种复杂的数据结构，数组元素之间的关系既不是线性的也不是树形的。

（）2．链式存储在插人和删除时需要保持物理存储空间的顺序分配，不需要保持数据元素之间的逻辑顺序。

（）3．在只有度为0和度为k的结点的k叉树中，设度为0的结点有n0个，度为k的结点有nk个，则有n0=nk+1。

（）4．折半搜索只适用于有序表，包括有序的顺序表和有序的链表。

（）5．如果两个串含有相同的字符，则这两个串相等。

（）6．数组可以看成线性结构的一种推广，因此可以对它进行插入、删除等运算。

（）7．在用循环单链表表示的链式队列中，可以不设队头指针，仅在链尾设置队尾指针。

（）8．通常递归的算法简单、易懂、容易编写，而且执行的效率也高。

（）9．一个广义表的表尾总是一个广义表。

（）10．当从一个小根堆（最小堆）中删除一个元素时，需要把堆尾元素填补到堆顶位置，然后再按条件把它逐层向下调整，直到调整到合适位置为止。

（）11．对于一棵具有n个结点，其高度为h的二叉树，进行任一种次序遍历的时间复杂度为O（h）。

（）12．存储图的邻接矩阵中，邻接矩阵的大小不但与图的顶点个数有关，而且与图的边数也有关。

（）13．直接选择排序是一种稳定的排序方法。

（）14．闭散列法通常比开散列法时间效率更高。

（）15．有n个结点的不同的二叉树有n!棵。

（）16．直接选择排序是一种不稳定的排序方法。

（）17．在2048个互不相同的关键码中选择最小的5个关键码，用堆排序比用锦标赛排序更快。

（）18．当3阶B_树中有255个关键码时,其最大高度(包括失败结点层)不超过8。

（）19．一棵3阶B_树是平衡的3路搜索树,反之,一棵平衡的3路搜索树是3阶非B_树。

（）20．在用散列表存储关键码集合时，可以用双散列法寻找下一个空桶。

数据结构大纲知识点

数据结构大纲知识点一、绪论。

1. 数据结构的基本概念。

- 数据、数据元素、数据项。

- 数据结构的定义（逻辑结构、存储结构、数据的运算）- 数据结构的三要素之间的关系。

2. 算法的基本概念。

- 算法的定义、特性（有穷性、确定性、可行性、输入、输出）- 算法的评价指标（时间复杂度、空间复杂度的计算方法）二、线性表。

1. 线性表的定义和基本操作。

- 线性表的逻辑结构特点（线性关系）- 线性表的基本操作（如初始化、插入、删除、查找等操作的定义）2. 顺序存储结构。

- 顺序表的定义（用数组实现线性表）- 顺序表的基本操作实现（插入、删除操作的时间复杂度分析）- 顺序表的优缺点。

3. 链式存储结构。

- 单链表的定义（结点结构，头指针、头结点的概念）- 单链表的基本操作实现（建立单链表、插入、删除、查找等操作的代码实现及时间复杂度分析）- 循环链表（与单链表的区别，操作特点）- 双向链表（结点结构，基本操作的实现及特点）三、栈和队列。

1. 栈。

- 栈的定义（后进先出的线性表）- 栈的基本操作（入栈、出栈、取栈顶元素等操作的定义）- 顺序栈的实现（存储结构，基本操作的代码实现）- 链栈的实现（与单链表的联系，基本操作的实现）- 栈的应用（表达式求值、函数调用栈等）2. 队列。

- 队列的定义（先进先出的线性表）- 队列的基本操作（入队、出队、取队头元素等操作的定义）- 顺序队列（存在的问题，如假溢出）- 循环队列的实现（存储结构，基本操作的代码实现，队空和队满的判断条件）- 链队列的实现（结点结构，基本操作的实现）- 队列的应用（如操作系统中的进程调度等）四、串。

1. 串的定义和基本操作。

- 串的概念（字符序列）- 串的基本操作（如连接、求子串、比较等操作的定义）2. 串的存储结构。

- 顺序存储结构（定长顺序存储和堆分配存储）- 链式存储结构（块链存储结构）3. 串的模式匹配算法。

- 简单的模式匹配算法（Brute - Force算法）的实现及时间复杂度分析。

中国石油大学期末考试复习题 070109数据结构-18

《数据结构》综合复习资料一、填空题1、数据结构是（）。

2、数据结构的四种基本形式为集合、（）、（）和（）。

3、线性结构的基本特征是:若至少含有一个结点，则除起始结点没有直接前驱外，其他结点有且仅有一个直接（）；除终端结点没有直接（）外，其它结点有且仅有一个直接（）。

4、堆栈的特点是（），队列的特点是（），字符串中的数据元素为（）。

5、字符串s1=“I am a student！”(单词与单词之间一个空格),s2=“student”,则字符串s1的长度为（），串s2是串s1的一个（）串，串s2在s1中的位置为（）。

6、KMP算法的特点：效率较（）；（）回溯，对主串仅需要从头到尾扫描（）遍，可以边读入边匹配。

7、广义表（（a），（（b），c），（（（d））））的长度为（），表头为（），表尾为（）。

8、ADT称为抽象数据类型，它是指（）。

9、求下列程序的时间复杂度，并用大O表示方法表示（）。

for( i=1 ; i<=n ; + + i)for( j=1 ; j<=i; + + j ){ ++x;a[i][j] = x;}10、以下运算实现在链栈上的退栈操作，请在_____处用适当句子予以填充。

int Pop(LstackTp *ls,DataType *x){ LstackTp *p;if(ls!=NULL){ p=ls;*x= ;ls= ;;return(1)；}else return(0);}11、用堆栈求中缀表达式a+b*c/d+e*f的后缀表达式，求出的后缀表达式为（）。

12、C语言中存储数组是采用以（）为主序存储的，在C语言中定义二维数组float a[8][10],每个数据元素占4个字节，则数组共占用（）字节的内存。

若第一个数据元素的存储地址为8000，则a[5][8]的存储地址为（）。

13、含零个字符的串称为（）串，用表示。

其他串称为（）串。

任何串中所含字符的个数称为该串的（）。

分块查找求平均查找长度例题

分块查找求平均查找长度例题分块查找求平均查找长度例题一、背景介绍分块查找是一种查找技术，它将数据块划分为大小相等的块，然后在每个块中进行线性查找。

其主要优点是在一些应用场景下能够提高查找效率，尤其是对于大规模数据的查找操作。

在分块查找中，平均查找长度是一个重要的指标，它表示在平均情况下查找一个元素需要遍历的节点数。

在本文中，我们将通过一个例题来详细介绍分块查找求平均查找长度的计算方法。

二、例题介绍假设有一个长度为100的数组，每10个元素为一块，共有10块。

现在我们要查找数组中的某个元素x，为了简化问题，我们假设x在数组中出现的概率相同。

那么在这种情况下，如何计算分块查找的平均查找长度呢？接下来我们将一步步进行计算。

三、具体计算步骤1.划分块：我们将数组划分为大小相等的10个块，每块包含10个元素。

这样做的目的是为了方便计算和查找操作。

2.计算每块的平均查找长度：对于每一块来说，由于每个元素的出现概率相同，所以平均查找长度为(1+2+3+...+10)/10=5.5。

3.计算平均查找长度：在分块查找中，平均查找长度的计算公式为：(m+1)/2 + n/m，其中m为块的个数，n为要查找的元素在块内的位置。

根据这个公式，我们可以得到平均查找长度为(10+1)/2 +5.5=10.5。

四、总结回顾通过以上的计算步骤，我们可以得出分块查找求平均查找长度的具体计算方法。

在实际应用中，如果我们能够事先得知元素的概率分布情况，就可以通过类似的计算来评估分块查找的性能。

我们也可以根据实际情况调整块的大小和分块的数目，以提高查找效率。

五、个人观点和理解分块查找作为一种常见的查找技术，对于大规模数据的查找操作有着明显的优势。

通过合理的分块设计和平均查找长度的计算，我们可以更好地评估分块查找在不同场景下的表现，并根据实际情况进行优化。

在未来的发展中，我相信分块查找将在更多的领域发挥重要作用，为数据查找操作提供更高效的解决方案。

查找表结构——精选推荐

查找表结构查找表介绍在⽇常⽣活中，⼏乎每天都要进⾏⼀些查找的⼯作，在电话簿中查阅某个⼈的电话号码；在电脑的⽂件夹中查找某个具体的⽂件等等。

本节主要介绍⽤于查找操作的数据结构——查找表。

查找表是由同⼀类型的数据元素构成的集合。

例如电话号码簿和字典都可以看作是⼀张查找表。

⼀般对于查找表有以下⼏种操作：在查找表中查找某个具体的数据元素；在查找表中插⼊数据元素；从查找表中删除数据元素；静态查找表和动态查找表在查找表中只做查找操作，⽽不改动表中数据元素，称此类查找表为静态查找表；反之，在查找表中做查找操作的同时进⾏插⼊数据或者删除数据的操作，称此类表为动态查找表。

关键字在查找表查找某个特定元素时，前提是需要知道这个元素的⼀些属性。

例如，每个⼈上学的时候都会有⾃⼰唯⼀的学号，因为你的姓名、年龄都有可能和其他⼈是重复的，唯独学号不会重复。

⽽学⽣具有的这些属性（学号、姓名、年龄等）都可以称为关键字。

关键字⼜细分为主关键字和次关键字。

若某个关键字可以唯⼀地识别⼀个数据元素时，称这个关键字为主关键字，例如学⽣的学号就具有唯⼀性；反之，像学⽣姓名、年龄这类的关键字，由于不具有唯⼀性，称为次关键字。

如何进⾏查找？不同的查找表，其使⽤的查找⽅法是不同的。

例如每个⼈都有属于⾃⼰的朋友圈，都有⾃⼰的电话簿，电话簿中数据的排序⽅式是多种多样的，有的是按照姓名的⾸字母进⾏排序，这种情况在查找时，就可以根据被查找元素的⾸字母进⾏顺序查找；有的是按照类别（亲朋好友）进⾏排序。

在查找时，就需要根据被查找元素本⾝的类别关键字进⾏排序。

具体的查找⽅法需要根据实际应⽤中具体情况⽽定。

顺序查找算法(C++)静态查找表既可以使⽤顺序表表⽰，也可以使⽤链表结构表⽰。

虽然⼀个是数组、⼀个链表，但两者在做查找操作时，基本上⼤同⼩异。

顺序查找的实现静态查找表⽤顺序存储结构表⽰时，顺序查找的查找过程为：从表中的最后⼀个数据元素开始，逐个同记录的关键字做⽐较，如果匹配成功，则查找成功；反之，如果直到表中第⼀个关键字查找完也没有成功匹配，则查找失败。

分块查找

3. 索引顺序表的查找
索引顺序查找也叫分块查找，它是顺序查找的一种改进方法。

以索引顺序表表示静态查找表时，查找方法可用分块查找来实现。

3.1 基本思想
假设有n个数据元素，将这n个元素按“分块有序”划分为m块（m≤n）。

所谓“分块有序”是指每一块中的元素不要求有序（可以有序），但块与块之间有序，即第2块中的元素的所有关键字均大于第1块中的最大关键字，第3块中的元素的所有关键字均大于第2块中的最大关键字，……，以此类推。

在此查找法中，除了数据表本身以外，还要建立一个索引表，该索引表为每一子块设置一个索引项，每一个索引项包括两部分：关键字项（其值为该子块内的最大关键字）和指针项（指示该子块第一个元素在数据表中的位置，即起始地址）。

数据表分块示意如下图所示：
图3- 1 分块查找表及索引表
3.2 查找过程
分块查找过程需要分三步进行，先选取各块中的最大关键字和第一个元素构成一个索引表，然后确定待查记录所在的块，最后在块中顺序查找。

索引表是按关键字有序的，且长度一般不大，所以可以使用二分查找，也可以使用顺序查找以确定待查记录在哪个块。

确定好在哪个块之后，在块里面使用顺序查找方法查找（块的元素不要求有序）。

3.3 平均查找长度
设长度为n的表均匀分成b块，每块含有s个元素（记录），则b=n/s。

当使用顺序查找方法查找所在块时，分块查找的平均查找长度=(b+1)/2 + (s+1)/2 = (n/s+s)/2+1；当使用二分查找方法查找所在块时，分块查找的平均查找长度=log2(n/s+1)+s/2。

其性能介于顺序查找和二分查找之间。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

索引顺序表的设计与实现
else { mid=(low+high)/2; // 中间位置为低位与高位和的一半取整。 midvalue=A[mid]; if (key>A[mid-1]&&key<=A[mid]) return mid; else if (midvalue < key) //如果关键字的值大于中间值 return BinSearch(A,mid+1,high,key); // 递归调用函数，搜索下半部分 else return BinSearch(A,low,mid-1,key); // 否则递归调用哦个函数，搜索上半部分 }
索引顺序表的设计与实现
cout<<"分块情况为"<<endl; for( i = 0 ; i < row ; i ++ ) { for( j = 0 ;j <B[i] ; j ++ ) { cout<<p2[i][j]<<' ' ; if(p2[i][j]>=M[i]) M[i]=p2[i][j]; //找到块的最大关键字存储在M[] } cout<<endl; } //输出二维数组，检验分块是否为预期
索引顺序表的设计与实现
int *S; S = new int[kuai] ; for(i=0;i<B[kuai];i++) {S[i]=p2[kuai][i]; } //初始化一个一维数组，将关键字所在快的元素重新定义为一个数组S pos=shuxuSearch(S,B[kuai],key);//在S中顺序查找关键字 int q=0; for(i=0;i<kuai;i++) {q=q+B[i];} if (pos!=B[kuai]) cout<<"该元素的位置为:"<<pos+q<<endl; //如果关键字存在，输出其位置
声明折半查找函数
声明顺序查找函数
程序设计流程
主函数
声明各种变量
输入关键字的个数
输入分块个数
输入每个分块中的关键字的个数
得到关键字所
声明一个二维数组并将关键字按快存储在二维数组中
输入关键字
调用顺序查找函数，对关键字所在快进行查找
指针字段
13 0
28 1
33 2
38 3
87 4
76 5
99 6
96 7
3．索引顺序表的设计与实现
根据教材介绍的索引顺序表，定义块的大小 k，输入适当数据构造索引顺序表，实现分块查找算法，并进行测试验证。
简介：索引顺序表包括存储数据的顺序表（称为主表）和
索引表两部分。顺序表被分为若干子表（又称块），整个顺序
表有序或分块有序。将每个子表中的最大关键字取出，再加上指向该关键字记录所在子表第一个元素的指针，就构成一个索引项，将这些索引项按关键字增序排列，就构成了索引表。
(2) 在已确定的子表中确定待查记录的位置，由于子表中的记录不一定按
关键字有序排列，只能按顺序查找法查找。
索引顺序表的设计与实现
折半查找法： int BinSearch(T A[],int low,int high,T key)//递归实现折半查找 { int mid; // 初始化中间值的位置 T midvalue; // 初始化中间值 if (low>high) { s=A[high]; d=A[low]; ss=high; dd=low; return -1;} // 如果low的值大于high的值，输出-1，并且将此时的low与high的值存储。
索引顺序表的设计与实现
过程分为两个阶段： (1) 确定待查记录所在的子表（块），由于索引表是按关键字有序排列的，对于索引表可按折半查找，若待查记录关键字的key值，<=第i个子表最大关键字，且大于第i-1个子表的最大关键字，即K(i-1) < key < K(i)，则待查关键字位于第i个子表中。
索引顺序表的设计与实现
顺序查找函数：
template <class T> int shuxuSearch(T A[],int high,T key) // 顺序查找 { int i=0; A[high]=key; // 初始化i，使 A的最高位为 key值 while(A[i]!=key) i++; return i; // 如果A中有key值，则在i不到n+1时就会输出，否则，返回high值，说明搜索失败。 }
索引顺序表的设计与实现
主函数中，首先对所需要的参数变量进行初始化，由键盘输入关键字，分块的多少，每一块有多少个关键字。为了用户的人性化考虑，这里由用户自己决定分块的多少和数目。为了实现这一功能，引入了一个动态存储的二维数组： int **p2 ; p2 = new int*[row] ; //声明一个二维数组 for( i = 0 ; i < row ; i ++ ) p2[i] = new int[col] ; for( i = 0 ; i < row ; i ++ ) {for( j = 0 ; j < B[i] ; j ++ ) {p2[i][j]=A[k]; k=k+1;} } //将所有关键字，按块的不同存入二维数组中
判断函数返回至是否等于输入数组长
No
YES
输出位置
YES
输出无该关键字
询问用户是否再次查找
NO
结束
测试实例：设主表关键字序列：{13 28 33 38 87 76 99 96}， L=4 ，依次查找K=13， K=33，K=99，K=11，K=30，K=97
关键码字段索引表
13 0 38 3 87 4 99 6