串匹配问题,算法分析与设计答案

合集下载

《算法分析与设计》期末复习题[1]

一、选择题1．一个.java文件中可以有（）个public类。

A．一个B．两个C．多个D．零个2．一个算法应该是（）A．程序B．问题求解步骤的描述C．要满足五个基本特性D．A和C3．用计算机无法解决“打印所有素数”的问题，其原因是解决该问题的算法违背了算法特征中的（）A．唯一性B．有穷性C．有0个或多个输入D．有输出4．某校有6位学生参加学生会主席竞选，得票数依次为130，20，98，15，67，3。

若采用冒泡排序算法对其进行排序，则完成第二遍时的结果是（）A．3，15，130，20，98，67B．3，15，20，130，98，67C．3，15，20，67，130，98 D．3，15，20，67，98，1305．下列关于算法的描述，正确的是（）A．一个算法的执行步骤可以是无限的B．一个完整的算法必须有输出C．算法只能用流程图表示D．一个完整的算法至少有一个输入6．Java Application源程序的主类是指包含有（）方法的类。

A、main方法B、toString方法C、init方法D、actionPerfromed方法7．找出满足各位数字之和等于5的所有三位数可采用的算法思路是（）A．分治法B．减治法C．蛮力法D．变治法8．在编写Java Application程序时，若需要使用到标准输入输出语句，必须在程序的开头写上( )语句。

A、import java.awt.* ;B、import java.applet.Applet ;C、import java.io.* ;D、import java.awt.Graphics ;9．计算某球队平均年龄的部分算法流程图如图所示，其中：c用来记录已输入球员的人数，sum用来计算有效数据之和，d用来存储从键盘输入的球员年龄值，输入0时表示输入结束。

图中空白处理框①和②处应填入的是（）A．①sum ←sum + d B．①sum ←sum + c②c ←c + 1②c ←c + 1C．①sum ←sum + d D．①sum ←sum + c②d ←d + 1 ②d ←d + 110．报名参加冬季越野赛跑的某班5位学生的学号是：5，8，11，33，45。

数据结构(C++版)课后答案_(王红梅)第3章_特殊线性表

⑺ 栈和队列的主要区别在于（）。 A 它们的逻辑结构不一样 B 它们的存储结构不一样 C 所包含的运算不一样 D 插入、删除运算的限定不一样【解答】D
⑻ 设数组 S[n]作为两个栈 S1 和 S2 的存储空间，对任何一个栈只有当 S[n]全满时才不能进行进栈操作。为这两个栈分配空间的最佳方案是（）。 A S1 的栈底位置为 0，S2 的栈底位置为 n-1 B S1 的栈底位置为 0，S2 的栈底位置为 n/2 C S1 的栈底位置为 0，S2 的栈底位置为 n D S1 的栈底位置为 0，S2 的栈底位置为 1 【解答】A ⑼ 设有两个串 p 和 q，求 q 在 p 中首次出现的位置的运算称作（）。 A 连接 B 模式匹配 C 求子串 D 求串长【解答】B
⑷ 设计一个判别表达式中左右括号是否配对的算法，采用（）数据结构最佳 A 顺序表 B 栈 C 队列 D 链表【解答】B
⑸ 在解决计算机主机与打印机之间速度不匹配问题时通常设置一个打印缓冲区，该缓冲区应该是一个（）结构。 A 栈 B 队列 C 数组 D 线性表【解答】B
⑹ 一个队列的入队顺序是 1，2，3，4，则队列的输出顺序是（）。 A 4321 B 1234 C 1432 D 3241 【解答】B
5. 举例说明顺序队列的“假溢出”现象。【解答】假设有一个顺序队列，如图 3-6 所示，队尾指针 rear=4，队头指针 front=1，如果再有元素入队，就会产生“上溢”，此时的“上溢”又称为“假溢出”，因为队列并不是真的溢出了，存储队列的数组中还有 2 个存储单元空闲，其下标分别为 0 和 1。
⑷ 对于采用顺序存储结构的串 S，编写一个函数删除其值等于 ch 的所有字符。【解答】从后向前删除值为 ch 的所有元素，这样所有移动的元素中没有值为 ch 的元素，能减少移动元素的次数，提高算法的效率。算法如下：

支持带有通配符的字符串匹配算法

支持带有通配符的字符串匹配算法*运正佳, 李轶男, 杨晓春+【摘要】研究了查询字符串中含有通配符“*”以及“?”两种情况下的字符串匹配问题, 其中,“*”代表任意长度的字符串,“?”代表字母表中任意一个字符。

由于gram索引结构在空间大小以及查询效率上的优势, 将 gram索引结构用于带通配符的字符串匹配问题。

通过将带有通配符的查询字符串分解为若干不含通配符的查询片段, 成功地将带有通配符的复杂查询问题转化为不含通配符的简单精确子串匹配问题。

同时在片段查询过程中运用长度过滤、位置过滤以及计数过滤等方法来提高查询速度。

【期刊名称】计算机科学与探索【年(卷),期】2010(004)011【总页数】12【关键词】通配符;字符串匹配;q-gram索引1 引言传统的字符串匹配问题是在一个字符串集中找到与给定查询相匹配的结果。

与通常意义上的字符串匹配问题不同, 通配符的出现使查询过程变得更加复杂, 同时它更能满足许多应用领域的需求, 如生物序列分析、搜索引擎的文本索引、SQL查询等。

例如, 在对某公司仓库的数据库进行查询时, 若用户想搜索parts 表中所有颜色与green相关的物品, 可以输入SQL语句parts. color like “*green*”(通配符“*”表示任意长度的字符串),那么颜色是dark green、light green、greenish blue等的物品都会被作为结果返回。

带有通配符的字符串查询一般用于查出一系列具有相同组成成分的字符串。

通配符的加入可以方便地提取有相似结构的字符串。

本文主要考虑以下两种常见通配符：(1) “*”通配符：代表任意长度的字符串, 可以是空串。

(2) “?”通配符：代表字母表中的任意一个字母。

目前关于通配符的匹配问题大多都是针对在线数据搜索, 有限的基于索引的查询方法占用的存储空间较大, 而且对于通配符的定义有所限制, 不具有普遍性。

如何利用较小的索引空间来支持高效的查询, 是研究该问题面临的主要挑战。

算法设计与分析-第3章-蛮力法

哨兵
0123456789 k 10 15 24 6 12 35 40 98 55
查找方向
i
清华大学出版社
算法设计与分析
算法3.2——改进的顺序查找
int SeqSearch2(int r[ ], int n, int k) //数组r[1] ~ r[n]存放查找集合 { r[0]=k; i=n; while (r[i]!=k)
清华大学出版社
算法设计与分析
第3章蛮力法
3.1 蛮力法的设计思想 3.2 查找问题中的蛮力法 3.3 排序问题中的蛮力法 3.4 组合问题中的蛮力法 3.5 图问题中的蛮力法 3.6 几何问题中的蛮力法 3.7 实验项目——串匹配问题
清华大学出版社
算法设计与分析
3.1 蛮力法的设计思想
蛮力法的设计思想：直接基于问题的描述。例：计算an
52 37 65 不可行不可行不可行不可行不可行
清华大学出版社
算法设计与分析
对于一个具有n个元素的集合，其子集数量是2n，所以，不论生成子集的算法效率有多高，蛮力法都会导致一个Ω(2n) 的算法。
清华大学出版社
算法设计与分析
3.4.4 任务分配问题
假设有n个任务需要分配给n个人执行，每个任务只分配给一个人，每个人只分配一个任务，且第j个任务分配给第i个人的成本是C[i, j]（1≤i , j≤n），任务分配问题要求找出总成本最小的分配方案。
用蛮力法解决0/1背包问题，需要考虑给定n个物品集合的所有子集，找出所有可能的子集（总重量不超过背包容量的子集），计算每个子集的总价值，然后在他们中找到价值最大的子集。
清华大学出版社
算法设计与分析
10

《数据结构与算法(C++语言版)》第4章_串

串函数与串的类定义
• 常用的常用的C++串函数串函数 • C++的串库（string.h）中提供了许多字符串的操作函数，几个常用的C++字符串函数及其使用方法如下。 •假设已有以下定义语句：
串函数与串的类定义
• （1）串拷贝函数 • char *strcpy(char *s1, const char *s2)，将字符串s2复制到字符串数组s1中，返回s1的值。 • char *strncpy(char *s1, const char *s2, size_tn)将字符串s2中最多n个字符复制到字符串数组s1中，返回s1的值。 • 例如：
串函数与串的类定义
• （3）串比较函数 • int strcmp(const char *s1, const char *s2)，比较字符串s1和字符串s2。函数在s1等于、小于或大于s2时，分别返回0、小于0或者大于0的值。 • int strncmp(const char *s1, const char *s2, size_tn)比较字符串 s1中的n个字符和字符串s2。函数在s1等于、小于或大于s2 时，分别返回0、小于0或者大于0的值。 • 例如：
串模式匹配
• 无回溯的匹配算法 • 在上面介绍的匹配算法中，某趟匹配失败时，下一趟的匹配相当于将子串P后移1位再从头与主串中对应字符进行比较，即相当于i指示器回溯到上趟（最近失败的一趟）匹配的起点的下一个位置，这样，主串中每个字符都要与子串中的第1个字符对应一次，再向后比较。因此，主串中每个字符参加比较的次数最多可达n次（n为子串长度），因此时间复杂度为O(nm)。那么，能否使目标串中每个字符只参加一次比较呢？也就是说，能否不回溯i指示器？回答是肯定的。这个问题是由D.E.Knoth与V.R.Pratt和J.H.Morris同时解决的，所以有的文献也称这种思想的串匹配算法为KMP 算法。

数据结构第4章串

ring s, SString t)
/*若串s和t相等则返回0；若s>t则返回正数；若s<t则返回负数*/
{ int i;
for (i=0;i<s.len&&i<t.len;i++)
if (s.ch[i]!=t.ch[i]) return(s.ch[i] - t.ch[i]);
初始条件 : 串 S 存在 ,1≤pos≤StrLength(S) 且 1≤len≤StrLength(S)-pos+1
操作结果:用Sub返回串S的第pos个字符起长度为len的子串
返回主目录
（11）StrIndex(S,T,pos)
初始条件: 串S和T存在,T是非空串, 1≤pos≤StrLength(S)
return(s.len); }
返回主目录
（7）清空函数
StrClear(SString *s) /*将串s置为空串*/ {
s->len=0; }
返回主目录
（8）连接函数
(1) 连接后串长≤MAXLEN，则直接将B加在A的后面。 (2) 连接后串长>MAXLEN且LA<MAXLEN，则B 会有部分字符被舍弃。 (3) 连接后串长>MAXLEN且LA=MAXLEN，则B 的全部字符被舍弃（不需连接）。
for (i=s->len + t.len-1;i>=t.len + pos;i--)
s->ch[i]=s->ch[i-t.len];
for (i=0;i<t.len;i++) s->ch[i+pos]=t.ch[i];
s->len=s->len+t.len;

全国高校计算机能力挑战赛程序设计赛题库

全国高校计算机能力挑战赛程序设计赛题库近年来，随着计算机科学与技术在各行各业的迅速发展，计算机能力已经成为现代社会不可或缺的一部分。

而在高校中，计算机能力挑战赛已经成为一项受到广泛关注的活动，它不仅能够锻炼学生的计算机编程能力，还能够提升他们的团队合作意识和解决问题的能力。

而在这些计算机能力挑战赛中，程序设计竞赛更是备受重视。

本文将介绍全国高校计算机能力挑战赛程序设计赛题库，并对其进行分析和总结。

一、题库概况全国高校计算机能力挑战赛程序设计赛题库是一个涵盖了多个难度和类型的题目的数据库。

这些题目旨在考察选手在算法设计与实现、数据结构、程序的完整性、调试能力、团队协作等方面的能力。

题库中的题目长度和难度均有所不同，覆盖了从基础知识到高级应用的各种内容。

在题库中，还包括了历年来真实的比赛题目和模拟题目，这些题目经过了严格的筛选和验证，具有一定的权威性和可操作性。

二、题目分类全国高校计算机能力挑战赛程序设计赛题库的题目主要包括以下几个方面的内容：1. 算法思想：涵盖贪心算法、动态规划、分治算法、搜索算法、图论算法等多种算法思想，要求选手根据题目特点选择合适的算法进行实现。

2. 数据结构：包括数组、链表、栈、队列、树、图等多种数据结构的操作和运用，要求选手熟练掌握各种数据结构的特点和操作方法。

3. 程序设计：要求选手能够使用C++、Java、Python等编程语言编写程序，并进行调试和优化。

4. 实战能力：模拟比赛中的真实考察和比赛中可能会遇到的各种情况，要求选手能够在有限的时间内解决各类问题。

5. 创新能力：包含一些较为新颖的题目，要求选手在有限的条件下，发挥创造力，提出新的解决方案。

三、题目特点全国高校计算机能力挑战赛程序设计赛题库的题目具有以下几个特点：1. 难度适中：题库中的题目难度设置合理，既包括了一些基础题目，也包括了一些难度较大的高级题目，满足了不同层次选手的需求。

2. 实用性强：题目的内容贴合实际，涉及到了生活、工作、学习等多个方面，能够培养选手解决实际问题的能力。

数据结构期末考试题及答案

数据结构期末考试题及答案一、选择题（每题2分，共20分）1. 在数据结构中，线性表的顺序存储结构通常使用什么数据结构来实现？A. 链表B. 数组C. 栈D. 队列答案：B2. 以下哪个是二叉树的性质？A. 每个节点最多有两个孩子B. 每个节点最多有三个孩子C. 每个节点最多有四个孩子D. 每个节点最多有五个孩子答案：A3. 在图的遍历算法中，深度优先搜索（DFS）和广度优先搜索（BFS）的区别是什么？A. DFS使用队列，BFS使用栈B. DFS使用栈，BFS使用队列C. DFS和BFS都使用栈D. DFS和BFS都使用队列答案：B...20. 以下哪个排序算法的时间复杂度为O(n^2)？A. 冒泡排序B. 选择排序C. 插入排序D. 所有上述排序算法答案：D二、简答题（每题10分，共30分）1. 简述链表和数组的区别。

答案：链表和数组都是用来存储数据的线性数据结构。

数组是连续的内存空间，可以随机访问，但插入和删除操作效率较低；链表由一系列节点组成，每个节点包含数据部分和指向下一个节点的指针，不支持随机访问，但插入和删除操作较为高效。

2. 什么是递归？请给出一个递归算法的例子。

答案：递归是一种算法设计技术，它允许函数调用自身来解决问题。

递归通常包含基本情况和递归情况。

例如，计算阶乘的递归算法：f(n) = n * f(n-1)，其中基本情况是f(1) = 1。

...三、算法设计题（每题25分，共50分）1. 给定一个整数数组，请设计一个算法找出数组中的第k大元素。

答案：可以采用快速选择算法，类似于快速排序的划分过程，通过随机选择一个元素作为基准，将数组分为两部分，一部分包含比基准大的元素，另一部分包含比基准小的元素。

然后根据k与基准元素的位置关系，决定是继续在左侧子数组还是右侧子数组中进行查找。

2. 描述如何使用哈希表解决字符串匹配问题。

答案：哈希表可以用于实现字符串匹配的KMP算法。

首先，构建模式字符串的前缀函数，该函数用于记录模式字符串中每个位置的最长相同前缀和后缀的长度。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、实验内容和目的
1、深刻理解并掌握蛮力算法的设计思想；
2、提高应用蛮力算法设计算法的技能；
3、理解这样一个观点:用蛮力法设计的算法，一般来说，经过适度的努
力后，都可以对算法的第一个版本进行一定程度的改良，改进其时
间性能
BF算法：
基本思想：从主串S的第一个字符开始和模式T的第一个字符进行比
较，若相等，则继续比较两者的后续字符；若不相等，则从主串S
的第二个字符开始和模式T的第一个字符进行比较，重复上述过程，若T中的字符全部比较完毕，则说明本趟匹配成功；若最后一轮匹配
的起始位置是n-m，则主串S中剩下的字符不足够匹配整个模式T，
匹配失败。

这个算法称为朴素的模式匹配算法，简称BF算法。

KMP算法：
1. 在串S和串T中分别设比较的起始下标i和j；
2. 循环直到S中所剩字符长度小于T的长度或T中所有字符均比较
完毕
2.1 如果S[i]=T[j]，则继续比较S和T的下一个字符；否则
2.2 将j向右滑动到next[j]位置，即j=next[j]；
2.3 如果j=0，则将i和j分别加1，准备下一趟比较；
2.4 如果T中所有字符均比较完毕，则返回匹配的起始下标；
否则返回0；
BM算法：
BM算法与KMP算法的主要区别是匹配操作的方向不同。

虽然BM算法
仅把匹配操作的字符比突顺序改为从右向左，但匹配发生失败时，模
式T右移的计算方法却发生了较大的变化。

设计思想：设文本串T，模式串为P。

首先将T与P进行左对齐，然
后进行从右向左比较，若是某趟比较不匹配时，BM算法就采用两条
启发式规则，即坏字符规则和好后缀规则，来计算模式串向右移动的距离，直到整个匹配过程的结束。

b=n
Y
N
Y
N
BF 算法
结束
KMP 算法
结束
a-b →a
b=-1
b 加1
结束
BM算法
二、所用仪器、材料（设备名称、型号、规格等）
Windows 7，Microsoft Visual C++ 6.0
三、实验方法、步骤
1、实现BF算法；
2、实现BF算法的改进算法:KMP算法和BM算法；
3、观察并记录运行结果。

四、实验过程原始记录(数据、图表、计算等)
源程序：
#include "stdio.h"
#include "conio.h"
#include <iostream>
//BF算法
int BF(char s[],char t[])
{
int i;
int a;
int b;
int m,n;
m=strlen(s); //主串长度
n=strlen(t); //子串长度
printf("\n*****BF*****算法\n");
for(i=0;i<m;i++)
{
b=0;
a=i;
while(s[a]==t[b]&&b!=n)
{
a++;
b++;
}
if(b==n)
{
printf("查找成功!!\n\n");
return 0;
}
}
printf("找不到%s\n\n",t);
return 0;
}
//前缀函数值,用于KMP算法
int GETNEXT(char t[],int b)
{
int NEXT[10];
NEXT[0]=-1;
int j,k;
j=0;
k=-1;
while(j<strlen(t))
{
if ((k==-1)||(t[j]==t[k]))
{
j++;
k++;
NEXT[j]=k;
}
else k=NEXT[k];
}
b=NEXT[b];
return b;
}
//KMP算法
int KMP(char s[],char t[])
{
int a=0;
int b=0;
int m,n;
m=strlen(s); //主串长度
n=strlen(t); //子串长度
printf("\n*****KMP算法*****\n");
while(a<=m-n)
{
while(s[a]==t[b]&&b!=n)
{
a++;
b++;
}
if(b==n)
{
printf("查找成功!!\n\n");
return 0;
}
b=GETNEXT(t,b);
a=a-b;
if(b==-1) b++;
}
printf("找不到%s\n\n",t);
return 0;
}
//滑动距离函数,用于BM算法
int DIST(char t[],char c)
{
int i=0,x=1;
int n;
n=strlen(t);
while(x&&i!=n-1)
{
if(t[i]==c)
x=0;
else i++;
}
if(i!=n-1)
n=n-1-i;
return n;
}
//BM算法
int BM(char s[],char t[])
{
int a=0;
int b=0;
int i,j;
printf("\n*****BM算法*****\n");
int z=0;
i=strlen(t)-1;
while(i<=strlen(s)-1)
{
j=strlen(t)-1;
while(j>=0&&s[i]==t[j])
{
j--;
i--;
}
if(j<0)
{
printf("查找成功!!\n\n");
return 0;
}
else
i=i+DIST(t,s[i]);
}
printf("找不到%s\n\n",t);
return 0;
}
void main()
{
char s[]={'\0'}; //主串S
int n=10;
char t[]={'\0'}; //模式T
printf("\n----------串匹配问题----------\n");
printf("\n输入主串S\nS=");
scanf("%s",&s);
printf("\n输入子串T\nT=");
scanf("%s",&t);
printf("主串长%d,子串长为%d\n",strlen(s),strlen(t));
BF(s,t); //BF算法
KMP(s,t); //KMP算法
BM(s,t); //BM算法
}。