串的模式匹配算法实验报告

合集下载

【精品】数据结构串实验报告

【精品】数据结构串实验报告
（仅校内可用）
本次实验是基于数据结构串的相关知识，设计、实现及实验关于串的操作，并要求我们编写综合性实验报告。

1、实验目的是了解串结构及其实现方法，并能够用有限的时间内完成实验。

2、实验要求：
（1）实现关于串的一组基本操作
（2）实现串的模式匹配算法
3、实验的进度：
（1）完成程序的设计，要求建立合理的数据结构，编写部分重要算法，调试程序；
（2）设计一组完整的数据，并完成所设计程序的测试；
（3）对串模式匹配算法和高效率算法的效率、正确性进行测试；
（4）完成实验总结，参加试验验收。

4、实验结果：
（1）建立了串的节点数据结构，并编写相关操作算法，经测试结果显示，程序的实现能做到正确、有效的运行；
（2）完成对串模式匹配算法和高效率算法的测试，匹配算法水平介于暴力及KMP算法之间，效率较高；高效率算法在重复部分采用滑动窗口技术，同时避免了重复移动结点带来的时间开销，效率较高且正确性得到了优化；
（3）完成了实验总结，并得出本次实验的结论：实现串的模式匹配算法和高效率算法能够较好地实现串的基本操作，同时具有较高的效率；
最后，在实验过程中，我收获颇丰，加深了对串结构及实现方法的理解，使我对数据结构有了更全面的认识。

串的模式匹配问题实验总结（用C实现）

串的模式匹配问题实验总结（用C实现）第一篇：串的模式匹配问题实验总结(用C实现)串的模式匹配问题实验总结1实验题目：实现Index(S,T,pos)函数。

其中，Index(S,T,pos)为串T在串S的第pos个字符后第一次出现的位置。

2实验目的：熟练掌握串模式匹配算法。

3实验方法：分别用朴素模式匹配和KMP快速模式匹配来实现串的模式匹配问题。

具体方法如下：朴素模式匹配：输入两个字符串，主串S和子串T，从S串的第pos个位置开始与T的第一个位置比较，若不同执行i=i-j+2；j=1两个语句；若相同，则执行语句++i;++j;一直比较完毕为止，若S中有与T相同的部分则返回主串（S字符串）和子串（T字符串）相匹配时第一次出现的位置，若没有就返回0。

KMP快速模式匹配：构造函数get_next(char *T,int *next)，求出主串S串中各个字符的next值，然后在Index_KMP(char *S,char *T,int pos)函数中调用get_next(char *T,int *next)函数并调用next值，从S串的第pos 位置开始与T的第一个位置进行比较，若两者相等或j位置的字符next值等于0，则进行语句++i;++j;即一直向下进行。

否则，执行语句j=A[j]；直到比较完毕为止。

若S中有与T相同的部分则返回主串（S字符串）和子串（T字符串）相匹配时第一次出现的位置，若没有就返回04实验过程与结果：（1）、选择1功能“输入主串、子串和匹配起始位置”，输入主串S：asdfghjkl, 输入子串T：gh,输入pos的值为：2。

选择2功能“朴素的模式匹配算法”，输出结果为 5；选择3功能“KMP快速模式匹配算法”，输出结果为 5；选择0功能，退出程序。

截图如下：（2）、选择1功能“输入主串、子串和匹配起始位置”，输入主串S：asdfghjkl, 输入子串T：wp, 输入pos的值为：2。

实验三串的模式匹配

实验三串的模式匹配⼀、实验⽬的1、了解串的基本概念2、掌握串的模式匹配算法的实现⼆、实验预习说明以下概念1、模式匹配：数据结构中字符串的⼀种基本运算，给定⼀个⼦串，要求在某个字符串中找出与该⼦串相同的所有⼦串。

2、BF算法：BF算法，即暴⼒(Brute Force)算法，是普通的模式匹配算法，BF算法的思想就是将⽬标串S的第⼀个字符与模式串T的第⼀个字符进⾏匹配，若相等，则继续⽐较S的第⼆个字符和 T的第⼆个字符；若不相等，则⽐较S的第⼆个字符和T的第⼀个字符，依次⽐较下去，直到得出最后的匹配结果。

BF算法是⼀种蛮⼒算法。

3、KMP算法：KMP算法是⼀种改进的字符串匹配算法，KMP算法的核⼼是利⽤匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的⽬的。

具体实现就是通过⼀个next()函数实现，函数本⾝包含了模式串的局部匹配信息。

三、实验内容和要求1、阅读并运⾏下⾯程序，根据输⼊写出运⾏结果。

#include<stdio.h>#include<string.h>#define MAXSIZE 100typedef struct{char data[MAXSIZE];int length;}SqString;int strCompare(SqString *s1,SqString *s2); /*串的⽐较*/void show_strCompare();void strSub(SqString *s,int start,int sublen,SqString *sub);/*求⼦串*/void show_subString();int strCompare(SqString *s1,SqString *s2){int i;for(i=0;i<s1->length&&i<s2->length;i++)if(s1->data[i]!=s2->data[i])return s1->data[i]-s2->data[i];return s1->length-s2->length;}void show_strCompare(){SqString s1,s2;int k;printf("\n***show Compare***\n");printf("input string s1:");gets(s1.data);s1.length=strlen(s1.data);printf("input string s2:");gets(s2.data);s2.length=strlen(s2.data);if((k=strCompare(&s1,&s2))==0)printf("s1=s2\n");else if(k<0)printf("s1<s2\n");elseprintf("s1>s2\n");printf("\n***show over***\n");}void strSub(SqString *s,int start,int sublen,SqString *sub){int i;if(start<1||start>s->length||sublen>s->length-start+1){sub->length=0;}for(i=0;i<sublen;i++)sub->data[i]=s->data[start+i-1];sub->length=sublen;}void show_subString(){SqString s,sub;int start,sublen,i;printf("\n***show subString***\n");printf("input string s:");gets(s.data);s.length=strlen(s.data);printf("input start:");scanf("%d",&start);printf("input sublen:");scanf("%d",&sublen);strSub(&s,start,sublen,&sub);if(sub.length==0)printf("ERROR!\n");else{printf("subString is :");for(i=0;i<sublen;i++)printf("%c",sub.data[i]);}printf("\n***show over***\n");}int main(){int n;do {printf("\n---String---\n");printf("1. strCompare\n");printf("2. subString\n");printf("0. EXIT\n");printf("\ninput choice:");scanf("%d",&n);getchar();switch(n){case 1:show_strCompare();break;case 2:show_subString();break;default:n=0;break;}}while(n);return 0;}运⾏程序输⼊：1studentstudents2Computer Data Stuctures104运⾏结果：2、实现串的模式匹配算法。

模式匹配KMP算法实验报告

实验四：KMP算法实验报告一、问题描述模式匹配两个串。

二、设计思想这种由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现的改进的模式匹配算法简称为KM P算法。

注意到这是一个改进的算法，所以有必要把原来的模式匹配算法拿出来，其实理解的关键就在这里，一般的匹配算法：int Index(String S,String T,int pos)//参考《数据结构》中的程序{i=pos;j=1;//这里的串的第1个元素下标是1while(i<=S.Length && j<=T.Length){if(S[i]==T[j]){++i;++j;}else{i=i-j+2;j=1;}//**************(1)}if(j>T.Length) return i-T.Length;//匹配成功else return 0;}匹配的过程非常清晰，关键是当‘失配’的时候程序是如何处理的？为什么要回溯，看下面的例子：S:aaaaabababcaaa T:ababcaaaaabababcaaaababc.(.表示前一个已经失配)回溯的结果就是aaaaabababcaaaa.(babc)如果不回溯就是aaaaabababcaaaaba.bc这样就漏了一个可能匹配成功的情况aaaaabababcaaaababc这是由T串本身的性质决定的，是因为T串本身有前后'部分匹配'的性质。

如果T为a bcdef这样的，大没有回溯的必要。

改进的地方也就是这里，我们从T串本身出发，事先就找准了T自身前后部分匹配的位置，那就可以改进算法。

如果不用回溯，那T串下一个位置从哪里开始呢？还是上面那个例子，T为ababc，如果c失配，那就可以往前移到aba最后一个a的位置，像这样：...ababd...ababc->ababc这样i不用回溯，j跳到前2个位置，继续匹配的过程，这就是KMP算法所在。

串的模式匹配算法实验报告

竭诚为您提供优质文档/双击可除串的模式匹配算法实验报告篇一：串的模式匹配算法串的匹配算法——bruteForce(bF)算法匹配模式的定义设有主串s和子串T，子串T的定位就是要在主串s中找到一个与子串T相等的子串。

通常把主串s称为目标串，把子串T称为模式串，因此定位也称作模式匹配。

模式匹配成功是指在目标串s中找到一个模式串T；不成功则指目标串s中不存在模式串T。

bF算法brute-Force算法简称为bF算法，其基本思路是：从目标串s的第一个字符开始和模式串T中的第一个字符比较，若相等，则继续逐个比较后续的字符；否则从目标串s的第二个字符开始重新与模式串T的第一个字符进行比较。

以此类推，若从模式串T的第i个字符开始，每个字符依次和目标串s中的对应字符相等，则匹配成功，该算法返回i；否则，匹配失败，算法返回0。

实现代码如下：/*返回子串T在主串s中第pos个字符之后的位置。

若不存在，则函数返回值为0./*T非空。

intindex(strings,stringT,intpos){inti=pos;//用于主串s中当前位置下标，若pos不为1则从pos位置开始匹配intj=1;//j用于子串T中当前位置下标值while(i j=1；}if(j>T[0])returni-T[0];elsereturn0;}}bF算法的时间复杂度若n为主串长度，m为子串长度则最好的情况是：一配就中，只比较了m次。

最坏的情况是：主串前面n-m个位置都部分匹配到子串的最后一位，即这n-m位比较了m次，最后m位也各比较了一次，还要加上m,所以总次数为：(n-m)*m+m=(n-m+1)*m从最好到最坏情况统计总的比较次数，然后取平均，得到一般情况是o(n+m).篇二：数据结构实验报告-串实验四串【实验目的】1、掌握串的存储表示及基本操作；2、掌握串的两种模式匹配算法：bF和Kmp。

3、了解串的应用。

【实验学时】2学时【实验预习】回答以下问题：1、串和子串的定义串的定义：串是由零个或多个任意字符组成的有限序列。

kmp算法实验报告

kmp算法实验报告篇一：模式匹配KMP算法实验报告实验四：KMP算法实验报告一、问题描述模式匹配两个串。

二、设计思想这种由,注意到这是一个改进的算法，所以有必要把原来的模式匹配算法拿出来，其实理解的关键就在这里，一般的匹配算法：int Index(String S,String T,int pos)//参考《数据结构》中的程序 {i=pos;j=1;//这里的串的第1个元素下标是1while(i {if(S[i]==T[j]){++i;++j;}else{i=i-j+2;j=1;}//**************(1)}if(j>T.Length) return i-T.Length;//匹配成功else return 0;}匹配的过程非常清晰，关键是当‘失配’的时候程序是如何处理的？为什么要回溯，看下面的例子：S:aaaaabababcaaa T:ababcaaaaabababcaaaababc.(.表示前一个已经失配)回溯的结果就是aaaaabababcaaaa.(babc)如果不回溯就是aaaaabababcaaaaba.bc这样就漏了一个可能匹配成功的情况aaaaabababcaaaababc这是由T串本身的性质决定的，是因为T串本身有前后'部分匹配'的性质。

如果T为abcdef这样的，大没有回溯的必要。

改进的地方也就是这里，我们从T串本身出发，事先就找准了T自身前后部分匹配的位置，那就可以改进算法。

这个当T[j]失配后，j应该往前跳的值就是j的next值，它是由T串本身固有决定的，与S串无关。

《数据结构》上给了next值的定义：0如果j=1next[j]={Max{k|1 1其它情况其实它就是描述前面表述的情况，关于next[1]=0是规定的，这样规定可以使程序简单一些，如果非要定为其它的值只要不和后面的值冲突也是可以的；而那个Max是什么意思，举个例子：T:aaab...aaaab...aaab->aaab->aaab->aaab像这样的T，前面自身部分匹配的部分不止两个，那应该往前跳到第几个呢？最近的一个，也就是说尽可能的向右滑移最短的长度。

实验六串的模式匹配

⑵用KMP算法进行匹配。 (3)程序运行的结果要在屏幕上显示：

简单的朴素模式匹配算法中，模式串的位置、出现的次数。模式串的next函数值。说明：下课前请将源代码的.c（或.cpp） KMP算法的匹配位置。文件以及.h文件打包后重命名为
“p6_姓名简拼_学号后三位”，然后提交到教师机！
【实验内容】编写程序，实现顺序串的模式匹配算法。【基本要求】在主程序中调用算法，输入一个主串和模式串，在主串中检索模式串，显示模式串在主串中出现的次数和位置。 ⑴用简单的朴素模式匹配算法计模式串出现的次数；从主串的任意给定位置检索模式串。

【实现提示】
要统计模式串在主串中出现的次数，可以先确定从
主串中第一个字符起，模式串的位置，然后再利用指定位置的匹配算法找出其他匹配的位置；利用一个数组来存放所有模式串出现的位置，然后将这些位置依次打印输出。串值在数组中存储时，是从数组的0号单元开始存放的。注意修改教材中Next函数和KMP算法函数中的变量！至少包含以下头文件： #include <stdio.h> #include <string.h> #include <conio.h>

串匹配算法实验报告

一、实验目的1. 理解串匹配算法的基本原理和实现方法。

2. 掌握KMP算法和朴素算法的原理和实现过程。

3. 通过实验对比分析两种算法的性能，验证算法的效率和适用场景。

二、实验环境1. 操作系统：Windows 102. 编程语言：Python3.73. 开发工具：PyCharm三、实验内容1. 串匹配算法的原理介绍2. 朴素算法的实现与测试3. KMP算法的实现与测试4. 两种算法的性能对比四、实验步骤1. 串匹配算法的原理介绍串匹配算法是指在一个文本串中查找一个模式串的位置。

常用的串匹配算法有朴素算法和KMP算法。

（1）朴素算法（Brute-Force算法）：通过逐个字符比较主串和待匹配串，如果匹配成功，则返回匹配位置；如果匹配失败，则回溯到主串上的一个新位置，并在待匹配串上从头开始比较。

（2）KMP算法：通过构建一个部分匹配表（next数组），记录模式串中每个位置对应的最长相同前缀后缀的长度。

在匹配过程中，当出现不匹配时，通过查阅next数组确定子串指针回退位置，从而避免重复比较。

2. 朴素算法的实现与测试（1）实现朴素算法```pythondef brute_force_search(text, pattern):n = len(text)m = len(pattern)for i in range(n - m + 1):j = 0while j < m:if text[i + j] != pattern[j]:breakj += 1if j == m:return ireturn -1```（2）测试朴素算法```pythontext = "ABABDABACDABABCABAB"pattern = "ABABCABAB"print(brute_force_search(text, pattern)) # 输出：10 ```3. KMP算法的实现与测试（1）实现KMP算法```pythondef kmp_search(text, pattern):def build_next(pattern):next_array = [0] len(pattern)k = 0for i in range(1, len(pattern)):while k > 0 and pattern[k] != pattern[i]: k = next_array[k - 1]if pattern[k] == pattern[i]:k += 1next_array[i] = kreturn next_arrayn = len(text)m = len(pattern)next_array = build_next(pattern)k = 0for i in range(n):while k > 0 and text[i] != pattern[k]:k = next_array[k - 1]if text[i] == pattern[k]:k += 1if k == m:return i - m + 1return -1```（2）测试KMP算法```pythontext = "ABABDABACDABABCABAB"pattern = "ABABCABAB"print(kmp_search(text, pattern)) # 输出：10```4. 两种算法的性能对比为了对比两种算法的性能，我们分别测试了不同的文本串和模式串长度，并记录了运行时间。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

竭诚为您提供优质文档/双击可除串的模式匹配算法实验报告
篇一：串的模式匹配算法
串的匹配算法——bruteForce(bF)算法
匹配模式的定义
设有主串s和子串T，子串T的定位就是要在主串s中找到一个与子串T相等的子串。

通常把主串s称为目标串，把子串T称为模式串，因此定位也称作模式匹配。

模式匹配成功是指在目标串s中找到一个模式串T；不成功则指目标串s中不存在模式串T。

bF算法
brute-Force算法简称为bF算法，其基本思路是：从目标串s的第一个字符开始和模式串T中的第一个字符比较，若相等，则继续逐个比较后续的字符；否则从目标串s的第二个字符开始重新与模式串T的第一个字符进行比较。

以此类推，若从模式串T的第i个字符开始，每个字符依次和目标串s中的对应字符相等，则匹配成功，该算法返回i；否
则，匹配失败，算法返回0。

实现代码如下：
/*返回子串T在主串s中第pos个字符之后的位置。

若不存在，则函数返回值为0./*T非空。

intindex(strings,stringT,intpos)
{
inti=pos;//用于主串s中当前位置下标，若pos不为1则从pos位置开始匹配intj=1;//j用于子串T中当前位置下标值while(i j=1；
}
if(j>T[0])
returni-T[0];
else
return0;
}
}
bF算法的时间复杂度
若n为主串长度，m为子串长度则
最好的情况是：一配就中，只比较了m次。

最坏的情况是：主串前面n-m个位置都部分匹配到子串的最后一位，即这n-m位比较了m次，最后m位也各比较了一次，还要加上m,所以总次数为：(n-m)*m+m=(n-m+1)*m从
最好到最坏情况统计总的比较次数，然后取平均，得到一般情况是o(n+m).
篇二：数据结构实验报告-串
实验四串
【实验目的】
1、掌握串的存储表示及基本操作；
2、掌握串的两种模式匹配算法：bF和Kmp。

3、了解串的应用。

【实验学时】
2学时
【实验预习】
回答以下问题：
1、串和子串的定义
串的定义：串是由零个或多个任意字符组成的有限序列。

子串的定义：串中任意连续字符组成的子序列称为该串的子串。

2、串的模式匹配
串的模式匹配即子串定位是一种重要的串运算。

设s和t是给定的两个串，从主串s的第start个字符开始查找等
于子串t的过程称为模式匹配，如果在s中找到等于t的子串，则称匹配成功，函数返回t在s中首次出现的存储位置（或序号）；否则，匹配失败，返回0。

【实验内容和要(:串的模式匹配算法实验报告)求】
1、按照要求完成程序exp4_1.c，实现串的相关操作。

调试并运行如下测试数据给出运行结果：
?求“Thisisaboy”的串长；
?比较”abc??3”和“abcde“；?表示空格
?比较”english”和“student“；
?比较”abc”和“abc“；
?截取串”white”，起始2，长度2；
?截取串”white”，起始1，长度7；
?截取串”white”，起始6，长度2；
?连接串”asddffgh”和”12344”；
#include
#include
#definemAxsIZe100
#defineeRRoR0
#defineoK1
/*串的定长顺序存储表示*/
typedefstruct
{
chardata[mAxsIZe];
intlength;
}sqstring;
intstrInit(sqstring*s);/*初始化串*/
intstrcreate(sqstring*s);/*生成一个串
*/intstrLength(sqstring*s);/*求串的长度
*/intstrcompare(sqstring*s1,sqstring*s2);/*两个串的比较
*/intsubstring(sqstring*sub,sqstring*s,intpos,intle n);/*求子串*/
intstrconcat(sqstring*t,sqstring*s1,sqstring*s2);/*两个串的连接*/
/*初始化串*/
intstrInit(sqstring*s)
{
s->length=0;
s->data[0]=\0;
returnoK;
}/*strInit*/
/*生成一个串*/
intstrcreate(sqstring*s)
{
printf("inputstring:");
gets(s->data);
s->length=strlen(s->data);
returnoK;
}/*strcreate*/
/*（1）---求串的长度*/
intstrLength(sqstring*s)
{
returns->length;
}/*strLength*/
/*（2）---两个串的比较，s1>s2返回>0，s1 intstrcompare(sqstring*s1,sqstring*s2) {
inti;
for(i=0;ilengthi++)
{
if(s1->data[i]>s2->data[i])
{
return1;
}
if(s1->data[i]data[i])
{
return-1;
}
}
return0;
}/*strcompare*/
/*（3）---求子串，sub为返回的子串，pos为子串的起始位置，len为子串的长度
*/intsubstring(sqstring*sub,sqstring*s,intpos,intle n)
{
inti;
if(poss->length||lens->length-pos+1)
{
returneRRoR;
}
sub->length=0;
for(i=0;i {
sub->data[i]=s->data[i+pos-1];
sub->length++;
}
sub->data[i]=\0;
returnoK;
}/*substring*/
/*（4）---两个串连接，s2连接在s1后，连接后的结
果串放在t中*/
intstrconcat(sqstring*t,sqstring*s1,sqstring*s2) {
inti=0,j=0;
while(ilength)
{
t->data[i]=s1->data[i];
i++;
}
while(jlength)
{
t->data[i++]=s2->data[j++];
}
t->data[i]=\0;
t->length=s1->length+s2->length;
returnoK;
}/*strconcat*/
intmain()
{
intn,k,pos,len;
sqstrings,t,x;
do
{
printf("\n---string---\n");
printf("1.strLentgh\n");
printf("2.strcompare\n");
printf("3.substring\n");
printf("4.strconcat\n");
printf("0.exIT\n");
printf("\n---string---\n");
printf("\ninputchoice:");
scanf("%d",
getchar();
switch(n)
{
case1:
printf("\n***showstrLength***\n"); strcreate(
printf("strLengthis%d\n",strLength( break;
case2:
printf("\n***showstrcompare***\n"); strcreate(
strcreate(。

串的模式匹配算法实验报告

【精品】数据结构串实验报告

串的模式匹配问题实验总结（用C实现）

实验三串的模式匹配

模式匹配KMP算法实验报告

串的模式匹配算法实验报告

kmp算法实验报告

实验六 串的模式匹配

串匹配算法实验报告

实验六串的模式匹配