实验三____串的模式匹配

合集下载

串的模式匹配算法

串的模式匹配算法

串串(String)又叫做字符串,是一种特殊的线性表的结构,表中每一个元素仅由一个字符组成。

随着计算机的发展,串在文字编辑、词法扫描、符号处理以及定理证明等诸多领域已经得到了越来越广泛的应用。

第一节串的定义和表示1、串的逻辑结构定义串是由零个到任意多个字符组成的一个字符序列。

一般记为:S=’ a1a2a3……a n’(n>=0)其中S为串名,序列a1a2a3……a n为串值,n称为串的长度,我们将n=0的串称为空串(null string)。

串中任意一段连续的字符组成的子序列我们称之为该串的子串,字符在序列中的序号称为该字符在串中的位置。

在描述中,为了区分空串和空格串(s=‘’),我们一般采用来表示空串。

2、串的基本操作串一般包含以下几种基本的常用操作:1、length(S),求S串的长度。

2、delete(S,I,L),将S串从第I位开始删除L位。

3、insert(S,I,T),在S的第I位之前插入串T。

4、str(N,S),将数字N转化为串S。

5、val(S,N,K),将串S转化为数字N;K的作用是当S中含有不为数字的字符时,K记录下其位置,并且S没有被转化为N。

3、串的储存结构一般我们采用以下两种方式保存一个串:1、字符串类型,描述为:const n=串的最大长度type strtype=string[n]这里由于tp的限制,n只能为[1..255]。

在fp或者delphi中,我们还可以使用另外一种类型,描述为:const n=串的最大长度type strtype=qstring[n]这里的n就没有限制了,只要空间允许,开多大都可以。

2、数组来保存,描述为:const n=串的最大长度type strtype=records:array[1..n] of char;len:0..n;end;第二节模式匹配问题与一般的线性表不同,我们一般将串看成一个整体,它有一种特殊的操作——模式匹配。

串的模式匹配算法实验报告

串的模式匹配算法实验报告

竭诚为您提供优质文档/双击可除串的模式匹配算法实验报告篇一:串的模式匹配算法串的匹配算法——bruteForce(bF)算法匹配模式的定义设有主串s和子串T,子串T的定位就是要在主串s中找到一个与子串T相等的子串。

通常把主串s称为目标串,把子串T称为模式串,因此定位也称作模式匹配。

模式匹配成功是指在目标串s中找到一个模式串T;不成功则指目标串s中不存在模式串T。

bF算法brute-Force算法简称为bF算法,其基本思路是:从目标串s的第一个字符开始和模式串T中的第一个字符比较,若相等,则继续逐个比较后续的字符;否则从目标串s的第二个字符开始重新与模式串T的第一个字符进行比较。

以此类推,若从模式串T的第i个字符开始,每个字符依次和目标串s中的对应字符相等,则匹配成功,该算法返回i;否则,匹配失败,算法返回0。

实现代码如下:/*返回子串T在主串s中第pos个字符之后的位置。

若不存在,则函数返回值为0./*T非空。

intindex(strings,stringT,intpos){inti=pos;//用于主串s中当前位置下标,若pos不为1则从pos位置开始匹配intj=1;//j用于子串T中当前位置下标值while(i j=1;}if(j>T[0])returni-T[0];elsereturn0;}}bF算法的时间复杂度若n为主串长度,m为子串长度则最好的情况是:一配就中,只比较了m次。

最坏的情况是:主串前面n-m个位置都部分匹配到子串的最后一位,即这n-m位比较了m次,最后m位也各比较了一次,还要加上m,所以总次数为:(n-m)*m+m=(n-m+1)*m从最好到最坏情况统计总的比较次数,然后取平均,得到一般情况是o(n+m).篇二:数据结构实验报告-串实验四串【实验目的】1、掌握串的存储表示及基本操作;2、掌握串的两种模式匹配算法:bF和Kmp。

3、了解串的应用。

【实验学时】2学时【实验预习】回答以下问题:1、串和子串的定义串的定义:串是由零个或多个任意字符组成的有限序列。

串的模式匹配

串的模式匹配

实验四顺序串的各种模式匹配一、实验目的熟悉串的有关概念,掌握串的存储结构及串的模式匹配算法。

二、实验内容由用户随意输入两个串:主串S和模式串T,设S=‘s1s2…sn’,T=‘t1t2…tm’,且0<m<=n。

1(必做)、用简单模式匹配算法判断模式串T是否在主串S中,若在,则输出模式串在主串的第一匹配位置,否则,匹配失败,返回零值。

2(选做)、用KMP模式匹配算法判断模式串T是否在主串S中,若在,则输出模式串在主串的第一匹配位置,否则,匹配失败,返回零值。

三、算法思想与算法描述单链表是线性表的链式存储结构的一种形式,它用一组地址任意的存储单元存放线性表的各个元素。

四、实验步骤与算法实现#include<iostream>#include<malloc.h>using namespace std;typedef struct taglin{int data;taglin* next;}lin;void initlin(lin* &L,int e){lin* p=L,* s;while(p->next!=NULL)p=p->next;s=(lin*)malloc(sizeof(lin));s->data=e;s->next=p->next;p->next=s;}void main(){int num,e,x,y,count=-1,c=0,e1,t=-2147483648;bool mark=false;lin* L,* tx,* p,* q;L=(lin*)malloc(sizeof(lin));L->next=NULL;cout<<"输入个数>=2"<<endl;cin>>num;if(num<2){cout<<"输入比2小的值_错误"<<endl;getchar();getchar();}cout<<"输入"<<num<<"个非递减整形数字"<<endl;for(int i=0;i<num;i++){cin>>e;initlin(L,e);if(c==0){e1=e;c++;}if(e<t){cout<<"输入的值比前一个值小_错误"<<endl;getchar();getchar();}t=e;}cout<<"输入x y"<<endl;cin>>x>>y;if(y>=e)mark=true;if(e1>x)x=e1;tx=L->next;for(;tx->data<=x;tx=tx->next);p=L->next;for(;p!=NULL&&p->next!=tx;p=p->next);q=p;if(!mark){for(;p!=NULL&&p->data<=y;p=p->next)count++;p=q;q=q->next;for(;count>0;count--){p->next=q->next;q=q->next;}for(p=L,q=p->next;p->next!=NULL;p=p->next){if(p->next->data==x)p->next=q->next;q=q->next;}}else{if(e1<x){p=L;for(;p->next!=tx&&p->next!=NULL;p=p->next);p->next=NULL;}elseL->next=NULL;}cout<<"_____________"<<endl;for(p=L->next;p!=NULL;p=p->next)cout<<p->data<<" "<<endl;getchar();getchar();}五、实验测试及结果六、总结与体会理解了模式匹配基本方法,但kmp比较复杂,任然需要时间去学习。

北邮数据结构实验报告

北邮数据结构实验报告

北邮数据结构实验报告摘要:本报告基于北邮数据结构实验,通过实际操作和实验结果的分析,总结和讨论了各实验的目的、实验过程、实验结果以及相关的问题和解决方法。

本报告旨在帮助读者了解数据结构实验的基本原理和应用,并为今后的学习和研究提供参考。

1. 实验一:线性表的操作1.1 实验目的本实验旨在掌握线性表的基本操作以及对应的算法实现,包括插入、删除、查找、修改等。

1.2 实验过程我们使用C++语言编写了线性表的相关算法,并在实际编程环境下进行了测试。

通过插入元素、删除元素、查找元素和修改元素的操作,验证了算法的正确性和效率。

1.3 实验结果经过测试,我们发现线性表的插入和删除操作的时间复杂度为O(n),查找操作的时间复杂度为O(n),修改操作的时间复杂度为O(1)。

这些结果与预期相符,并反映了线性表的基本特性。

1.4 问题与解决方法在实验过程中,我们遇到了一些问题,例如插入操作的边界条件判断、删除操作时的内存释放等。

通过仔细分析问题,我们优化了算法的实现,并解决了这些问题。

2. 实验二:栈和队列的应用2.1 实验目的本实验旨在掌握栈和队列的基本原理、操作和应用,并进行实际编程实现。

2.2 实验过程我们使用C++语言编写了栈和队列的相关算法,并在实际编程环境下进行了测试。

通过栈的应用实现表达式求值和逆波兰表达式的计算,以及队列的应用实现图的广度优先遍历,验证了算法的正确性和效率。

2.3 实验结果经过测试,我们发现栈的应用可以实现表达式的求值和逆波兰表达式的计算,队列的应用可以实现图的广度优先遍历。

这些结果证明了栈和队列在实际应用中的重要性和有效性。

2.4 问题与解决方法在实验过程中,我们遇到了一些问题,例如中缀表达式转后缀表达式的算法设计、表达式求值的优化等。

通过查阅资料和与同学的讨论,我们解决了这些问题,并完善了算法的实现。

3. 实验三:串的模式匹配3.1 实验目的本实验旨在掌握串的基本操作和模式匹配算法,并进行实际编程实现。

数据结构实验总结及心得体会

数据结构实验总结及心得体会

数据结构实验总结及心得体会引言数据结构作为计算机科学的基础课程,是理解和应用计算机编程的重要部分。

通过实验的形式,我们可以更加深入地理解不同数据结构的特点和应用场景。

本文将总结我在数据结构实验中的学习经验和心得体会。

实验一:线性表在线性表实验中,我学习了顺序表和链表两种基本的线性表结构。

顺序表使用数组来存储数据,具有随机访问的特点;链表使用指针来连接数据元素,具有插入和删除操作方便的特点。

通过这个实验,我深刻认识了线性表的存储结构和操作方法。

我遇到的难点是链表的插入和删除操作,因为涉及到指针的重新指向。

通过调试和分析代码,我逐渐理解了指针指向的含义和变化规律。

在实验结束后,我还进一步学习了循环链表和双向链表的特点和应用。

实验二:栈和队列栈和队列是两种常用的数据结构,可以用来解决很多实际问题。

在这个实验中,我学习了顺序栈、链式栈、顺序队列和链式队列四种基本实现方式。

实验中我遇到的最大困难是队列的循环队列实现,因为需要处理队列尾指针的位置变化。

我通过画图和调试发现了队列尾指针的变化规律,并在实验中成功实现了循环队列。

熟练掌握了栈和队列的操作方法后,我进一步学习了栈的应用场景,如表达式求值和括号匹配等。

队列的应用场景还有优先级队列和循环队列等。

实验三:串串是由零个或多个字符组成的有限序列,是实际应用中十分常见的数据类型。

在这个实验中,我学习了串的存储结构和常规操作。

实验中最具挑战性的部分是串的模式匹配。

模式匹配是在一个主串中查找一个子串的过程,可以使用暴力匹配、KMP 算法和BM算法等不同的匹配算法。

在实验中,我实现了KMP算法,并在实际应用中进行了测试。

从实验中我学到了使用前缀表和后缀表来提高模式匹配的效率。

同时,在应用中也了解到了串的搜索和替换等常见操作。

实验四:树和二叉树树是一种重要的非线性数据结构,应用广泛。

在这个实验中,我学习了树的基本概念、存储结构和遍历方式。

实验中最困难的部分是二叉树的遍历。

串匹配算法实验报告

串匹配算法实验报告

一、实验目的1. 理解串匹配算法的基本原理和实现方法。

2. 掌握KMP算法和朴素算法的原理和实现过程。

3. 通过实验对比分析两种算法的性能,验证算法的效率和适用场景。

二、实验环境1. 操作系统:Windows 102. 编程语言:Python3.73. 开发工具:PyCharm三、实验内容1. 串匹配算法的原理介绍2. 朴素算法的实现与测试3. KMP算法的实现与测试4. 两种算法的性能对比四、实验步骤1. 串匹配算法的原理介绍串匹配算法是指在一个文本串中查找一个模式串的位置。

常用的串匹配算法有朴素算法和KMP算法。

(1)朴素算法(Brute-Force算法):通过逐个字符比较主串和待匹配串,如果匹配成功,则返回匹配位置;如果匹配失败,则回溯到主串上的一个新位置,并在待匹配串上从头开始比较。

(2)KMP算法:通过构建一个部分匹配表(next数组),记录模式串中每个位置对应的最长相同前缀后缀的长度。

在匹配过程中,当出现不匹配时,通过查阅next数组确定子串指针回退位置,从而避免重复比较。

2. 朴素算法的实现与测试(1)实现朴素算法```pythondef brute_force_search(text, pattern):n = len(text)m = len(pattern)for i in range(n - m + 1):j = 0while j < m:if text[i + j] != pattern[j]:breakj += 1if j == m:return ireturn -1```(2)测试朴素算法```pythontext = "ABABDABACDABABCABAB"pattern = "ABABCABAB"print(brute_force_search(text, pattern)) # 输出:10 ```3. KMP算法的实现与测试(1)实现KMP算法```pythondef kmp_search(text, pattern):def build_next(pattern):next_array = [0] len(pattern)k = 0for i in range(1, len(pattern)):while k > 0 and pattern[k] != pattern[i]: k = next_array[k - 1]if pattern[k] == pattern[i]:k += 1next_array[i] = kreturn next_arrayn = len(text)m = len(pattern)next_array = build_next(pattern)k = 0for i in range(n):while k > 0 and text[i] != pattern[k]:k = next_array[k - 1]if text[i] == pattern[k]:k += 1if k == m:return i - m + 1return -1```(2)测试KMP算法```pythontext = "ABABDABACDABABCABAB"pattern = "ABABCABAB"print(kmp_search(text, pattern)) # 输出:10```4. 两种算法的性能对比为了对比两种算法的性能,我们分别测试了不同的文本串和模式串长度,并记录了运行时间。

数据结构—串的模式匹配

数据结构—串的模式匹配

数据结构—串的模式匹配数据结构—串的模式匹配1.介绍串的模式匹配是计算机科学中的一个重要问题,用于在一个较长的字符串(称为主串)中查找一个较短的字符串(称为模式串)出现的位置。

本文档将详细介绍串的模式匹配算法及其实现。

2.算法一:暴力匹配法暴力匹配法是最简单直观的一种模式匹配算法,它通过逐个比较主串和模式串的字符进行匹配。

具体步骤如下:1.从主串的第一个字符开始,逐个比较主串和模式串的字符。

2.如果当前字符匹配成功,则比较下一个字符,直到模式串结束或出现不匹配的字符。

3.如果匹配成功,返回当前字符在主串中的位置,否则继续从主串的下一个位置开始匹配。

3.算法二:KMP匹配算法KMP匹配算法是一种改进的模式匹配算法,它通过构建一个部分匹配表来减少不必要的比较次数。

具体步骤如下:1.构建模式串的部分匹配表,即找出模式串中每个字符对应的最长公共前后缀长度。

2.从主串的第一个字符开始,逐个比较主串和模式串的字符。

3.如果当前字符匹配成功,则继续比较下一个字符。

4.如果当前字符不匹配,则根据部分匹配表的值调整模式串的位置,直到模式串移动到合适的位置。

4.算法三:Boyer-Moore匹配算法Boyer-Moore匹配算法是一种高效的模式匹配算法,它通过利用模式串中的字符出现位置和不匹配字符进行跳跃式的匹配。

具体步骤如下:1.构建一个坏字符规则表,记录模式串中每个字符出现的最后一个位置。

2.从主串的第一个字符开始,逐个比较主串和模式串的字符。

3.如果当前字符匹配成功,则继续比较下一个字符。

4.如果当前字符不匹配,则根据坏字符规则表的值调整模式串的位置,使模式串向后滑动。

5.算法四:Rabin-Karp匹配算法Rabin-Karp匹配算法是一种基于哈希算法的模式匹配算法,它通过计算主串和模式串的哈希值进行匹配。

具体步骤如下:1.计算模式串的哈希值。

2.从主串的第一个字符开始,逐个计算主串中与模式串长度相同的子串的哈希值。

第3章 蛮力法——串的模式匹配

第3章 蛮力法——串的模式匹配

模式匹配——BF算法
例:主串S="ababcabcacbab",模式T="abcac"
i
第 5 趟
a b a b c a b c a c b a b a b c a c
j
i=5,j=1失败 i回溯到6,j回溯到1
模式匹配——BF算法
例:主串S="ababcabcacbab",模式T="abcac"
i i i i i
第 3 趟
a b a b c a b c a c b a b a b c a c
j j j j j
i=7,j=5失败 i回溯到4,j回溯到1
模式匹配——BF算法
例:主串S="ababcabcacbab",模式T="abcac"
i
第 3 趟
a b a b c a b c a c b a b a b c a c
k
算法3.4——KMP算法中求next数组
void GetNext(char T[ ], int next[ ]) { 位置j 1 2 3 4 5 next[1]=0; j=1; k=0; 模式串 a b c a c while (j<T[0]) if ((k= =0)| |(T[j]= =T[k])) j next[j] { j++; 1 0 k++; 2 1 next[j]=k; 3 1 } 4 1 else k=next[k]; } 5 2
next数组的求解方法是: 1、第一位的next值为0,第二位的next值为1,
2、第三位开始首先将当前位的前一位字符与其next值 对应的字符进行比较, 相等:则该位的next值就是前一位的next值加上1;
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验三串的模式匹配
一、实验目的
1.利用顺序结构存储串,并实现串的匹配算法。

2.掌握简单模式匹配思想,熟悉KMP算法。

二、实验要求
1.认真理解简单模式匹配思想,高效实现简单模式匹配;
2.结合参考程序调试KMP算法,努力算法思想;
3.保存程序的运行结果,并结合程序进行分析。

三、实验内容
1、通过键盘初始化目标串和模式串,通过简单模式匹配算法实现串的模式匹配,匹配成功后要求输出模式串在目标串中的位置;
2、参考程序给出了两种不同形式的next数组的计算方法,请完善程序从键盘初始化一目标串并设计匹配算法完整调试KMP算法,并与简单模式匹配算法进行比较。

参考程序:
#include "stdio.h"
void GetNext1(char *t,int next[])/*求模式t的next值并寸入next数组中*/
{
int i=1,j=0;
next[1]=0;
while(i<=9)//t[0]
{
if(j==0||t[i]==t[j])
{++i; ++j; next[i]=j; }
else
j=next[j];
}
}
void GetNext2(char *t , int next[])/* 求模式t 的next值并放入数组next中 */
{
int i=1, j = 0;
next[1]= 0; /* 初始化 */
while (i<=9) /* 计算next[i+1] t[0]*/
{
while (j>=1 && t[i] != t[j] )
j = next[j];
i++; j++;
if(t[i]==t[j]) next[i] = next[j];
else next[i] = j;
}
}
void main()
{
char *p="abcaababc";
int i,str[10];
GetNext1(p,str);
printf("\n");
for(i=1;i<10;i++)
printf("%d",str[i]);
GetNext2(p,str);
printf("\n");
for(i=1;i<10;i++)
printf("%d",str[i]);
printf("\n\n");
}。

相关文档
最新文档