数据结构字符串复制,连接,求子串,KMP

合集下载

数据结构第三章字符串

串
子串：串中任意个连续的字符组成的子序列。主串：包含子串的串。子串的位置：子串的第一个字符在主串中的序号。
S1="ab12cd " S2="ab12" S3="ab13" S4="ab12φ" S5=" " S6="φφφ "
串
串的比较：通过组成串的字符之间的比较来进行的。
给定两个串：X="x1x2…xn"和Y="y1y2…ym"，则： 1. 当n=m且x1=y1，…，xn=ym时，称X=Y； 2. 当下列条件之一成立时，称X＜Y： ⑴ n＜m且xi=yi（1≤ i≤n）； ⑵存在k≤min(m,n)，使得xi=yi(1≤i≤k-1)且xk＜yk。例：S1="ab12cd "，S2="ab12"，S3="ab13"
串
例：主串S="ababcabcacbab"，模式T="abcac"
i
第 4 趟
a b a b c a b c a c b a b a b c a c
j
i=4，j=1失败 i回溯到5，j回溯到1
Hale Waihona Puke 串例：主串S="ababcabcacbab"，模式T="abcac"
i
第 5 趟
a b a b c a b c a c b a b a b c a c
为什么BF算法时间性能低？
在每趟匹配不成功时存在大量回溯，没有利用已经部分匹配的结果。
如何在匹配不成功时主串不回溯？
主串不回溯，模式就需要向右滑动一段距离。

数据结构-第4章串

真子串是指不包含自身的所有子串。
4.1 串的类型定义
子串的序号：将子串在主串中首次出现时的该子串的首字符对应在主串中的序号，称为子串在主串中的序号（或位置）。【例】 A=“abcdefbbcd”，B=“bcd”，B在A中的序号为2。特别地，空串是任意串的子串，任意串是其自身的子串。
4.1.2 串的抽象数据类型定义
//查找ab子串
if (p->data==‘ a’ && p->next->data==‘b’)
{ p->data=‘x’; p->next->data=‘z’;
q=(LinkStrNode *)malloc(sizeof(LinkStrNode));
q->data=‘y’;
q->next=p->next; p->next=q;
s: a a a a b c d
t: a ab bac acb bc c ✓ 匹配成功算法的思路是从s的每一个字符开始依次与t的字符进行匹配。
4.2.1 Brute-Force算法
int BFIndex(SqString s,SqString t)
{ int i=0, j=0,k;
while (i<s.length && j<t.length)
4.1 串的类型定义 4.2 串的表示和实现 4.3 串的模式匹配算法
本章要求
理解： 1、串的基本概念、类型定义 2、串的存储表示和实现 3、串的KMP算法
掌握： 4、串的简单模式匹配算法(BF)
第4章串的基本概念
串（或字符串）：是由零个或多个字符组成的有限序列。
串的逻辑表示： S=“a1a2…ai…an”，其中S为串名，ai (1≤i≤n)代表单个字符，可以是字母、数字或其它字符(包括空白符)。串值：双引号括起来的字符序列。双引号不是串的内容，只起标识作用。

kmp算法概念

kmp算法概念KMP算法概念KMP算法是一种字符串匹配算法，它的全称是Knuth-Morris-Pratt 算法。

该算法通过预处理模式串，使得在匹配过程中避免重复比较已经比较过的字符，从而提高了匹配效率。

一、基本思想KMP算法的基本思想是：当模式串与文本串不匹配时，不需要回溯到文本串中已经比较过的位置重新开始匹配，而是利用已知信息跳过这些位置继续匹配。

这个已知信息就是模式串自身的特点。

二、next数组1.定义next数组是KMP算法中最核心的概念之一。

它表示在模式串中当前字符之前的子串中，有多大长度的相同前缀后缀。

2.求解方法通过观察模式串可以发现，在每个位置上出现了相同前缀和后缀。

例如，在模式串“ABCDABD”中，第一个字符“A”没有任何前缀和后缀；第二个字符“B”的前缀为空，后缀为“A”；第三个字符“C”的前缀为“AB”，后缀为“B”；第四个字符“D”的前缀为“ABC”，后缀为“AB”；第五个字符“A”的前缀为“ABCD”，后缀为“ABC”；第六个字符“B”的前缀为“ABCDA”，后缀为“ABCD”；第七个字符“D”的前缀为“ABCDAB”，后缀为“ABCDA”。

根据上述观察结果，可以得到一个求解next数组的方法：（1）next[0]=-1，next[1]=0。

（2）对于i=2,3,...,m-1，求解next[i]。

①如果p[j]=p[next[j]]，则next[i]=next[j]+1。

②如果p[j]≠p[next[j]]，则令j=next[j]，继续比较p[i]和p[j]。

③重复执行步骤①和步骤②，直到找到满足条件的j或者j=-1。

（3）通过上述方法求解出所有的next值。

三、匹配过程在匹配过程中，文本串从左往右依次与模式串进行比较。

如果当前字符匹配成功，那么继续比较下一个字符；否则利用已知信息跳过一些位置继续进行匹配。

具体地：（1）如果当前字符匹配成功，则i和j都加1。

（2）如果当前字符匹配失败，则令j=next[j]。

数据结构字符串对称的判断算法

一、介绍在计算机科学中，数据结构是指在计算机中组织和存储数据的一种特殊方式。

而字符串对称的判断算法则是在数据结构中的一个重要应用，它用来判断一个字符串是否是对称的，即该字符串从左到右和从右到左读是一样的。

这是一个很常见的算法问题，在很多面试和编程挑战中经常会遇到。

本文将介绍一些常见的字符串对称判断算法，以帮助读者更好地理解和掌握这一算法。

二、暴力法暴力法是最简单的一种字符串对称判断算法。

它的思路是遍历字符串，同时比较对应位置上的字符是否相同。

具体步骤如下：1. 从字符串的两端分别设置两个指针，分别指向字符串的首尾字符。

2. 比较两个指针所指向的字符是否相同，如果相同则继续比较下一对字符，如果不同则说明该字符串不是对称的，算法结束。

3. 重复上述步骤直到两个指针相遇，如果过程中没有出现不同的情况，则说明该字符串是对称的。

暴力法的时间复杂度为O(n)，其中n为字符串的长度。

但这种算法并不高效，因为它需要遍历整个字符串并逐个比较字符，所以在处理较长的字符串时效率并不高。

三、栈的应用栈是一种后进先出的数据结构，可以用来判断字符串是否对称。

具体步骤如下：1. 遍历字符串，将字符串的每个字符依次入栈。

2. 将栈中的字符逐个出栈，同时与字符串的对应位置上的字符进行比较，如果出现不同的情况则说明该字符串不是对称的，算法结束。

3. 如果整个遍历过程中没有出现不同的情况，且栈中所有字符都已经出栈，说明该字符串是对称的。

栈的应用在判断字符串对称时的时间复杂度也为O(n)，但相较于暴力法，使用栈可以在一定程度上提高效率。

四、递归算法递归算法也可以用来判断字符串是否对称。

其思路是将字符串分割成两部分，分别比较这两部分的对应字符是否相同。

具体步骤如下：1. 将字符串分割成左右两部分，如果字符串长度为奇数，则左侧字符串比右侧多一个字符。

2. 逐个比较左右两部分对应位置上的字符，如果出现不同的情况则说明该字符串不对称，算法结束。

数据结构kmp算法例题

数据结构kmp算法例题KMP算法（Knuth-Morris-Pratt算法）是一种用于在一个主文本字符串S内查找一个模式字符串P的高效算法。

它利用了模式字符串内部的信息来避免在主字符串中不必要的回溯。

这种算法的关键在于构建一个部分匹配表，用于指示模式字符串中出现不匹配时的下一步匹配位置。

让我们来看一个KMP算法的例题：假设我们有一个主文本字符串S为，"ABC ABCDAB ABCDABCDABDE"，模式字符串P为，"ABCDABD"。

我们要在主文本字符串S中查找模式字符串P的出现位置。

首先，我们需要构建模式字符串P的部分匹配表。

部分匹配表是一个数组，用于存储模式字符串中每个位置的最长相同前缀后缀的长度。

模式字符串P，"ABCDABD"部分匹配表：A B C D A B D.0 0 0 0 1 2 0。

接下来，我们使用KMP算法来在主文本字符串S中查找模式字符串P的出现位置。

算法的关键步骤如下：1. 初始化两个指针i和j，分别指向主文本字符串S和模式字符串P的起始位置。

2. 逐个比较S[i]和P[j]，如果相等，则继续比较下一个字符；如果不相等，则根据部分匹配表调整j的位置。

3. 如果j达到了模式字符串P的末尾，则说明找到了一个匹配，记录匹配位置，并根据部分匹配表调整j的位置。

4. 继续比较直到遍历完主文本字符串S。

根据上述步骤，我们可以在主文本字符串S中找到模式字符串P的所有出现位置。

总结来说，KMP算法通过构建部分匹配表和利用匹配失败时的信息来避免不必要的回溯，从而实现了高效的字符串匹配。

希望这个例题能帮助你更好地理解KMP算法的原理和应用。

数据结构的串操作

数据结构的串操作数据结构的串操作
⒈概述
⑴串的定义
⑵串的基本操作
⒉串的存储结构
⑴顺序存储结构
⑵链式存储结构
⒊串的基本操作
⑴串的长度
⑵串的比较
⑶串的连接
⑷串的截取
⑸串的插入
⑹串的删除
⑺串的替换
⒋字符串匹配算法
⑴朴素模式匹配算法
⑵ KMP 算法
⑶ Boyer-Moore 算法
⑷ Rabin-Karp 算法
附件：
⒈示例代码
⒉数据集
法律名词及注释：
⒈串：在计算机科学中，串（String）是由零个或多个字符组成的有限序列。

⒉顺序存储结构：串的顺序存储结构是将串的字符按线性次序逐个存储在一组地址连续的存储单元里。

⒊链式存储结构：串的链式存储结构是通过定义一个节点类型来存储串的字符，每个节点包含一个字符和一个指向下一个节点的指针。

⒋朴素模式匹配算法：朴素模式匹配算法是最简单的字符串匹
配算法之一，通过对目标串的每个字符依次与模式串进行比较，直
到找到匹配的位置或遍历完所有字符。

⒌ KMP 算法：KMP 算法是一种高效的字符串匹配算法，通过利
用模式串的前缀和后缀信息，在匹配失败时将模式串移动比朴素算
法更远的位置，减少比较次数。

⒍ Boyer-Moore 算法：Boyer-Moore 算法是一种基于多种规则
的字符串匹配算法，通过从右到左比较模式串和目标串的字符，根
据不匹配字符在模式串中的位置和字符表进行移动，提高匹配效率。

⒎ Rabin-Karp 算法：Rabin-Karp 算法是一种利用哈希函数的
字符串匹配算法，通过计算目标串和模式串的哈希值，并逐个比较，减少比较次数。

数据结构教学中KMP算法解析

数据结构教学中KMP算法解析摘要：模式匹配是字符串的基本运算之一，也是数据结构教学中的难点之一。

分析了模式匹配KMP算法以及算法中next函数的含义，给出了next函数的两种实现方法，有助于在教学实践中帮助学生更好地理解该算法。

关键词：数据结构；模式匹配；KMP算法0引言模式匹配（Patten Matching）是许多计算机应用领域的基础问题，在数据结构中模式匹配是字符串的基本运算之一。

字符串模式匹配指的是，找出特定的模式串在一个较长的字符串中出现的位置。

有两个字符串S和T，字符串S称为目标串，字符串T称为模式串，要求找出模式T在S中的首次出现的位置。

一旦模式T在目标S中找到，就称发生一次匹配。

有些应用可能会要求找出所有的匹配位置<sup>[1]</sup>。

例如，目标串S= 'Shanghai'，模式串T= 'gha'，则匹配结果为4。

模式匹配的典型算法包括朴素匹配算法、KMP算法和BM算法等，其中KMP算法是效率较高且经典的模式匹配算法之一<sup>[2]</sup>。

在数据结构教学中，由于KMP算法较难理解，课堂讲授往往很难取得好的效果。

本文通过对传统的朴素匹配算法与KMP算法的比较，分析next函数的含义以及实现方法，来帮助理解KMP算法。

1朴素匹配算法在朴素匹配算法中，S和T分别为目标串和模式串，变量i和j 为两个静态指针，分别表示S和T中当前正待比较的字符位置。

算法的基本思想是：第1趟匹配：从S的第1个字符（序号为0）起和T的第一个字符比较之，如果相等，则继续逐个比较后续字符（i++；j++），否则开始下一趟匹配。

新的一趟匹配：i的初值为上一趟的初值+1 ，j的初值为1，如果比较结果相等，则继续逐个比较后续字符，否则开始下一趟匹配。

依次类推，直至某一趟匹配中，T的每个字符依次和S中的一个连续的字符序列相等，则称匹配成功，否则称匹配不成功。

数据结构串的实验报告

一、实验目的1. 理解串的定义、性质和操作；2. 掌握串的基本操作，如串的创建、复制、连接、求子串、求逆序、求长度等；3. 熟练运用串的常用算法，如串的模式匹配算法（如KMP算法）；4. 培养编程能力和算法设计能力。

二、实验环境1. 操作系统：Windows 102. 编程语言：C++3. 开发环境：Visual Studio 2019三、实验内容1. 串的创建与初始化2. 串的复制3. 串的连接4. 串的求子串5. 串的求逆序6. 串的求长度7. 串的模式匹配算法（KMP算法）四、实验步骤1. 串的创建与初始化（1）创建一个串对象；（2）初始化串的长度；（3）初始化串的内容。

2. 串的复制（1）创建一个目标串对象；（2）使用复制构造函数将源串复制到目标串。

3. 串的连接（1）创建一个目标串对象；（2）使用连接函数将源串连接到目标串。

4. 串的求子串（1）创建一个目标串对象；（2）使用求子串函数从源串中提取子串。

5. 串的求逆序（1）创建一个目标串对象；（2）使用逆序函数将源串逆序。

6. 串的求长度（1）获取源串的长度。

7. 串的模式匹配算法（KMP算法）（1）创建一个模式串对象；（2）使用KMP算法在源串中查找模式串。

五、实验结果与分析1. 串的创建与初始化实验结果：成功创建了一个串对象，并初始化了其长度和内容。

2. 串的复制实验结果：成功将源串复制到目标串。

3. 串的连接实验结果：成功将源串连接到目标串。

4. 串的求子串实验结果：成功从源串中提取了子串。

5. 串的求逆序实验结果：成功将源串逆序。

6. 串的求长度实验结果：成功获取了源串的长度。

7. 串的模式匹配算法（KMP算法）实验结果：成功在源串中找到了模式串。

六、实验总结通过本次实验，我对串的定义、性质和操作有了更深入的了解，掌握了串的基本操作和常用算法。

在实验过程中，我遇到了一些问题，如KMP算法的编写和调试，但在老师和同学的指导下，我成功地解决了这些问题。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

printf("\na=%s\n",a.ch);
break;
case'2':
printf("请输入需要插入的位置:n=");
scanf("%d",&n);
printf("\n");
stringinsert(a,n,b);
printf("\na=%s\n",a.ch);
break;
case'3':
stringconnect(a,b);
#define OVERFLOW -2
typedefintstatus;
typedefstruct
{
char*ch;
intlength;
}str;
statusstringcopy(str&a,strb)
{
//free(a.ch);
if(b.length==0)
{
a.ch='\0';
returnOK;
break;
i++;
}
return*(a.ch+i)-*(b.ch+i);
}
statussubstring(str&a,strb,intn,intpos)
{
a.length=n;
if((a.ch=(char*)malloc(sizeof(char)*(a.length+1)))==NULL)
returnERROR;
inti=0;
*(a.ch+n)='\0';
while(1)
{
*(a.ch+i)=*(b.ch+pos-1);
i++;
pos++;
if(*(a.ch+i)=='\0')
break;
}
returnOK;
}
intnext[20];
voidget_next(stra,intnext[])
{
inti=1,j=0;
inti=pos,j=0;
while(i<=a.length&&j<=sub.length)
{
if(*(a.ch+i-1)==*(sub.ch+j-1)||j==0)
{
i++;j++;
}
else
{
j=next[j];
}
}
if(j>sub.length)
returni-j+1;
else
returnERROR;
printf("1:字符串b复制到a\n2:b字符串插入a中\n3:字符串a和b连接\n4:字符串a和b比较\n5:取字符传a中的子川\n6:在a中查找第pos为后是否有字符串sub\n\n\n");
scanf("%c",&c);
getchar();
switch(c)
{
case'1':
stringcopy(a,b);
}
main()
{
stra,b,sub;
a.ch="abcdefgopqrst";
a.length=13;
b.ch="hjiklm";
b.length=6;
sub.ch="cdefgdo";
sub.length=7;
charc;
intn=0,pos;
printf("a=%s\t\tb=%s\t\tsub=%s\n\n",a.ch,b.ch,sub.ch);
数据结构字符串复制,连接,求子串,KMP
#include<stdio.h>
#include<malloc.h>
#include<stdlib.h>
#define TURE 1
#define FALSE 0
#define OK 1
#define ERROR 0
#define INEEASLIBE -1
}
if((a.ch=(char *)malloc(sizeof(char)*(b.length+1)))==NULL)
returnERROR;
inti=0;
while(i<b.length)
{
*(a.ch+i)=*(b.ch+i);
i++;
}
*(a.ch+b.length)='\0';
printf("字符串复制成功\n");
if((c.ch=(char*)malloc(sizeof(char)*(c.length+1)))==NULL)
returnERROR;
inti=0,j=0;
while(1)
{
if(*(a.ch+i)=='\0')
break;
*(c.ch+i)=*(a.ch+i);
i++;
}
while(1)
{
if(*(b.ch+j)=='\0')
printf("a=%s起始%d个位置长为%d的子串为%s\n",a.ch,pos,n,sub.ch);
break;
case'6':
get_next(sub,next);
printf("请输入要求检索的起始位置:pos=");
scanf("%d",&pos);
getchar();
printf("\n");
returnOK;
}
statusstringinsert(str&a,intn,strb)
{
if(n<1||n>a.length)
{
printf("插入的位置不合法\n");
returnERROR;
}
strc;
c.length=a.length+b.length;
if((c.ch=(char*)malloc(sizeof(char)*(c.length+1)))==NULL)
break;
*(c.ch+i)=*(b.ch+j);
i++;
j++;
}
*(c.ch+c.length)='\0';
a=c;
printf("字符串连接成功\n");
returnERROR;
}
statusstringcompare(stra,strb)
{
inti=0;
while(1)
{
if((*(a.ch+i)!=*(b.ch+i))||*(a.ch+i)=='\0'||*(b.ch+i)=='\0')
{
returnERROR;
}
inti=0,j=0,l=0,k=0;
while(i<c.length)
{
if(i<n-1)
{
*(c.ch+i)=*(a.ch+i);
j=i;
k=i;
}Hale Waihona Puke elseif(i<=j+b.length)
{
*(c.ch+i)=*(b.ch+l);
l++;
}
else
{
*(c.ch+i)=*(a.ch+k+1);
next[1]=0;
while(i<a.length)
{
if(j==0||*(a.ch+i)==*(a.ch+j))
{
i++;
j++;
next[i]=j;
}
else
{
j=next[j];
}
}
}
statuskmp(strsub,stra,intpos)
{
if(pos<1||pos>a.length)
returnERROR;
printf("a=%s\n",a.ch);
break;
case'4':
if((stringcompare(a,b))==0)
printf("a=b \n");
if((stringcompare(a,b))>0)
printf("a>b\n");
if((stringcompare(a,b))<0)
printf("a<b\n");
break;
case'5':
printf("请输入要求子串的起始位置:pos=");
scanf("%d",&pos);
getchar();
printf("\n");
printf("请输入要求子串的长度:n=");
scanf("%d",&n);
getchar();
printf("\n");
substring(sub,a,n,pos);
if(kmp(sub,a,pos))