串的朴素模式匹配算法(BF算法)

合集下载

Brute_FORCE原理

Brute-Force算法简称BF算法:也称简单匹配算法，
其基本思路是：从目标串s=”s0s1…sn-1”的第一个字符开始和模式串t=”t0t1…tm-1”中的第一个字符比较，
若相等，则继续逐个比较后续字符，否则，从目标串s的第2个字符开始重新与模式串t的第一个字符进行比较，
依次类推，若从模式串s的第i个字符开始，每个字符依次和目标串t中的对应字符相等，
图像匹配本质上是特征匹配。因为我们总可以将图像表示成多个特征向量的组成，
因此如果两幅图片具有相同的特征向量越多，则可以认为两幅图片的相似程度越高。、
而特征向量的相似程度通常是用它们之间的欧氏距离来衡量，欧式距行暴力匹配。依次找出两幅图像中相似度最高的两个特征向量，并将他们连线。
特征提取的难点在于，针对不同的物体需要不同的特征进行描述。针对于同一种物体，同一种匹配算法，不同的特征可能带来很多的不一样。
目前用的比较多的是SIFT特征，SIFT特征具有旋转不变性和尺度不变性等优点，是图像匹配的优先选择。因此这里我选择用SIFT特征进行实验。
第二个难点是图像匹配，目前的算法主要还是借鉴于文本检索的词袋模型算法。
用的是opencv内置算法，opencv用的是sift特征和FLANN算法进行最近距离计算。
则匹配成功，该算法返回i;否则匹配失败，返回-1
最近在做图像检索算法(visual search)研究。
图像检索本质上还是图像匹配，因此特征提取，特征匹配等步骤都是图像检索算法的核心和难点。
直到现在图像检索技术还是处于比较意。

B F 算法 ( 详解 )

字符串匹配算法详解(下)字符串匹配算法详解(上)介绍了BF算法和KMP算法，这一篇接着来介绍Horspool算法和BM算法。

其中Horspool算法相当于是BM算法的特例，或者说是简化版的BM算法。

算法三：Horspool算法Horspool是后缀搜索，有点创新啊，大家都从左往右匹配，它反着来。

也就是搜索已读入文本中是否含有模式串的后缀；如果有，是多长，显然，当后缀长度等于模式串的长度时，我们就找到了一个匹配。

Horspool算法思想：模式串从右向左进行匹配。

对于每个文本搜索窗口，将窗口内的最后一个字符（C）与模式串的最后一个字符进行比较。

如果相等，则继续从后向前验证其他字符，直到完全相等或者某个字符不匹配。

然后，无论匹配与否，都将根据在模式串的下一个出现位置将窗口向右移动。

模式串与文本串口匹配时，模式串的整体挪动，是从左往右，但是，每次挪动后，从模式串的最后一个字符从右往左进行匹配。

下面我们来看一个实例：加上匹配串和模式串如下：匹配串：abcbcsdLinac-codecbcac模式串：cbcac首先从右向左进行匹配，c与c匹配成功，接着第二个字符b与a，匹配失败（失配位置为3）。

于是，从模式串当前位置往左寻找匹配失败的那个字符，也即在模式串中寻找字符b上一次出现的位置(注意这里的“上一次”是指在模式串中从当前失配位置往左找到的第一个与失配位置相同的字符)；结果我们在模式串中找到了字符b，其位置为1，那么就将模式串整体往右挪动，把刚才找到的字符b与之前与匹配串中失配的字符b 对齐。

总共移动了多少位呢？移动了（3-1）位。

匹配串：abcbcsdLibac-codecbcac模式串：? cbcac模式串整体挪动到b处对齐后，再从右向左开始匹配，此时发现其第一个需要匹配的字符d与c就匹配失败（失配位置为4），尼玛，坑爹啊！那接下来怎么办？当然是跟上一步的方法一样，在模式串中去找失配的那个字符d，如果在模式串中找到了d，将模式串平移，使其d字符与匹配串的d对齐。

BF算法KMP算法BM算法

BF算法KMP算法BM算法BF算法（Brute-Force Algorithm）是一种简单直接的字符串匹配算法，也称为朴素算法。

BF算法的基本思想是从主串的第一个字符开始，每次移动一个字符，然后和模式串进行逐个字符比较，如果不匹配，则继续下一个位置的比较。

如果字符匹配，则比较下一个字符，直到找到完全匹配的子串或者主串遍历结束。

BF算法的时间复杂度为O(m*n)，其中m和n分别为主串和模式串的长度。

当主串和模式串的长度较小时，BF算法是一个简单高效的字符串匹配算法。

然而，当主串和模式串的长度非常大时，BF算法的效率会非常低下。

KMP算法（Knuth-Morris-Pratt Algorithm）是一种改进的字符串匹配算法。

KMP算法的核心思想是利用已经匹配过的部分信息来避免不必要的字符比较。

KMP算法通过构建一个跳转表（也称为失配函数），记录当前位置之前的字符中可能出现的最大公共前后缀长度。

根据跳转表的信息，在模式串和主串不匹配时，可以直接跳过一些字符，继续比较下一个字符。

KMP算法的时间复杂度为O(m+n)，其中m和n分别为主串和模式串的长度。

KMP算法在主串长度较大时，相对于BF算法有较高的效率。

它的空间复杂度为O(k)，其中k为模式串的长度，用于存储跳转表。

BM算法（Boyer-Moore Algorithm）是一种更为高效的字符串匹配算法。

BM算法的核心思想是尽可能地跳过更多的字符，而不是每次只移动一个字符。

BM算法借助两个启发式规则（坏字符规则和好后缀规则）来确定移动的步长。

坏字符规则根据字符在模式串中的位置，找到离坏字符最近的下标位置，从而确定移动的步长；好后缀规则根据已经匹配的后缀子串，找到离该子串最近的下标位置，从而确定移动的步长。

BM算法的时间复杂度为O(m+n)，其中m和n分别为主串和模式串的长度。

BM算法在处理文本串相对固定的情况下有较高的效率，但是在模式串较短，主串较长的情况下，BM算法并不一定比KMP算法更高效。

字符串模式匹配bf算法

BF算法，也就是Brute Force算法，是一种基本的字符串模式匹配算法。

它通过遍历文本串，逐一比较字符来实现模式匹配。

以下是BF算法的800字说明：1. 算法原理BF算法的基本原理是在文本串中从左到右依次扫描，对于扫描到的每一个位置，将该位置的文本与模式串中的每个模式字符进行比较，以确定是否存在匹配。

如果找到了匹配，则算法结束；否则，继续扫描下一个位置。

2. 算法步骤（1）初始化两个指针，一个指向文本串的起始位置，另一个指向模式串的起始位置；（2）比较起始位置的字符是否匹配，如果不匹配则算法结束；（3）如果匹配，移动两个指针，分别到下一个位置继续比较；（4）重复步骤（2）和（3），直到文本串完全扫描完或者没有匹配到为止。

3. 算法时间复杂度BF算法的时间复杂度是O(n*m)，其中n是文本串的长度，m是模式串的长度。

这是因为每次比较都需要花费一定的时间，而整个过程需要比较n-m+1次。

4. 算法优缺点优点：简单易懂，实现起来相对容易。

缺点：时间复杂度较高，对于较长的文本串和模式串，效率较低。

此外，BF算法只能用于查找单一的模式，对于多个模式的查找需要使用其他算法。

5. 实际应用BF算法在实际应用中主要用于文本搜索、模式匹配等场景。

例如，在搜索引擎中，BF算法常被用于网页的关键词匹配和搜索结果排序。

此外，BF算法还可以用于病毒扫描、文件校验等领域。

总之，BF算法是一种基本的字符串模式匹配算法，适用于简单的文本搜索和模式匹配场景。

虽然其时间复杂度较高，但对于一些特定的应用场景，BF算法仍然是一种有效的方法。

当然，随着计算机技术的发展，还有很多高效的模式匹配算法被提出，如KMP算法、BM算法、Rabin-Karp算法等，可以根据具体应用场景选择合适的算法。

BF算法（模式匹配）

BF算法（模式匹配）BF算法（Brute-Force算法）⼀种简单的模式匹配算法，⽬的是寻找模式串p是否在⽬标串s中有出现。

思想：先从第⼀个字符开始匹配，如果p[j]==s[i]，那么继续向下⽐较，⼀旦不相等，即回溯到⽬标串的下⼀个字符，重复⼯作。

成功条件：当循环结束时，判断j的值与模式串p的长度是否相等，如果相等，说明匹配成功到了模式p的最后⼀个字符。

返回值：返回模式串在⽬标串中出现的位置。

具体实现如下：#include <iostream>#include <string>using namespace std;int index(string s,string p){int i=0,j,k;while (i<s.length()){for (j=i,k=0;j<s.length() && k<p.length()&& s[j]==p[k];j++,k++);if (k==p.length()){return i;}i++;}return0;}int index1(string s,string p){int i=0,j=0;while (i<s.length() && j<p.length()) //j⼀旦超过模式长度，代表匹配成功，跳出循环{if (s[i]==p[j]){i++;j++;}else{i=i-j+1; //回溯j=0;}}if (j>=p.length()){return i-p.length(); //返回匹配成功的位置}elsereturn0;}int main(){string s,p;cin>>s>>p;cout<<"BF1算法匹配结果为:"<<index(s,p)<<endl;cout<<"BF2算法匹配结果为:"<<index1(s,p)<<endl;return0;}算法不考虑时间复杂度和空间复杂度，这是最简单也是我们很容易想到的⼀种算法思想。

bf算法最坏的空间复杂度

bf算法最坏的空间复杂度最坏情况下，Brute-Force（BF）算法的空间复杂度是多少呢？在探讨这个问题之前，我们先来了解一下BF算法的基本原理和应用场景。

BF算法，也被称为暴力匹配算法或朴素匹配算法，是一种简单直接的模式匹配算法。

它的基本思想是，从文本串的第一个字符开始，与模式串的第一个字符进行比较，如果相等，则继续比较下一个字符；如果不相等，则将文本串的指针向后移动一位，再次与模式串的第一个字符进行比较。

如此循环下去，直到找到完全匹配或者文本串遍历结束。

BF算法的应用场景非常广泛，比如字符串匹配、模式识别、文本搜索等。

它的优点是简单易懂、实现简单，适用于小规模数据的匹配。

但是，正是由于其暴力的匹配方式，使得在某些情况下，其空间复杂度会达到最坏情况。

在BF算法中，空间复杂度主要来自于两个方面：文本串和模式串的存储。

文本串的存储。

在BF算法中，需要将待匹配的文本串存储在内存中，以便进行字符的比较。

假设文本串的长度为n个字符，那么需要占用n个存储单元的空间。

模式串的存储。

模式串是我们要匹配的目标，同样需要将其存储在内存中。

假设模式串的长度为m个字符，那么需要占用m个存储单元的空间。

BF算法的空间复杂度为O(n+m)。

当文本串和模式串长度较大时，其空间复杂度也会相应增加。

虽然BF算法的空间复杂度并不是最优的，但在某些场景下，它依然具有一定的优势。

比如在处理小规模数据时，BF算法的实现简单高效；在需要精确匹配的情况下，BF算法可以找到所有匹配的结果。

然而，当面对大规模数据时，BF算法的空间复杂度可能成为一个问题。

在这种情况下，我们可以考虑其他更高效的算法，比如KMP算法、Boyer-Moore算法等，它们可以在减少空间复杂度的同时，提高匹配效率。

总结起来，BF算法的最坏空间复杂度为O(n+m)，其中n为文本串的长度，m为模式串的长度。

虽然其空间复杂度可能不是最优的，但在某些场景下仍然具有一定的优势。

串串的模式匹配

文档仅供参考，如有不当之处，请联系改正。
Brute-Force简称为BF算法，亦称简朴匹配算法。采用穷举旳思绪。
s: a a a a b c d t: a ab bac cab bc c ✓
匹配成功
算法旳思绪是从s旳每一种字符开始依次与t旳字符进行匹配。
1
文档仅供参考，如有不当之处，请联系改正。
j
0
1
2
3
4
t[j]
a
a
a
a
b
next[j] -1
0
1
2
3
01 2 34 5678
s: a a a b a a a a b
i=3 j=1
t: a a a a b
01 23 4
失败：
i=3 j=1，j=next[1]=0
20
文档仅供参考，如有不当之处，请联系改正。
j
0
1
2
3
4
t[j]
a
a
a
a
b
next[j] -1
将s[i]与将s[i+1]与 t[0]匹配 t[0]匹配
因为t[3]=t[2]=t[1]=t[0]='a' 是不必要旳
i=3
i=3
j=3
j=-1
23
将next改为nextval：文档仅供参考，如有不当之处，请联系改正。
j
0
1
2
t[j]
a
a
a
next[j]
-1
0
1
nextval[j]
-1
-1
-1
01 23
s: a a a b
aaab
t: a a b

串的模式匹配算法实验报告

串的模式匹配算法实验报告竭诚为您提供优质文档/双击可除串的模式匹配算法实验报告篇一：串的模式匹配算法串的匹配算法——bruteForce(bF)算法匹配模式的定义设有主串s和子串T，子串T的定位就是要在主串s中找到一个与子串T相等的子串。

通常把主串s称为目标串，把子串T称为模式串，因此定位也称作模式匹配。

模式匹配成功是指在目标串s中找到一个模式串T；不成功则指目标串s中不存在模式串T。

bF算法brute-Force算法简称为bF算法，其基本思路是：从目标串s的第一个字符开始和模式串T中的第一个字符比较，若相等，则继续逐个比较后续的字符；否则从目标串s的第二个字符开始重新与模式串T 的第一个字符进行比较。

以此类推，若从模式串T的第i个字符开始，每个字符依次和目标串s中的对应字符相等，则匹配成功，该算法返回i；否则，匹配失败，算法返回0。

实现代码如下：/*返回子串T在主串s中第pos个字符之后的位置。

若不存在，则函数返回值为0./*T非空。

intindex(strings,stringT,intpos){inti=pos;//用于主串s中当前位置下标，若pos不为1则从pos 位置开始匹配intj=1;//j用于子串T中当前位置下标值while(i j=1；}if(j>T[0])returni-T[0];elsereturn0;}}bF算法的时间复杂度若n为主串长度，m为子串长度则最好的情况是：一配就中，只比较了m次。

最坏的情况是：主串前面n-m个位置都部分匹配到子串的最后一位，即这n-m位比较了m次，最后m位也各比较了一次，还要加上m,所以总次数为：(n-m)*m+m=(n-m+1)*m从最好到最坏情况统计总的比较次数，然后取平均，得到一般情况是o(n+m).篇二：数据结构实验报告-串实验四串【实验目的】1、掌握串的存储表示及基本操作；2、掌握串的两种模式匹配算法：bF和Kmp。

3、了解串的应用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

//算法功能：串的朴素模式匹配是最简单的一种模式匹配算法，又称为 Brute Force 算法，简称为BF算法
#include<stdio.h>
#include<stdlib.h>
#define MAXL 255
#define FALSE 0
#define TRUE 1
typedef int Status;
typedef unsigned char SString[MAXL+1];
//生成一个其值等于串常量strs的串T
void StrAssign(SString &T, char *strs)
{
int i;
T[0] = 0; //0号单元存储字串长度
for(i = 0; strs[i]; i++) //用数组strs给串T赋值
T[i+1] = strs[i];
T[0] = i;
}
//返回子串T在主串S中第pos个字符开始匹配的位置，若不存在，则返回0
int Index(SString S, SString T, int pos)
{
int i = pos, j = 1;
while(i <= S[0] && j <= T[0])
{
if(S[i] == T[j]) //继续比较后面的字符
{
i++;
j++;
}
else//指针回退，重新开始匹配
{
i = i -j + 2;
j = 1;
}
}
if(j > T[0])
return i - T[0];
else
return 0;
int main()
{
SString S, T;
int m;
char strs1[MAXL]; //建立主串S
char strs2[MAXL]; //建立模式串T
printf("请输入主串和子串:\n");
printf("主串S: ");
scanf("%s", strs1);
printf("子串T: ");
scanf("%s", strs2);
StrAssign(S, strs1);
StrAssign(T, strs2);
m = Index(S, T, 1);
if(m)
printf("主串 S = {%s}\n子串 T = {%s}\n在第 %d 个位置开始匹配！\n", strs1, strs2, m);
else
printf("主串 S = {%s}\n子串 T = {%s}\n匹配不成功！\n", strs1, strs2);
return 0;
}。