BM串匹配算法与改进算法的研究

合集下载

匹配改进方案

匹配改进方案在现代化的社会中，信息非常发达，但是其中的信息匹配却是一个大问题。

很多时候用户需要查询的信息较为复杂或者模糊，这就需要我们运用一些算法或技巧来提高信息匹配的效率和准确性。

在这篇文章中，我们将会提供一些匹配改进方案，谈谈如何利用这些方案提高信息匹配的效率。

一、文本匹配算法在信息检索领域，文本匹配是一种非常常用的技术。

其主要用途在于对文档库中的文章和用户查询之间进行匹配，然后返回最相关的结果。

现在常用的文本匹配算法有BM算法、KMP算法和AC算法等，这里我们主要介绍BM算法。

BM算法全称为Boyer-Moore算法，是一种实用而高效的文本匹配算法。

它在比较时，使用了字符上的信息，从而减少了比较次数，进而大大提高了匹配效率。

BM算法的核心思想是，先预处理要匹配的字符串，将其中的每个字符都放入散列表中，并记录下其最右边的出现位置。

在待匹配字符串中，从后往前匹配，一旦发现某个字符不匹配，就可以根据其最右边的出现位置，直接将模式串右移多个位数。

这样可以快速地进行匹配，提高匹配效率。

二、模糊匹配算法当查询的字符串模糊或存在一定的容错率时，我们可以利用模糊匹配算法来提高匹配准确度。

现在常用的模糊匹配算法有：莱文斯坦距离算法、Damerau-Levenshtein距离算法和Jaro-Winkler距离算法等。

这里我们主要介绍Jaro-Winkler距离算法。

Jaro-Winkler距离算法是一种字符串相似度算法，可以用来比较两个字符串间的相似程度。

其核心思想是，根据两个字符串之间的相同字符数量，计算出字符串间的相似度。

Jaro-Winkler距离算法首先根据字符串中相同字符数量和不同字符数量，计算出Jaro距离。

然后，根据两个字符串开头位置相同的字符数量，计算出Winkler修正系数。

最终，将Jaro距离与Winkler修正系数相乘，得到最终的Jaro-Winkler距离。

三、深度学习模型深度学习模型在近年来在信息检索领域也得到了广泛的应用。

对BM模式匹配算法的一个改进

Ｙ＋ｌｉ …Ｙ＋＝ｘｘ２ｍＩｉ＋Ｙ十ｉｌｌ …ｘ — ＝ｕ及Ｙ ≠ｘ，则此时ｊ２ｍ州ｉ
内解决（、ｍ分别为正文和模式的长度）ｎ，为串匹配算法的进步发展奠定了坚实的理论基础；．．ｎｔ，．．ｒｔＤＥＫｕＶＲＰａ和ｈｔＨＭｒｓ．ｏｉｒ仿照Ｃｏ的证明构造了Ｋ算法…；．．ｏｅｏｋＭＰＲＳＢｙｒ
符不是ｂ的Ｕ串，如图１所示；如果模式串ｘ中不存在这样的Ｕ串，则在文本串Ｙ中ｕ的后缀中查找与ｘ的前缀相同的
Ｃｏ从理论上证明了一维模式匹配问题可以在０ｍ＋ｎ时间ｏｋ（）
一
对于模式串ｘ在文本串Ｙ中位置ｉ的尝试，处若前ｍｊ１－一
次比较已成功完成，而在第ｍｊＩ次比较时，模式串中的字符
ｘ＝与文本中的字符Ｙ＝ａ不相同，即有；ｂ
［ｂｔｔａｅｎｔｎｌｉｏＭｌｒｍｔｓａｉｅｒｒｅｔａｎｗｐｔｒ— ａｈｎｌｒｈｎｍｌＱＭａｏｔＴｉＡｓｍｃｌＢｓｄｏｅａａｓｆＢａｏｉ，ｉｒｃｐｅｎｅａｅｍｔｉａｏｔｈｙｓｇｔｈｔｌｅｓｓｈｔｎｃｇｇｉｍ，ａｅＢｌｒｍ．ｈｙｇｉｈｓ
在拼写检查、基于字典的语言翻译、ｗｗｗ搜索引擎、计算机病毒特征码匹配、数据压缩以及ＤＡ序列匹配等大Ｎ
量应用中都需要使用字符串匹配技术。因此，在计算机科学领域中，串匹配问题一直是研究的焦点之一。在基于分布式
１．本思想２基
Ｂ算法在匹配的过程中采用了从后向前对模式串后缀Ｍ进行比较的策略。完成一次尝试（匹配失败或成功），在包括后

一种改进的BM字符串匹配算法

一种改进的BM字符串匹配算法李韦男;虞慧群【摘要】The essence of classical string matching algorithms is sequential character matching which is always from left to right or from right to left. In the main string, if there are many substrings which have the same prefix or suffix with the pattern string, the algorithms are in the low efficiency. The maximum length for the shift is the length of the pattern string. The improved algorithm uses the two-string-separate-comparison method, effectively avoiding meaningless comparison times due to the same prefix or suffix of substrings and the pattern string. Since the algorithm calculates moving distance of the pattern string according to the improved bad character rule, it increases moving distance of the pattern string. The experimental results show that the improved string matching algorithm can effectively reduce the string matching times and moving times to improve the algorithm efficiency.%经典字符串匹配算法的本质都是从左向右或者从右向左顺序进行字符匹配的，在主串中存在大量子串与模式串前缀或者后缀相同时效率较低，并且模式串最大右移长度为模式串长度。

Snort中BM模式匹配算法的研究与改进

－－－３－５４３－－１３０８９１
当Ｐ中字符。与Ｔ中对应字符ｂ失配时，同时共有３条启发性规则指导Ｐ滑动（Ｔ为参照）以到下一个适当的位置，哪种规则下滑动的距离最大，便采用哪一种。
ａＯ．ｔｒ）－ｄｌ２ｊ：ｅｔ（ａ）
０￥
－－６
１
２３
４
５６
７
的第一步是将目标串Ｔ与模式串Ｐ两者的左端对齐，
然后从Ｐ的末字符开始往左对比Ｔ中相对应的字符。
ＨＤＢＨＢＨＢＨ
１１１１６５４３２１６０
表２
规则一，如果ｂ没有被包含在模
式串Ｐ中，么Ｔ中从ｂ开始，那长度等于ｓｔｎＰ＝ｍ的子串是不可ｔ（）ｒｅ能和Ｐ匹配成功的。
规则二，如果ｂ被包含在Ｐ中，
关键词：式匹配Ｂ算法入侵检测Ｓｏ模 Байду номын сангаас ｎｄ
１引言
模式匹配是指在一个目标文本Ｔ中查找某个特定的子串，使得这个子串与已知的模式串Ｐ相等。如果在Ｔ中找到等于Ｐ的子串，则称匹配成功，
统（Ｄ）Ｉ的工作效率。著名的轻量级入侵检测系统Ｓｓｎｏｄ采用的是Ｂ模式匹配算法，Ｍ该算法被称为亚线性算法，平均匹配速度比同类型的Ｋ其ＭＰ算法还要快３ —５倍。本文对Ｂ算法进行了改进，Ｍ使之更适合与

BM模式匹配算法的研究和改进

（安大学信息工程学院，西西安７０６）长陕１０４
摘要：式匹配算法在数字通信、侵检测等多种领域都有着广泛的应用，Ｍ算法以其高效的匹配过程成为模式匹模入Ｂ
配算法中应用最为广泛的算法之一。尽管如此，Ｍ算法的效率还是可以再提高的。本文在介绍经典Ｂ算法及其改ＢＭ进的ＢＭＨ、ＭＨＳ算法的基础上，过整合、Ｂ通改进后，出了一种新的改进的ＩＭＨ算法。对以上算法进行复杂度分提Ｂ在析以后．通过具体的实验验证。果表明ＩＭＨ算法在比较次数、行时间、定性等方面明显优于ＢＢ再结Ｂ运稳Ｍ、ＭＨ以及
１现有的Ｂ系列算法简介Ｍ
１１经典Ｂ算法．Ｍ
码匹配、侵检测、据压缩以及ＤＡ序列匹配等，离不入数Ｎ都
ＢＳ等算法。ＭＨ关键词：式匹配；字符串查找；Ｍ算法；ＭＨ算法；ＭＨ模ＢＢＢＳ算法
中图分类号：Ｐ１Ｔ３２
文献标识码：Ａ
文章编号：１７ — ２６２１）９０５ — ３６４６３（０２１— ０２０
第２Ｏ卷第ｌ９期Ｖ０．０１来自２电子设计工程
ＥｌｃｒｎｃＤｅｉｎＥｎｉｅｒｎｅｔｏｉｓｇｇｎｅｉｇ

BM算法与其改进算法分析

BM算法与其改进算法分析燕红文;杨怀卿【摘要】随着网络入侵检测技术的快速发展,入侵行为的检测算法也日益重要.本文对目前常见单模式匹配算法进行分析总结,以经典的单模式匹配算法为例,分析了其详细的实现过程.并以此为基础,分析了修改后的单模式匹配算法的优缺点,对该算法的继续改进提供了一定的参考意见,指出了单模式继续改进的方向.【期刊名称】《农业网络信息》【年(卷),期】2014(000)001【总页数】3页(P124-126)【关键词】BM;模式匹配;单模式;BMH【作者】燕红文;杨怀卿【作者单位】山西农业大学信息科学与工程学院计科系,山西太谷030801;山西农业大学信息科学与工程学院计科系,山西太谷030801【正文语种】中文【中图分类】TP315当今社会，Internet技术高速发展，网络应用规模逐渐扩大，并且全球化程度越来越高，随之而来的是黑客入侵越来越频繁，信息安全问题日趋严重，信息被泄露、被纂改的情况越发普遍。

鉴于此，常规的防范方法是建立防火墙，这是一种被动防御，单独的被动防御是不能够保证信息安全的，而主动的安全防御技术已经是大势所趋，网络入侵检测（network instrusion detection）技术就是信息安全领域的一种热点技术。

随着检测技术的发展，攻击技术也在高速发展，有一些攻击的目标性很强，是指向入侵检测系统的，会造成检测系统频繁报警而造成系统资源的浪费，严重的情况会使系统瘫痪或者是系统崩溃，进而产生不可估量的损失。

所以在提高入侵检测系统的准确性时也要增强系统本身的安全性，确保检测系统在收到大量攻击的前提下可以顺利的工作。

一个检测系统其最关键的部分是检测引擎，在检测引擎当中，主要是研究其数据分析模块，也就是说第一需要描述出什么样的入侵行为，第二是使用何种算法来对入侵行为进行检测。

现讨论对于入侵行为的检测算法。

选择合适算法非常重要，它直接影响到系统的准确性和实时性能[1]，检测算法中主要涉及到模式匹配算法，比较著名的算法有KMP、Boyer-Moore、BMH、遗传算法，免疫系统，专家系统，神经网络，贝叶斯定理等算法[2]，可以将其分为两大类多模式匹配算法和单模式匹配算法，本研究将着重介绍单模式匹配算法，详细分析算法思路。

【字符串匹配】BM（Boyer-Moore）字符串匹配算法详解总结（附C++实现代码）

【字符串匹配】BM（Boyer-Moore）字符串匹配算法详解总结（附C++实现代码）BM算法思想的本质上就是在进⾏模式匹配的过程中，当模式串与主串的某个字符不匹配的时候，能够跳过⼀些肯定不会匹配的情况，将模式串往后多滑动⼏位。

BM算法寻找是否能多滑动⼏位的原则有两种，分别是坏字符规则和好后缀规则。

坏字符规则：我们从模式串的末尾往前倒着匹配，当我们发现某个字符⽆法匹配时，我们把这个⽆法匹配的字符叫做坏字符（主串中的字符）。

此时记录下坏字符在模式串中的位置si，然后拿坏字符在模式串中查找，如果模式串中并不存在这个字符，那么可以将模式串直接向后滑动m位，如果坏字符在模式串中存在，则记录下其位置xi，那么模式串向后移动的位数就是si-xi，（可以在确保si>xi，执⾏减法，不会出现向前移动的情况）。

如果坏字符在模式串中多次出现，那我们在计算xi的时候，选择最靠后的那个，这样不会因为让模式串滑动过多，导致本来可能匹配的情况被略过。

好后缀规则：在我们反向匹配模式串时，遇到不匹配时，记录下当前位置j位坏字符位置。

把已经匹配的字符串叫做好后缀，记作{u}。

我们拿它在模式串中查找，如果找到了另⼀个跟{u}相匹配的字串{u*}，那么我们就将模式串滑动到字串{u*}与主串{u}对齐的位置。

如下图所⽰：如果在模式串中找不到另⼀个等于{u}的⼦串，我们就直接将模式串滑动到主串中{u}的后⾯，因为之前的任何⼀次往后滑动，都没有匹配主串中{u}的情况。

但是这种滑动做法有点太过头了，可以看下⾯的例⼦，如果直接滑动到好后缀的后⾯，可能会错过模式串与主串可以匹配的情况。

如下图：当模式串滑动到前缀与主串中{u}的后缀有部分重合的时候，并且重回部分相等的时候，就可能会存在完全匹配的情况。

所以针对这种情况我们不仅要看好后缀在模式串中，是否有另⼀个匹配的字串，我们还要考察好后缀的后缀字串是否存在跟模式串的前缀字串匹配的情况。

如下图所⽰：最后总结如何确定模式串向后滑动的位数，我们可以分别计算好后缀和坏字符往后滑动的位数，然后取两个数中最⼤的。

入侵检测中BM模式匹配算法和改进.

入侵检测中BM模式匹配算法和改进入侵检测是一种动态的安全防护手段,它能主动识别入侵信息,为网络系统提供安全保护。

模式匹配技术是入侵检测系统识别攻击行为的主要技术,它能够快速探测攻击的存在,具有误报率低、准确性高、实用性强等优点。

在高速网络环境下,入侵检测的速度有可能跟不上数据包传输速率,导致攻击行为的漏报,因而入侵检测系统的检测速度越来越成为其获得实效的瓶颈之一。

降低入侵检测中常用的模式匹配算法的时间复杂度和空间复杂度是提高检测性能的一种有效途径。

本文的研究重点是对入侵检测中使用的模式匹配算法进行研究和改进。

本文首先对入侵检测的现状进行了分析,重点研究了网络入侵检测的核心技术——模式匹配。

研究从模式匹配方法的原理出发,提出了其面临的问题。

在此基础上,对当前最流行的BM算法从原理到性能进行了详细地分析和讨论。

BM算法拥有较好的匹配效率,但是它不能记录上一次匹配结果,而且算法的预处理过程也会带来较大的内存占有量。

本文从时间复杂度和空间复杂度两个方面进行了算法的改进研究,分别提出两种改进算法:BMLT和BMLS。

BMLT通过设定一个新的预处理函数来计算移动量,能有效增加模式串的移动距离。

BMLS通过减少处理规则和判断坏字符在模式串中出现的次数,能在对时间复杂度影响不大的前提下,减少算法的空间复杂度。

本文利用著名的开源入侵检测系统Snort和实际的网络环境,从匹配速度和空间占用两方面对BMLT和BMLS算法进行了测试分析,并与BM算法进行了比较。

相比改进前,算法的时间复杂度最多减少了60%,空间复杂度最多减少了26%。

实验结果表明两种算法均能有效地提高入侵检测的性能。

【相似文献】[1]. 李洋,王康,谢萍.BM模式匹配改进算法[J].计算机应用研究, 2004,(04)[2]. 徐成,孙伟,戴争辉,喻飞.一种面向入侵检测的BM模式匹配改进算法[J].计算机应用研究, 2006,(11)[3]. 梁志荣.具有入侵检测技术的个人防火墙实现[J].网络安全技术与应用, 2006,(04)[4]. 罗峰.入侵检测系统与技术研究[J].电脑知识与技术(学术交流),2006,(17)[5]. 闾浩,何安元.基于IPV6网络入侵检测技术的研究[J].福建电脑,2007,(03)[6]. 邓晓辉,胡丹.网络入侵检测技术[J].南昌高专学报, 2006,(04)[7]. 程拥军.浅谈入侵检测技术[J].湖南冶金职业技术学院学报, 2006,(03)[8]. 庄绪春,孟相如,韩仲祥.高速网络环境中入侵检测技术探讨[J].信息与电子工程, 2006,(04)[9]. 赵准剑.入侵检测技术与计算机网络安全问题思考[J].湖南行政学院学报, 2006,(06)[10]. 兰义华,张颕江,钱涛.入侵检测技术的分析与发展趋势研究[J].网络安全技术与应用, 2005,(08)【关键词相关文档搜索】：计算机技术; 网络安全; 入侵检测; 模式匹配; BM算法; 算法改进【作者相关信息搜索】：浙江工业大学;计算机技术;陈庆章;杜丰;。

对BM模式匹配算法的一种改进

１８０
２１，７３）０１４（２
ＣｍｕｅＥｇｎｅｉｄｐｌａｏｓｏｐｔｎｉｒｇａＡｐｉｔｎ计算机工程与应用ｒｅｎｎｃｉ
对Ｂ模式匹配算法的一种改进Ｍ
王文鹏，俊黄
ＷＡＮＧｅｐｎ，ＷｎｅｇＨＵＡＮＧｕＪｎ
ＷＡＮＧＷｅｐｎＨＵＡＮＧＪｎＩｐｏｅａｇｒｔｍｏｎｅｇ，ｕ．ｍｒｖｄｌｏｉｈｆＢＭｆｒａｔｒｍａｃｉｇＣｏｏｐｔｅｎｔｈｎ．ｍｐｔｒｕｅＥｎｉｅｒｎａｄｇｎｅｉｇｎＡｐｌａｐｉ－ｃ
ｔｎ。０１４（２：０ —１．ｉｓ２１。７３）１８１１ｏ
ＡｂｔａｔＰｔｒｍａｃｉｇｓｕｅｎｎｒｓｏｅｅｔｎｙｔｍｗｉｅｙＯｎｔｅａｅｏｎｌｚｎｓｒｃ：ａｔｎｅｔｈｎｉｓｄｉｉｔｕｉｎｄｔｃｉｓｓｅｏｄｌ．ｈｂｓｆａａｙｉｇＢＭａｇｒｔｍｎｔｅｌｏｉｈａｄｏｈｒａｇｒｔｍｓａｉｒｖｄａｇｒｈｌｏｉｈ，ｎｍｐｏｅｌｏｉｍｏＭｉｒｓｎｅ．ｈｌｏｔｍｕｅｔｅｔｆＢｓｅｅｔｄＴｅａｇｒｈｐｉｓｓｈＢＭＨａｇｒｔｍｎｌｏｈｉａｄＢＭＨＳｌｏｔｍｔｏｅａｇｒｈｉａｎｔａｄｍａｅｓｆｃｍｂｎｔｎｏｅｆｒｔｃａａｔｒａｄｌｓｈｒｃｅｆｐｔｒｏｍａｅｈｅｐｔｒｈｆ．ｅｒａｅｉｍｅｎｋｓｕｅｏｏｉａｉｆｔｓｈｒｃｅｎａｔｃａａｔｒｏａｔｎｔｋｔａｔｎｓｉＩｄｃｅｓｓｏｈｉｅｅｔｔｔｅｔａｄｔｅｏｈｒｃｅｏａｉｏｎｔａｃｉｇｐｏｅｓＥｘｅｍｅｔｌｄｔｈｗｓｔｅｉｒｖｄａｇｒｔｍａｌｈｉｍｅｎｉｓｆｃａａｔｒｃｍｐｒｓｎｉｈｅｍｔｈｎｒｃｓ．ｐｒｍｉｎａａａｓｏｍｐｏｅｌｏｈｈｉｃｎｅｌ —

字符串精确匹配算法改进的探讨

字符串精确匹配算法改进的探讨如何改进字符串匹配算法，提高查询速度，是目前研究的重要领域之一，本文在对BF算法、KMP算法、BM算法、BMH算法、RK算法和SUNDAY算法等几种常见算法分析的基础上，提出改进的意见。

标签：精确匹配；KMP算法；模糊匹配一、引言字符串精确匹配在计算机领域有着广泛的应用, 它可用于数据处理、数据压缩、文本编辑、信息检索等多方面。

如何改进字符串匹配算法，提高查询速度，是目前研究的重要领域之一。

所谓精确字符串匹配问题，是在文本S中找到所有与查询P 精确匹配的子串。

字符串精确匹配要求匹配严格准确，其实现算法主要有BF算法、KMP算法、BM算法、BMH算法、RK算法和SUNDAY算法等。

本文在对这几种常见算法分析的基础上，提出改进的意见。

二、常见算法分析1．BF算法BF(Brute Force)算法是效率最低的算法。

其核心思想是：T是文本串，P是模式串。

首先S[1]和P[1]比较，若相等，则再比较S[2]和P[2]，一直到P[M]为止；若S[1]和P[1]不等，则P 向右移动一个字符的位置，再依次进行比较。

如果存在t，1≤t≤N，且S[t+1..t+M]= P[1..M],则匹配成功；否则失败。

该算法最坏情况下要进行M*(N-M+1)次比较，时间复杂度为O(M*N)。

2．KMP 算法KMP(Knuth-Morris-Pratt)算法是D.E.Knuth、J.H.Morris和V.R.Pratt 3 人于1977 年提出来的。

其核心思想是：在匹配失败时，正文不需要回溯，而是利用已经得到的“部分匹配”结果将模式串右移尽可能远的距离，继续进行比较。

这里要强调的是，模式串不一定向右移动一个字符的位置，右移也不一定必须从模式串起点处重新试匹配，即模式串一次可以右移多个字符的位置，右移后可以从模式串起点后的某处开始试匹配。

KMP算法的时间复杂度是O(m+n)，最坏情况下时间复杂度为O（m*n）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

使『］Ｉ５对 ’ 『准比较，配和Ｐ时，Ｔ＝．继续往前匹配比较；Ｔ ≠Ｐ，移动３个字符，Ｐ９与，１］齐，备第五次匹配。匹若ｉＰ，则若ｉ．（）完成第四次匹配后，［与Ｔ１】行比较，配成功，３在Ｐ９１【进５匹则正文中ｉ变，式中ｊ向Ｎｘ叫所指示的位置。ｅｌ示不模指ｅｔＮｘⅢ表
串匹配是字符串的一个基本运算．对于给出的长度为ｎ的
Ｔｐｇｈｌｐ
２３
４
ｈｈ
ｈ
ｈｄ
ｈ
ｔｄｂｈｐ
ｐ
ｈ
ｄ
正文字符ＴＴ … … 和长度为ｍ的模式串ＰＰ… … Ｐ（＞＝，＝Ｉｎ＞ｍ）要找出模式Ｐ在正文Ｔ中的首次出现，旦模式Ｐ在正文．一中找到．匹配成功．则匹配失败。符串匹配应用广泛．数则否字在
些现有的改进算法，这些算法进行了比较，结合Ｂ对并ＭＧ算法，出了一个新的改进算法。该算法考虑了模式匹配时出现提
重复字符时，比较的前一个字符的出现情况以及模式串首字符的特性，高了模式串移动ｍｌ的概率，高了匹配速度。提＋位提
表１Ｍ模式匹配过程Ｂ
下面我们对表１中的Ｂ模式匹配过程作一简单分析：Ｍ（）一次匹配是模式串的Ｐ与文本中的Ｔ首字符对齐．１第然后从模式串的最后一个字符开始从右向左比较，先将Ｐ９与Ｔ即『１『１行比较，配失败，９进匹因此模式串向右移动，同时Ｔ９位置的『１
１１．ＫＭＰ算法
且Ｔ１１符 ”” 在模式串Ｐ７位置出现一次，式串向右移ｆ字Ｏｓ仅『１模
ＫＭＰ算法的基本思想Ｐ将正文Ｔ和模式Ｐ左端对齐进行动２个字符，Ｐ７与Ｔ１１同理，四次匹配后模式串再向右ｌ是使『］［０；第
算法和随机算法．些算法都是精确的串匹配算法。文主要介这本
绍Ｂ算法及其改进算法。Ｍ１现有模式匹配算法的分析、
目前关于模式匹配的算法很多．中最著名的两个是Ｋ字符 … 在模式串Ｐ中仅出现１次．式串移动１字符．Ｐ其ＭＰｅ。模个即
８与ｆ］从算法 … Ｂ算法［两个算法在最坏情况下均具有线性的搜索『１Ｔ９对齐，而完成第二次匹配。和Ｍ２１（）三次匹配是将Ｐ９与Ｔ１］作比较，现匹配失败，２第『１［０先发时间。
ｐｐ
（Ｉｈｄ
ｈｄ
ｐ
５６
ＰＰ
ｈｈ
ｄｄｐｈｄ
ＰａｔＴＨ．ｓ照Ｃｏｒｔ和．Ｍ０仿ｏｋ的证明构造了ＫＭＰ算法ｆ：．．ｌＲＳｌ
ＢｖｒＪＯｅ设计了Ｂ算法［Ｋｒｏｅ和．ＭＯｒＳＭ２ａｐ和Ｒｂｎ给出了Ｒ１；ａｉＫ
字通信、本编辑、像处理、据压缩、式识别等应用中，文图数模都需要进行串匹配近年来对于一维字符串的匹配问题研究较多１７９０年．＿．ｏｋ从理论上证明了一维模式匹配问题可以在ＯＳＡＣｏ（ｎ时问内解决．串匹配算法的进一步发展奠定了坚实的ｍ＋）为理论基础，中ｎｍ分别为文和模式的长度；．．ｎｔ，．．其、ＤＥＫｕｈＶＲ
２１００年第７期
福
建电
脑
Ｂ串匹配算法与改进算法的研究Ｍ
王
（苏州大学
锋
电子信息学院江苏苏州２５２１０１）
【摘
一
要】串匹配算法在数字通信等方面应用广泛，Ｍ算法是主要的串匹配算法之一。文章在分析了Ｂ算法过程和：ＢＭ
【键词】Ｂ算法；式串；进算法；式匹配关：Ｍ模改模
Ｏ、言引
ｔ２３４５６７８９１１２１３】６】７ｌ９５２６２２８０１１４ｌ５ｌ８ｌ２Ｏ２１２２２ｊ２４２
［Ｊ［４进匹配失败．式串向右移动。模当模式中第ｉ字符与正文中相应字符匹配失败时．在模式中然后Ｐ８与Ｔ字符进行比较的字符的位置．这一位置只与模式本身有关．与正文无关。而ＫＭＰ算法虽然能使样本右移若干位．存在一个局限．但即