多模式匹配算法的性能分析

合集下载

几种模式匹配算法的效率分析

０引言
模式匹配算法一直是研究焦点之一，应用非常广泛，拼写检查、言翻译、据压缩、索引擎、它如语数搜网络入侵检测、算机病毒特征码匹配等。计
ｌ式匹配算法模
字符串的的定位操作通常称作串的模式匹配，一种重要的串运算。模式匹配的定义为：于给定是对
间复杂度为Ｏ（）ｓ。
１２Ｂ算法Ｊ．Ｍ
受ＫＭＰ算法的启发，ｙｒ和ＭｏｒＢｏｅｏｅ提出了一种新的字符串快速匹配算法 — — Ｂ算法。它是从另外Ｍ
一
个角度出发，出一种比较新颖的方法来求解模式匹配问题。其基本思想是从右向左的把模式同文本提
立即执行由Ｐ与Ｔ［ｉ］始的从左到右的新一轮的匹配。Ｔ［］起ＢＭ算法在预处理阶段时间复杂度为Ｏ（＋ｓ，间复杂度为Ｏ（）在搜索阶段时间复杂度为Ｏ（ｍ）空ｓ；ｍｎ最坏情况下要比较进行３ｎ次比较，好情况下时间复杂度为Ｏ（／），最ｎｍ）。
５０
维普资讯
定义如下：
叭小
【Ｊ，ｍａＪｌｊｃ≤ ｍ１｝它情况）ｍｊ｛］，Ｊ≤一，情Ｊ一＝ｘＰ［＝１其况它
ｊ＝
ＢＭ算法的思想是：果在执行正文中从第ｉ位置起返前一段与模式匹配检查中，旦出现不匹配，如个一

多模匹配算法

1979年，Commentz和Walter.B 发明的算法（简称 CW79算法）结合了BM算法，在AC75的自动机算法上实现了跳跃扫描文本。
除了自动机这种主流多模式匹配思想外还有一种很有效的想法。这就是哈希（Hashing），Hashing方法的串查寻最早是在1971年被Harrison介绍，之后得到了充分地分析。1992年到1996年，台湾人Sun Wu和他的导师Udi Manber发表了一系列的论文，详细地介绍了他们设计的匹配算法，并用此算法实现了一个Unix下类似fgrep的工具：agrep。
➢ Step2：记f(s) = g(state, a)
以图1 a)为例说明计算的失效函数f； ① 先令f(1) = f(3) = 0，因为1和3是深度为1的状态。 ② 计算深度为2的状态2，6和4的失效函数。
计算f(2)，令state = f(1) = 0；由于g(0, a) = 0，得到f(2) = 0。计算f(6)，令state = f(1) = 0；由于g(0, i) = 0，得到f(6) = 0 。计算f(4)，令state = f(3) = 0；由于g(0, h) = 1，得到f(4) = 1。 ③ 按这种方式继续，最终得到了如图1 b) 所示的失效函数f。
➢ 计算方法：用于计算某个状态失效函数值的算法在概念上是非常简单的。首先，令所有深度为1的状态s的函数值为f(s) = 0。假设所有深度小于d的状态的f值都已经被算出了，那么深度为d的状态的失效函数值将根据深度小于d的状态的失效函数值来计算。
为了计算深度为d状态的失效函数值，我们考虑每个深度为d-1的状态r，执行以下步骤： ➢ Step1：如果对所有状态a的g(r, a) = fail，那么什么都不做
图1 a) d(0) = 0; d(1) = d(3) = 1; d(2) = d(6) = d(4) = 2

基于FPGA的多模式匹配算法研究与实现

中分号Ｐ３田类ｌ３Ｔ０
基于ＦＧＡ的多模式匹配算法研究与实现Ｐ
貉潇，郭健，邓敏，自斌
（．１西南电子电信技术研究所，成都６０４；２中国电子科技集团公司第３研究所，成都６００）１０１．０１００
耍：针对模式匹配软件算法速度慢、正确率低等问题，提出一种基于ＦＧＰＡ的硬件多模式匹配算法，通过设计窗口折叠的布鲁姆过滤
窗口数据的第ｉ个字节ｂｔ＝， …，。其中，ｂｔ的ｙ，（，）ｅｙｅ，
７｛， … ，模式集合Ｐ＝ｐ，）１ ‘２，＝ｔ），Ｉ，Ｐ …，，服从均匀分布的独立ｈｓａｈ函数集合Ｈ：＾ …，，则Ｂ数据结构为｛，】，Ｆ
关键词的模式集进行ｈｓａｈ转换形成，可用于实现对集合
基金硬目：教育部人文社科基金资助项［（０ＪＺ１９；四川省金融智能与金融工程重点实验室基金资助项Ｉ（ＩＥ００Ｏ）￣１ＹＣＨ６）￣ＦＦ２１．ＳｌＰ
作者筒介：潇（８一，骆１ｏ）女，工９程师，主研方向：光络通信，纤网高速网络数据处理；健、邓敏、自斌，程师郭工
定理设字节集合∑ 、而∈ 、ｎ ∑ 为偶数，有运算关系：
Ｙ＝２・０ｘ１０ｘ０・０ｘ，Ｙ＝Ｙｌ・（）１
收稿日期：２１－１１．四日期：０２０—４Ｅｍａｉｘ＠１３ｏ０１－４１－｝２１－１１－￣ｖｘ６．ｒｙｃｎ
＿
２２３
计

中文多模式匹配算法性能的分析与研究

朱永强，江雪，
（１．成都网安科技发展有限公司，四川成都６１００９２；
２．电子科技大学示范性软件学院，四川成都６１００５４）
摘要：模式匹配算法一般不具有所有环境下的通用性，不同的算法在不同语义环境下的表现，往往差异较大。为实现中
文环境下对模式串的快速多模式匹配，选择出在中文环境下的最优匹配算法，分析了几种经典的多模式匹配算法。通过对各个算法设计思路、时间性能与空间性能的研究，推导出基于 “ 坏字符” 的算法设计思路最适用于中文环境下大字符集、
ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３－６２９Ｘ．２０１４．０２．０１６
ＡｎａｌｙｓｉｓａｎｄＲｅｓｅａｒｃｈｏｆＣｈｉｎｅｓｅＭｕｌｔｉ－ｐａｔｔｅｒｎＭａｔｃｈｉｎｇ
第２４卷第２期２０１４年２月
计算机技பைடு நூலகம்术与发展
ＣＯＭＰＵＴＥＲＴＥＣＨＮＯＬＯＧＹＡＮＤＤＥＶＥＬ０ＰＭＥＮＴ
Ｖｏ１．２４Ｎｏ．２Ｆｅｂ．２０１４
中文多模式匹配算法性能的分析与研究
ｈｉｎｇ，ｓｅｌｅｃｉｎｔｇｔｈｅｏｐｉｍａｔｌｍａｔｃｈｉｎｇａｌｇｏｉｔｒｈｍｕｎｄｅｒｔｈｅＣｈｉｎｅｓｅｅｎｖｉｒｏｎｍｅｎｔ，ａｎｌｙａｚｅｓｅｖｅｒａｌｃｏｍｍｏｎｍｕｌｔｉ —ｐａｔｔｅｎｒｍａｔｃｈｉｎｇａｌｇｏ —

Wu—Manber算法性能分析及其改进

如果对于１ ≤ ｎ存在丁［＋１］Ｉ１・］ ≤ ， … ＋ｍ＝尸［．ｍ，．
其中１ ≤ ≤五则模式串尸在文本丁的位置ｉ出现，，Ｉ处即模式串与文本匹配。字符串的多模式匹配问题就是要寻找多个Ｐ在Ｔ中是否出现，以及出现的位置。目前已出现多种多模式匹配算法。早在１７９５年，Ｖ．八Ａｈｏ和Ｍ．．ｏａｉＪＣｒｓｋ就提出解决多模式匹配问题的Ａｃｈ
介绍了ｗｕｎｅ算法的基本概念及其实现原理，算法在实践应用中是最有效的。然后提出了对ＷｕＭａｂｒ — ｂｒＭａ此－ｎｅ算法的改进，以解决多模式串长度很短时出现的性能问题。最后，实验数据表明，改进后的ＷｕＭａｂｒ法，ｎｅ算其性能远
。
注的一个算法。ＳｎＷｕ和ＵｄＭａｂｒ］ｕｉｎｅＩ的实验表明，ｓ在ＳｎＳａｃ０上，ｕｐｒｌ他们的算法可以于１内完成在１．Ｍ的Ｏ秒５８文本中搜索１００个模式的工作。在ｗＭ算法的基础上，００ＳｎＷｕ和ＵｄＭａｂｒ实现了一个用于模糊匹配的工具ｕｉｎｅａｒｐ。ｇｅＥ和一个文本检索的工具ｌｓ￣在实际的应用中都］ｉｅｍｐ，获得了良好的效率。但是，我们通过测试实验发现ＷｕＭａ — ￣ｎｂｒｅ算法在某些特定情况下性能并不是很好，对这一问题针
远优于传统的ＷｕＭａｂｒ多模式匹配，能分析性

多模式串匹配算法详解

多模式串匹配算法详解随着计算机技术的不断发展，我们的生活已经离不开计算机了。

计算机技术也在不断完善和发展，其中算法是计算机科学的基础之一。

在计算机科学中，字符串匹配是一个非常重要的问题，而多模式串匹配算法就是解决字符串匹配问题的一种方法。

一、什么是多模式串匹配算法多模式串匹配算法是指在一个文本串中查找多个模式串的匹配位置。

举个例子，如果我们想在一段英文文章中查找“apple”、“banana”和“pear”这三个单词的位置，那么就可以使用多模式串匹配算法。

在这个例子中，文本串就是整篇文章，而“apple”、“banana”和“pear”就是模式串。

二、常见的多模式串匹配算法1.基于Trie树的多模式串匹配Trie树是一种树形数据结构，它是一种有序树，用于保存关联数组，其中键通常是字符串。

Trie树的基本思想是将字符串拆分成单个字符，然后构建一棵树，使得每个节点代表一个字符，从根节点到叶子节点组成的字符串就是一个完整单词。

构建出Trie 树之后，就可以使用类似深度优先搜索的方法，在Trie树上查找所有匹配的字符串。

2.基于AC自动机的多模式串匹配AC自动机是一种自动机算法，它是基于Trie树的改进。

AC自动机可以在O(n)的时间复杂度内找出文本串中所有出现在模式串集合中的模式串出现的位置。

就算是在模式串集合非常大的情况下，AC自动机依然可以保持良好的时间复杂度。

所以AC自动机是一种非常高效的多模式串匹配算法。

三、多模式串匹配算法的应用多模式串匹配算法的应用非常广泛，下面列举一些常见的应用场景。

1.搜索引擎搜索引擎需要快速地查找网页中的关键词，并列出所有相关的网页。

多模式串匹配算法可以帮助搜索引擎实现这个功能。

2.文本编辑器文本编辑器需要在用户输入时提示相关的自动补全单词和拼写纠错。

多模式串匹配算法可以根据用户输入的前缀，返回与之最相似的单词。

3.网络安全网络安全中常常需要检测恶意代码和病毒。

多模式串匹配算法可以帮助检测这些恶意代码和病毒。

一种改进的QWM多模式匹配算法

串在模式串其它位置的出现情况来决定可以移动的距离。算法的匹配速度跟每次匹配不成功后移动的距离有关系，如果能增加安全的移动距离，无疑可以提高处理的速度。在ＷＭ算法中，如果Ｂｉ－出现在模式尾部，意＋＿…ｔｍＩ＋不味着当前文本不匹配任何一条模式，并根据ＳＦ表移动相应的距离，设为Ｓ＝ＨＩＴＩ
１引言
多模式匹配是计算机技术领域的一个基本问题，在ＩＳＩｒｓｎｅｃｏｓｍ、Ｄ（ｔｉｔｔｎｙｔ）ｎｕｏＤｅｉＳｅ病毒检测、垃圾邮件过滤、Ｎ序列检测等方面都有着重要的应用。多模式匹配的数学ＤＡ模型可以描述为：＝Ｐ，２．）令Ｐ｛Ｉ … 是模式集合，＝ｈ２是一个文本串，中的元素、ＰＴｔ Ⅳ … Ｐ
改进，并进一步优化了算法的跳跃机制，比对实验显示，新的算法较原来的算法有很大的提高。
２基于ＱｓＷＭ相结合的算法Ｑ和ＷＭ设模式个数为ｋ，模式最短长度为ｍ，后缀分组长度为ＢＷＭ算法每次考虑长度。Ｑ
为ｍ的文本串，即 … … ｌ并根据 …ｔｍ这Ｂ，＋－ｉ－个字符串是否出现在模式串末尾（：Ｂ＋ｌ注这里是指通过比较＋ｍ…ｔｍｌａｈ与所有模式的后缀ｈｈ是否相等来判断是否出，－ｓ值＋的ｈｓａ值现，并非逐字节比较，下同）来判断是否产生匹配，如果文本的Ｂ个字符串不出现在模式串末尾（即其ｈｓ值与所有模式的后缀ｈｈ［ａｈｓ￣ａｌ不相等），则根据Ｂ．ｉ－个字符．ｔｍ这Ｂ．１＋

一种新的应用于数据流关联分析的多模式匹配算法

—
—
多的位移，得最大步长，获同时应用ＡＣ算法的有限状态自动机构造模式树，匹配过程中移动模式树，减少规则匹配次数。ＣＷＭＮ算法仍包括预处理和匹配两个阶段。Ａ－３１ＡＷＭＮ算法的预处理．Ｃ－３１１构造位移表．．在预处理阶段，同样生成前缀索引Ｐｅｉ表、ｒｆｘ后缀索引Ｈａｈｓ表及跳跃距离Ｓｉ表。ｒｆ表和ＨａｈｈｆＰｅｉｔｘｓ表的计算方法与原ＷＭ算法相同。
找到该模式串，匹配成功。ＡＣ算法由于在对文本串进行匹配时完全按照顺序输入字符，法跳过不必要的比较，无因此在模式串数目不是很多的情况下性能并不是很好。２２ＷＭ算法．ＷｕＭａｂｒ．ｎｅ算法采用Ｂ算法进行跳跃的思想和ｈｓＭａｈ散列的方法。算法包括预处理和查找两个阶段。在预处理阶段，针对模式集合建立３个表ｓｉ表、ａｈ表和ｐｅｉ表。中，ｈｆ表存储的是初次将ｈｆｈｓｔｒｆｘ其ｓｉｔ
（）如果字符块Ｂ不出现在任何模式串中，Ｓｉ［］＝ｍ —Ｂ＋１其中ｈ为字符块Ｊ的散列值。１则ｈｆｈｔ，Ｂ（）如果字符块出现在某些模式串中，在所有模式串中最右的非最后一个字符块的结束位置２且为ｑ则Ｓｉ［］＝ｍ —ｑ若字符块仅在某些模式串的最后一个字符块的位置处，Ｓｉ［］：ｍ一，ｈｆｈｔ，则ｈｆｈｔ

实现顺序串的各种模式匹配算法

实现顺序串的各种模式匹配算法序号一：引言实现顺序串的各种模式匹配算法是一项重要而复杂的任务。

在计算机科学领域，这一问题一直备受关注，因为它涉及到如何高效地在一个文本中找到一个模式的出现。

通过使用不同的算法和数据结构，我们可以在实际应用中更有效地实现字符串匹配。

在本文中，我们将深入探讨各种模式匹配算法，包括它们的原理、优缺点以及适用场景，以便读者能够更全面地理解和应用这些算法。

序号二：模式匹配算法的基本原理在开始讨论不同的模式匹配算法之前，让我们先了解一下模式匹配的基本原理。

模式匹配是指在一个文本串中查找一个模式串的过程。

具体来说，我们需要在文本串中以每一个位置为起点，依次比较模式串和文本串的对应字符，从而确定模式串是否出现在文本串中。

这个过程类似于在一本书中找到特定章节的名字，只不过在计算机中我们需要以更快的速度完成这一任务。

序号三：常见的模式匹配算法及其优缺点在实际应用中，有许多不同的模式匹配算法可供选择。

其中，最常见的包括朴素匹配算法、KMP算法、Boyer-Moore算法、Rabin-Karp 算法等。

每种算法都有其独特的优缺点，以适应不同的应用场景。

朴素匹配算法是一种简单直观的算法，它从文本串的每一个位置开始和模式串进行匹配，直到找到匹配或者遍历完整个文本串为止。

这种算法的优点是实现简单，但是对于大规模文本串和模式串来说效率较低。

KMP算法是一种高效的模式匹配算法，它利用了模式串自身的特点来快速匹配文本串。

通过构建部分匹配表，KMP算法可以在匹配过程中跳过一些已经匹配过的位置，从而提高匹配的效率。

其主要缺点是需要额外的空间来存储部分匹配表，因此在内存有限的场景下可能不适用。

Boyer-Moore算法是另一种经典的模式匹配算法，它通过利用模式串和文本串之间的信息来跳过一些不可能匹配的位置，从而减少比较次数。

这使得Boyer-Moore算法在最坏情况下的时间复杂度较低，适用于大规模文本串和模式串的匹配。

多模匹配算法

输出“ ”是和状态7相关联的输出“his”是和状态相关联的
添加第四个关键字“hers”，可以得到：添加第四个关键字“ ，可以得到：
输出“ 相关联。输出“hers”和状态相关联。 ”和状态9相关联在这里，我们能够使用已有的两条边：一条是从状态到在这里，我们能够使用已有的两条边：一条是从状态0到 1标记着的边；一条是从状态到2标记着的边。标记着h的边标记着e的边标记着的边；一条是从状态1到标记着的边。
输出“she”和状态相关联。输出“ 和状态5相关联。和状态相关联
增加第三个关键字“ ” 我们得到了下面这个图。增加第三个关键字“his”，我们得到了下面这个图。注意到当我们增加关键字“ ” 已经存在一条从状态0到意到当我们增加关键字“his”时，已经存在一条从状态到状态1标记着的边了，所以我们不必另外添加一条同样的边。标记着h的边了状态标记着的边了，所以我们不必另外添加一条同样的边。
举个例子，利用图1 举个例子，记树型有限自动机为状态机M。状态机M利用图1的函数去处理输入文本“ushers”，图4显示了M在处理文本串函数去处理输入文本“ 时产生的状态转移情况。时产生的状态转移情况。
图4 扫描“ushers”时的状态转换序列
考虑M在状态，且当前输入字符为e时的操作循环由于g(4, 时的操作循环。考虑在状态4，且当前输入字符为时的操作循环。由于在状态 e) = 5，状态机进入状态，文本指针将前进到下一个输入字，状态机进入状态5，并且输出output(5)。这个输出表明状态机已经发现输入符，并且输出。文本的第四个位置是“ 出现的结束位置。文本的第四个位置是“she”和“he”出现的结束位置。在状态和出现的结束位置 5上输入字符，状态机M在此次操作循环中将产生两次状态转上输入字符r，状态机在此次操作循环中将产生两次状态转上输入字符由于g(5, r) = fail，M进入状态 = f(5)。然后因为进入状态2 移。由于，进入状态。然后因为g(2, r) = 8，M进入状态，同时前进到下一个输入字符。在这次操作进入状态8，同时前进到下一个输入字符。，进入状态循环中没有输出产生。循环中没有输出产生。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Ｐｅｆｒａｅａｌｓｓｏｕｌｉｌｔｅｎｍａｃｉｌｏｉｈｍｒｏｍｎｃｎａｙｉｆｍｔｐｅｐａｔｒｔｈｎｇａｇｒｔ
ＳＵＮｕ—ａｎＹｏｃｇ
（ｃｏｌ厂ｏｐｔｃｅｃ，＂ｔｈｙｕＵｉｒｔ，ｉｎ７０６，ｈｎ）Ｓｈｏ０ＣｍｕｅＳｉｅＸｉｕＳｉｎｅｓｙＸ＂１０５Ｃｉａｒｎｃｏｖｉａ
ｍｕｈｉｌａｔｒｔｈｉｌｏｉｈｍ．ｐｅｐｔｅｎｍａｃｎｇａｇｒｔ
Ｋｅｒｓｍｕｉｌａｔｒｔｈｎ；ＣａｇｒｈＷＭｌｏｔｍ；Ｂａｇｒｔｍｙｗｏｄ：ｈｐｅｐｔｎｍａｃｉｇＡｌｏｉｍ；ｅｔａｇｒｈＥｘｌｏｈｉｉ
ＡｂｔａｔＴｅｓｒｃ：ｈｍｕｔｌｐｔｒｍａｃｉｇｌｏｉｍｄｒｃｌｉａｔｎｎｒｓｏｄｔｃｉｎｙｔｍｐｒｏｍａｃａｄｌｐｅａｔｎｉｅｔｈｎａｇｒｔｈｉｔｅｙｍｐｃｓｏｉｔｉｎｅｅｔｓｓｕｏｅｅｆｒｎｅｎ
语育翻译、据压缩、索引擎、络人侵检测、算机病毒数搜网汁特征码配等 … 。研究高效的多模式匹配算法具有非常重要
的理论和现实意义。所谓多模式配，是在文本串就１ … ，巾一次匹配，ｎ１
ｍａｃｉｇｔｆｔｅｅａｇｒｔｍｓａｅｔｓｅｈｏｇａｄ — ｉｅｐｒｎ．ｒｖｄｓｈｌｆｌｒｆｒｎｅｆｒｉｒｖｎｈｔｈｎｉｏｈｓｌｏｈｒｅｔｄｔｒｕｈｈｎｓＯｌｘｅｍｅｔｔｐｏｉｅｅｐｕｅｅｅｃｏｍｐｏｉｇｔｅｍｅｉｉＩ
ｗＭ快速字符串匹配算法采用Ｂ算法进行跳跃的思想Ｍ
和ｈｓ列方法，实际应Ｊ中，大规模多模式匹配最快ａｈ散在｝｝ｊ是
≤ ，ｉｌｎ是最短模式串的长度，ｍｎｅ＝ｉ｛ｊ１ ≤ ）ｍｎｅ即ｉｌｍｎｍｌｎ（ｑ１多模式匹配比多个模式串逐个进行传统单模式匹配的）。
第１卷第１８期
Ｖｏ．８１１Ｎｏ１．
电子设计工程
ＥｌｃｒｎｃＤｅｉｎＥｎｉｅｒｎｅｔｏｉｓｇｇｎｅｉｇ
２１００年１月
Ｊｎ０１ａ．２０
多模式匹配算法的性能分析
孙友仓
（西安石油大学计算机学院，陕西西安７０６）１０５摘要：多模式匹配算法效率直接影响入侵检测系统的性能和效率。在分析研究经典的ＡＣ算法、ＷＭ算法和ＥＢ算法ｘ的基础上，过上机实验测试这些算法的模式匹配时问，改进多模式匹配算法提供有益的借鉴。通为关键词：多模式匹配；Ｃ算法；ＡＷＭ算法；ｘＥＢ算法中图分类号：Ｐ９．８Ｔ３３０文献标识码：Ａ文章编号：６４６３（０００ — ０７０１７ — ２６２１）１０１— ２
速度快得多。
的算法之一．．ＷＭ算法将文本串以Ｂ个字符长度分块，该称
个字符为１块字符．个曰为块字符的长度，曰通常取２或３。首先对模式集进行预处理．在预处理阶段构造３个表，即ｓｉ表、ａｈ表和ｐｅｘ表。匹配过程从文本串ｔｘ的第（ｈｆｈｓｔｒｆｉｅｔｍ—
ｅｃｅｙＯｎｔｅｂｓｓｏｅｅａｈｉｎｄａｌｓｎｈｅｌｓｉｉｆｉｎｃ．ｈａｉｆｒｓｃｎｇａｎａｙｉｇｔｃａｓｃＡＣｌｏｉｈｍ，ＭｌｏｉａｇｒｔＷａｇｒｔｈｍｎＥｘａｇｒｔａｄＢｌｏｈｍ，ｈｅｐａｔｒｉｔｔｎｅ
预处理时间在内ＡＣ算法的总时间复杂度是Ｏ（ｎ，中Ｍ＋）其
为所有模式串的长度总和。
１２．ＷＭ算法
多个模式串Ｐ，，，，巾ｋ为模式串的个数。＝时， … 其ｋｌ
即为单模式匹配。式串的长度为ｍ即模【，，】１ｌ … ｍ，（ ≤
多模式匹配算法在很多领域都有重要应用，拼写检查、如
个模式串的长度无关，无论模式串Ｐ是否出现在中，中的每个字符都必须输入状态机巾，以无论是最好情况还是所最坏情况，Ｃ算法模式匹配的时间复杂度都是Ｄ（）包括Ａｎ，