基于字符频率的字符串模式匹配算法的研究

合集下载

一种高效的多模式字符串匹配算法

ＸＵＪｉａ．ｍｉｎｇ＇＇ｖ，ＬＩＸｉａｏｄｏｎｇ，ＪＩＮＪｉａｎＣｈｉｎａＩｎｔｅｍｅｔＮｅｔｗｏｒｋＩｎｆｏｒｍａｔｉｏｎＣｅｎｔｅｒ，Ｂｅｉｊｉｎｇ１００１９０，Ｃｈｉｎａ；
文献标识码：Ａ
中图分类号：ＴＰ３０１．６
种高效的多模式字符串匹配算法
许家铭１，２，３Ｊ李晓东，金健，马盈
（１．中国互联网络信息中心，北京１００１９０；２．中国科学院计算机网络信息中心，北京１００１９０；３．中国科学院大学，北京１００１９０；４．东北师范大学理想信息技术研究院，长春１３０１１７）
ｐｅｒｆｏｍｒｍｕｌｔｉｐｌｅｐａｔｔｅｎｓｒｍａｔｃｈｉｎｇｉｎａｓｔｒｉｎｇｉｓｐｒｏｐｏｓｅｄｏｎｔｈｅｃｏｎｃｅｐｔｏｆＦａｎ — Ｓｕ（ＦＳ）ａｌｇｏｒｉｔｈｍ．Ｔｏｒｅｄｕｃｅｔｈｅｎｕｍｂｅｒｏｆｃｏｍｐａｒｉｓｏｎｓ，
４．ＩｄｅａｌＲｅｓｅａｒｃｈＩｎｓｔｉｔｕｔｅｏｆＩｎｆｏｍａｒｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，ＮｏｒｔｈｅａｓｔＮｏｍａｒｌＵｎｉｖｅｒｓｉｔｙ，Ｃｈａｎｇｃｈｕｎ１３０１１７，Ｃｈｉｎａ）

串的模式匹配算法

串串（String）又叫做字符串，是一种特殊的线性表的结构，表中每一个元素仅由一个字符组成。

随着计算机的发展，串在文字编辑、词法扫描、符号处理以及定理证明等诸多领域已经得到了越来越广泛的应用。

第一节串的定义和表示1、串的逻辑结构定义串是由零个到任意多个字符组成的一个字符序列。

一般记为：S=’ a1a2a3……a n’(n>=0)其中S为串名，序列a1a2a3……a n为串值，n称为串的长度，我们将n=0的串称为空串(null string)。

串中任意一段连续的字符组成的子序列我们称之为该串的子串，字符在序列中的序号称为该字符在串中的位置。

在描述中，为了区分空串和空格串(s=‘’)，我们一般采用来表示空串。

2、串的基本操作串一般包含以下几种基本的常用操作：1、length(S)，求S串的长度。

2、delete(S,I,L)，将S串从第I位开始删除L位。

3、insert(S,I,T)，在S的第I位之前插入串T。

4、str(N,S)，将数字N转化为串S。

5、val(S,N,K)，将串S转化为数字N；K的作用是当S中含有不为数字的字符时，K记录下其位置，并且S没有被转化为N。

3、串的储存结构一般我们采用以下两种方式保存一个串：1、字符串类型，描述为：const n=串的最大长度type strtype=string[n]这里由于tp的限制，n只能为[1..255]。

在fp或者delphi中，我们还可以使用另外一种类型，描述为：const n=串的最大长度type strtype=qstring[n]这里的n就没有限制了，只要空间允许，开多大都可以。

2、数组来保存，描述为：const n=串的最大长度type strtype=records:array[1..n] of char;len:0..n;end;第二节模式匹配问题与一般的线性表不同，我们一般将串看成一个整体，它有一种特殊的操作——模式匹配。

串的模式匹配问题实验总结（用C实现）

串的模式匹配问题实验总结（用C实现）第一篇：串的模式匹配问题实验总结(用C实现)串的模式匹配问题实验总结1实验题目：实现Index(S,T,pos)函数。

其中，Index(S,T,pos)为串T在串S的第pos个字符后第一次出现的位置。

2实验目的：熟练掌握串模式匹配算法。

3实验方法：分别用朴素模式匹配和KMP快速模式匹配来实现串的模式匹配问题。

具体方法如下：朴素模式匹配：输入两个字符串，主串S和子串T，从S串的第pos个位置开始与T的第一个位置比较，若不同执行i=i-j+2；j=1两个语句；若相同，则执行语句++i;++j;一直比较完毕为止，若S中有与T相同的部分则返回主串（S字符串）和子串（T字符串）相匹配时第一次出现的位置，若没有就返回0。

KMP快速模式匹配：构造函数get_next(char *T,int *next)，求出主串S串中各个字符的next值，然后在Index_KMP(char *S,char *T,int pos)函数中调用get_next(char *T,int *next)函数并调用next值，从S串的第pos 位置开始与T的第一个位置进行比较，若两者相等或j位置的字符next值等于0，则进行语句++i;++j;即一直向下进行。

否则，执行语句j=A[j]；直到比较完毕为止。

若S中有与T相同的部分则返回主串（S字符串）和子串（T字符串）相匹配时第一次出现的位置，若没有就返回04实验过程与结果：（1）、选择1功能“输入主串、子串和匹配起始位置”，输入主串S：asdfghjkl, 输入子串T：gh,输入pos的值为：2。

选择2功能“朴素的模式匹配算法”，输出结果为 5；选择3功能“KMP快速模式匹配算法”，输出结果为 5；选择0功能，退出程序。

截图如下：（2）、选择1功能“输入主串、子串和匹配起始位置”，输入主串S：asdfghjkl, 输入子串T：wp, 输入pos的值为：2。

串匹配BM算法KMP算法BF算法

串匹配BM算法KMP算法BF算法串匹配算法是一种用于在一个主串中查找一个子串的方法。

主串是一个较大的字符串，而子串是一个较小的字符串。

串匹配算法的目的是在主串中找到子串的出现位置或者确定子串不在主串中出现。

三种常见的串匹配算法是BF算法（Brute Force算法），KMP算法（Knuth-Morris-Pratt算法）和BM算法（Boyer-Moore算法）。

1. BF算法（Brute Force算法）：BF算法是最简单直观的串匹配算法，也是最基础的算法。

它的思想是从主串的第一个字符开始，逐个与子串进行匹配，如果子串中的所有字符都与主串中的字符相等，则匹配成功；否则，主串向后移动一个位置，子串从头开始重新匹配，直到找到匹配或主串结束。

BF算法的时间复杂度是O(n*m)，其中n是主串的长度，m是子串的长度。

在最坏情况下，需要完全比较所有字符。

2. KMP算法（Knuth-Morris-Pratt算法）：KMP算法是一种改进的串匹配算法，它利用已经匹配过的部分信息来避免不必要的字符比较，从而提高匹配效率。

KMP算法的核心思想是构建一个next数组，该数组存储了在子串中，在一些字符之前具有相同前缀和后缀的最大长度。

KMP算法在匹配过程中，主串和子串的指针分别从头开始遍历。

如果当前字符匹配成功，则两个指针同时后移；如果匹配失败，则利用next 数组的信息将子串的指针向后移动到一个合适的位置继续匹配。

KMP算法的时间复杂度是O(n+m)，其中n是主串的长度，m是子串的长度。

它通过构建next数组，避免了不必要的字符比较，提高了匹配效率。

3. BM算法（Boyer-Moore算法）：BM算法是一种基于启发式的串匹配算法，它通过利用模式串的特点，在匹配过程中跳跃性地移动主串的指针，从而提高匹配效率。

BM算法的核心思想是从模式串的末尾到开头进行匹配，并根据不匹配字符的位置进行跳跃。

BM算法分为两个主要步骤：坏字符规则和好后缀规则。

一种基于子串识别的多模式串匹配算法

多模式串匹配算法广泛应用于网络安全的众多领域，网对
０引言
串匹配是计算机科学领域的经典问题之一，所谓串匹配，就
络安全应用系统的性能起着决定性作用。典型应用包括：入侵
检测／防御系统（Ｄ／Ｐ）反病毒和反垃圾邮件检测（ＶＩＳＩＳ、Ａ／是给定一组特定的字符串集合Ｐ＝｛ ’Ｐ，，｝对于任Ｐ， … Ｐ ’ ，
ＨｅＨｕｍｉ＇ｉｎ，
ＬｕＹａｂｎ，ＴｎＪａｌｎ。Ｇｕｉ・ｉｎｉｇ ’。ａｉｎｏｇ，。ｏＬ
（ｎｔｕｅｏｏｐｔｇＴｃｎｌｙｈｎｓＡａｅｙｏｃｎｅ，ｅｉ０１０ｈｎＩｓｔｔｆＣｍｕｉ０９，ＣｉｉｎｈｇｅｆＳｅｓｊｇ１ａ）
）ｗｉｈｉｓｐｒｏｈｃｓｕｅｒｉ
ｔｓｂｔｎｅｏｎｔｎｂｓｄｍｔｉｌｏｔｍ，ＢＭ，ｗｏｅｓａｅｃｍｌｉｓＯ（ｒ ∑ ｌｇｍｒ；ｔｅａｏｔｍ’ ｖｒｅｔｅｏｕｓｉｇｒｇｉｏａｅａｈｎａｇｒｈｒｃｉｃｇｉＯｈｓｐｃｏｐｅｔｉｘｙｍ￣）ｈｌｒｈｓａｅａｉＩｌｏｇｉｇｍ
何慧敏刘燕兵
（中国科学院研究生院
谭建龙。郭莉
北京１０９）０１０
北京１０４００９）
’ 中国科学院计算技术研究所（
（信息内容安全技术国家工程实验室
北京１０９）０１０
摘
要
多模式串匹配算法是网络内容过滤系统的核心技术。巨大的存储空间开销是制约多模式匹配串算法应用的瓶颈之一。

孙子算法总结

孙子算法总结引言孙子算法，又称字符串匹配算法，是一种用来在一个文本字符串中查找一个较短的模式字符串出现的位置的算法。

孙子算法的核心思想是通过对模式字符串和文本字符串进行比较，找到匹配的位置。

本文将对孙子算法的原理、实现和应用进行总结和分析。

原理1.首先，在模式字符串和文本字符串中，从左到右扫描每个字符。

2.当找到模式字符串与文本字符串的第一个字符匹配时，进入匹配阶段。

3.在匹配阶段，比较模式字符串和文本字符串中对应位置的字符。

4.如果字符匹配，则继续比较下一个字符；如果字符不匹配，则返回到第一步，查找下一个可能的匹配位置。

5.当模式字符串完全匹配时，返回匹配位置的索引值。

实现下面是孙子算法的实现思路：def find_pattern(text, pattern):n = len(text)m = len(pattern)i =0j =0while i < n:if text[i] == pattern[j]:i +=1j +=1else:i = i - j +1j =0if j == m:return i - jreturn-1应用孙子算法在实际开发中有着广泛的应用，特别是在字符串匹配和文本搜索方面。

以下是一些使用孙子算法的应用场景：字符串匹配在一个长文本中查找某个特定的短字符串，例如在一个文章中统计某个关键词的出现次数。

通过使用孙子算法，可以快速找到匹配位置。

文件搜索在文件系统中查找指定的文件名或者文件内容。

孙子算法可以用于搜索文件系统中的文件名或者文件内容的匹配情况，帮助用户快速定位所寻找的文件。

DNA序列匹配在生物学研究中，常常需要在DNA序列中查找特定的基因序列。

孙子算法可以在DNA序列中高效地进行匹配，从而辅助生物学研究的进行。

总结孙子算法是一种高效的字符串匹配算法，能够在文本字符串中快速查找模式字符串的匹配位置。

通过对模式字符串和文本字符串的比较，孙子算法可以快速找到匹配的位置，并应用于各种实际场景中。

多模式串匹配算法详解

多模式串匹配算法详解随着计算机技术的不断发展，我们的生活已经离不开计算机了。

计算机技术也在不断完善和发展，其中算法是计算机科学的基础之一。

在计算机科学中，字符串匹配是一个非常重要的问题，而多模式串匹配算法就是解决字符串匹配问题的一种方法。

一、什么是多模式串匹配算法多模式串匹配算法是指在一个文本串中查找多个模式串的匹配位置。

举个例子，如果我们想在一段英文文章中查找“apple”、“banana”和“pear”这三个单词的位置，那么就可以使用多模式串匹配算法。

在这个例子中，文本串就是整篇文章，而“apple”、“banana”和“pear”就是模式串。

二、常见的多模式串匹配算法1.基于Trie树的多模式串匹配Trie树是一种树形数据结构，它是一种有序树，用于保存关联数组，其中键通常是字符串。

Trie树的基本思想是将字符串拆分成单个字符，然后构建一棵树，使得每个节点代表一个字符，从根节点到叶子节点组成的字符串就是一个完整单词。

构建出Trie 树之后，就可以使用类似深度优先搜索的方法，在Trie树上查找所有匹配的字符串。

2.基于AC自动机的多模式串匹配AC自动机是一种自动机算法，它是基于Trie树的改进。

AC自动机可以在O(n)的时间复杂度内找出文本串中所有出现在模式串集合中的模式串出现的位置。

就算是在模式串集合非常大的情况下，AC自动机依然可以保持良好的时间复杂度。

所以AC自动机是一种非常高效的多模式串匹配算法。

三、多模式串匹配算法的应用多模式串匹配算法的应用非常广泛，下面列举一些常见的应用场景。

1.搜索引擎搜索引擎需要快速地查找网页中的关键词，并列出所有相关的网页。

多模式串匹配算法可以帮助搜索引擎实现这个功能。

2.文本编辑器文本编辑器需要在用户输入时提示相关的自动补全单词和拼写纠错。

多模式串匹配算法可以根据用户输入的前缀，返回与之最相似的单词。

3.网络安全网络安全中常常需要检测恶意代码和病毒。

多模式串匹配算法可以帮助检测这些恶意代码和病毒。

串的两种模式匹配算法

串的两种模式匹配算法模式匹配(模范匹配)：⼦串在主串中的定位称为模式匹配或串匹配(字符串匹配) 。

模式匹配成功是指在主串S中能够找到模式串T，否则，称模式串T在主串S中不存在。

以下介绍两种常见的模式匹配算法：1. Brute-Force模式匹配算法暴风算法，⼜称暴⼒算法。

算法的核⼼思想如下：设S为⽬标串，T为模式串，且不妨设： S=“s0s1s2…sn-1” ， T=“t0t1t2 …tm-1” 串的匹配实际上是对合法的位置0≦i≦n-m依次将⽬标串中的⼦串s[i…i+m-1]和模式串t[0…m-1]进⾏⽐较：若s[i…i+m-1]=t[0…m-1]：则称从位置i开始的匹配成功，亦称模式t在⽬标s中出现；若s[i…i+m-1]≠t[0…m-1]：从i开始的匹配失败。

位置i称为位移，当s[i…i+m-1]=t[0…m-1]时，i称为有效位移；当s[i…i+m-1] ≠t[0…m-1]时，i称为⽆效位移。

算法实现如下：（笔者偷懒，⽤C#实现，实际上C# String类型已经封装实现了该功能）1public static Int32 IndexOf(String parentStr, String childStr)2 {3 Int32 result = -1;4try5 {6if (parentStr.Length > 1 && childStr.Length > 1)7 {8 Int32 i = 0;9 Int32 j = 0;10while (i < parentStr.Length && j < childStr.Length)11 {12if (parentStr[i] == childStr[j])13 {14 i++;15 j++;16 }17else18 {19 i = i - j + 1;20 j = 0;21 }22 }23if (i < parentStr.Length)24 {25 result = i - j;26 }27 }28 }29catch (Exception)30 {31 result = -1;32 }33return result;34 } 该算法的时间复杂度为O(n*m) ，其中n 、m分别是主串和模式串的长度。

基于GPU的串匹配算法研究综述

2012年8月湖北第二师范学院学报Aug．2012第29卷第8期Journal of Hubei University of EducationVol．29No.8基于GPU 的串匹配算法研究综述孙延维1，2，张慧2（1．重庆邮电大学计算机科学与技术学院，重庆400065；2．湖北第二师范学院计算机学院，武汉430205）摘要：串匹配是一个非常经典的问题，本文通过回顾和分析GPU 的串匹配算法的国内外研究近况，提出了GPU 的串匹配算法的一些新的研究方向，特别是将一些编译解释性的工作放在GPU 上实现的思想。

关键词：GPU ；GPGPU ；串匹配；正则表达式；编译收稿日期：2012－06－15中图分类号：TP301．6文献标识码：A文章编号：1674-344X （2012）08-0025-03基金项目：2010湖北省教育厅科学技术研究重点项目（D2903002）作者简介：孙延维（1979－），男，湖北潜江人，讲师，研究方向为嵌入式、GPGPU 。

张慧（1971－），女，湖北武汉人，副教授，研究方向为网络应用、嵌入式。

1引言近年来GPU （Graphic Process Unit 图形处理单元）已经具备了实现大规模快速计算的编程能力，NVIDA 公司提出的计算统一设备架构（Computer UnifiedDevice Architecture ，简称CUDA ）技术就是这方面的杰出代表。

CUDA 编程给人们一种新的理念，人们可以将GPU 高速并行处理能力广泛应用于数字图像处理算法、石油勘探、天气预测、分子动力学模拟等领域，大幅度提高程序运算速度。

GPGPU （General －Purpose computing on Graphics Processing Units ）就是基于GPU 的通用计算。

目前国内外关于CUDA 的研究主要集中于算法的设计和CUDA 优势的阐明［1］。

字符串匹配在计算机病毒码匹配、信息检索、数据挖掘和生物基因技术领域中都有广泛的应用。

ratcliff-obershelp算法原理

ratcliff-obershelp算法原理Ratcliff-Obershelp算法是一种字符串匹配算法，它可以有效地识别两个字符串之间的相似度。

在计算机科学领域，字符串匹配是一项关键的任务，例如在电子邮件过滤、搜索引擎等方面都需要使用字符串匹配算法。

本文将详细介绍Ratcliff-Obershelp算法的原理。

1. 原理Ratcliff-Obershelp算法的核心思想是计算两个字符串之间的最长公共子序列（Longest Common Subsequence, LCS）。

LCS是指两个字符串中具有相同顺序的最长的字符串序列，这个子序列不需要是连续的。

字符串“ABCDGH”和“AEDFHR”的LCS是“ADH”。

为了计算LCS，Ratcliff-Obershelp算法使用了递归和动态规划的技术。

具体来说，该算法对比字符串中的每个字符，并根据实现递归的方式，逐步计算两个字符串的LCS。

随着算法的执行，将建立一个二维矩阵，用于保存LCS的长度和LCS中字符的匹配情况。

Ratcliff-Obershelp算法还需要计算相似性分数（similarity score），以便确定两个字符串之间的相似程度。

该算法采用了一个特定的相似性计算公式。

该公式是基于LCS 长度和两个字符串中未匹配字符的数量计算的。

在计算相似性分数时，该算法将两个字符串的长度和字符匹配数作为输入，并返回与输入字符串相应的分数。

2. 算法实现（1）计算最长公共子序列该算法的第一步是计算最长公共子序列。

为此，需要使用一个动态规划解决方案，构建一个二维矩阵，其中每个元素代表两个字符串之间的LCS长度。

假设有两个字符串s1和s2。

当i = 3，j = 4时，需要计算的LCS为“YX”。

在矩阵中，LCS的长度为2。

在这种情况下，矩阵将如下所示：0 0 0 0 0 00 0 0 0 0 00 0 0 1 0 00 0 0 0 2 00 0 0 0 0 20 0 0 0 0 0（2）计算相似性分数similarity score = 2 * LCS length / (s1 length + s2 length)LCS length是最长公共子序列的长度，s1 length和s2 length分别是输入字符串s1和s2的长度。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

因此，模式匹配性能的提高成为解决ＩＤＳ的关键技
１几种经典的模式匹配算法
设文本串Ｔ＝Ｔ。 ……Ｔ，ｎ为文本串的长度；模式串Ｐ＝Ｐ。 … …Ｐ．．，ｍ为模式串的长度，（ｎ＞＞ｍ）；Ｔ和Ｐ都建立在有限字符集上，大小为
０引言
网络带给人们方便的同时也存在安全隐患，而入侵检测系统（ＩＤＳ）也越来越广泛地应用到网络系统中，因为它是提高网络系统安全性的重要技术之一。目前，许多ＩＤＳ都是依靠模式匹配技术来进行入侵检测的，但是，在进行入侵检个ＩＤＳ总处理时间的３０％，对于密集型的流量，这一消耗达到８０％。
关键词：字符频率；模式匹配；ＩＢＭ算法；Ｓｕｎｄａｙ算法中图分类号：ＴＰ３９３文献标识码：Ａ文章编号：１００９ — ０１３４（２ｏｌ３）０９（上）一００１０－０５
Ｄｏｉ：１０．３９６９／Ｊ．ｉｓｓｎ．１００９－０１３４．２０１３．０９（Ｉ－）．０３
串，各种算法各显神通，各有各的寻找方法，在此简要介绍４种经典匹配算法。ＢＦ算法是效率最低的算法，从左到右进行
匹配。首先将Ｔ［１】与Ｐ［１】进行比较，若不同，就将Ｔ【２】与Ｐ【ｌ１进行比较，… … ，否则从Ｔ［２１开始与
ｌ
勺化
麟
ｊ
巫喜红，凌
ＷＵＸｉ — ｈｏｎｇ。．ＬＩＮＧＪｉｅ
基于字符频率的字符串模式匹配算法的研究
Ｒｅｓｅａｒｃｈｏｆｔｈｅｓｔｒｉｎｇｐａｔｔｅｒｎｍａｔｃｈｉｎｇａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｃｈａｒａｃｔｅｒｓｆｒｅｑｕｅｎｃｙ
（１．嘉应学院计算机学院，梅州５１４０１５；２．广东工业大学计算机学院，广州５１００９０）
摘
要：本文分析了经典的ＩＢＭ算法Ｅ１］Ｓｕｎｄａｙ算法，根据字符频率的特点提出了一种新的模式匹配算法ＣＦＰＭ。ＣＦＰＭ算法确定模式串中字符频率最低的关键字符后，扫描文本串中该关键字符的位置并存储，最后根据这些位置信息进行快速地匹配，匹配方式是以关键字符为始点先匹配左部分再匹配右部分。为了验证ＯＦＰＭ算法的性能，在相同的文本串和模式串情况下，从匹配移动次数和匹配的字符个数两方面对ＯＦＰＭ算法进行实验。实验结果证明，由于ＣＦＰＭ算法能够很大限度地跳过坏字符，大大减少了匹配次数和字符比较个数，有效地加快了匹配速度，其效率优于ＩＢＭ、Ｓｕｎｄａｙ等算法。
Ｏ。
对于文本串Ｔ和模式串Ｐ，在Ｔ中寻找等于Ｐ的
子串，如果在Ｔ中存在等于Ｐ的子串，则称匹配成
功，函数值返回为Ｐ中第一个字符相等的字符在主
串Ｔ中的序号，否则称为匹配失败，这个搜索过
程就是模式匹配。至于如何在Ｔ中寻找等于Ｐ的子
术。目前，国内外对于模式匹配算法已有不少的研究成果，比如典型的单模式算法有ＢｒｕｔｅＦｏｒｃｅ算法、Ｋｎｕｔｈ — Ｍｏｒｒｉｓ — Ｐｒａｔｔ（ＫＭＰ）算法、Ｂｙｏｅｒ — Ｍｏｏｒｅ（ＢＭ）算法、Ｓｕｎｄａｙ算法，多模式算法主要有Ａｈｏ＿Ｃｏｒａｓｉｃｋ（ＡＣ）算法、Ｗｕ＿Ｍａｎｄｅｒ算法。这些算法在实际应用中忽略了字符串的特征，没有实际考虑到字符的频率情况，为此，本文提出了
Ｐ【１］进行比较，继续开始下一趟的比较，重复上述
过程。
利用字符统计特征的算法，在扫描过程中利用某
个频率字符去进行匹配，跳过了一系列无用的字符，从而提高匹配速度。
ＫＭＰ算法是由ＢＦ改进后不产生回溯的一种算法，每当匹配过程中出现字符串比较不等时，不
收稿日期：２０１３－０４－１７基金项目：国家十二五科技支撑计划项目（２０１２ＢＡＨ２７Ｆ０５）；广东省自然科学基金项目（￥２０１２０２００１１０７１）；广东省战略性新兴产业核心技术攻关项目（２０１２Ａ０１０７０１００４）作者简介：巫喜红（１９７５一），女，广东丰顺人，副教授，硕士，主要从事算法理论和信息安全等工作。［１０１第３５卷第９期２０１３－０９（上）