一种多维并行报文分类算法

合集下载

基于规则集划分的多决策树报文分类算法

基于规则集划分的多决策树报文分类算法作者：马腾陈庶樵张校辉田乐来源：《计算机应用》2013年第09期摘要：为克服决策树算法处理高速网络、大容量规则集下的报文分类问题时内存使用量大的弊端，提出一种基于规则集划分的多决策树报文分类算法。

在保证规则子集数量可控的前提下，采用启发式算法将规则集划分为有限个规则子集，最大限度分离交叠规则；提出两级级联决策树结构，降低决策树深度以减少规则查找时间。

理论分析表明，该算法空间复杂度较传统单决策树算法大幅降低。

仿真结果表明，该算法的内存使用量比目前空间性能最好的EffiCuts算法减少了30%，且维度可扩展性更好。

关键词：报文分类；规则集划分；多决策树；内存使用量；大容量规则集中图分类号：TP393.0文献标志码：A0引言报文分类是网络应用领域的关键技术之一。

目前业界的解决方案主要有两种：基于硬件的三态内容可寻址寄存器（Ternary Content Addressable Memory，TCAM）和基于随机存取存储器（Random Access Memory，RAM），它们均可以线速处理报文。

随着链路带宽不断增加、网络应用日益多元化，分类规则集呈现出新的特点：容量增大、规则维数增多、范围规则大量出现，使得基于TCAM的多域报文分类算法举步维艰（TCAM不宜处理范围规则）[1-3]，而运行于可编程门阵列（Field Programmable Gate Array，FPGA）+RAM架构的决策树算法在规则集容量、规则维数方面扩展性强，且适合处理范围规则，成为研究热点。

规则集中的规则在某些域相互交叠，使得这类算法在预处理阶段构建立决策树时，不可避免出现规则复制，带来严重的存储空间消耗。

受限于高速存储器的容量，高速网络、大容量规则集下的报文分类算法必须解决内存消耗量大的问题。

为此在预处理阶段需要对规则集进行合适的划分，使得规则子集内部的规则相互交叠的概率大幅降低，从而达到抑制规则复制、减少算法内存使用量的目的。

IP路由查找和报文分类模型研究

Ｉ由查找和报文分类作为路由器转发能力和提供高性能区分服务能力的关键因素，当前路由器转发性Ｐ路是
能乃至整个网络性能的主要瓶颈。文章以Ｉ由查找和报文分类问题为研究对象，空间几何的角度探究其本质，Ｐ路从建立了
相应数学模型ＭＤＭ，以此为基，Ｃ并讨论了各类搜索算法在Ｉ由查找和报文分类问题求解的优缺点，Ｐ路为研究和设计高
ＷａｇＹｉｎｎ
（ｖｌｏｕｉｇＴｅｈｏｇｓｉｔ，ｅｉ１０４）ＮａａＣｍｐｔｃｎｌｙＩｔｕｅＢｉｎｎｏｎｔｊｇ０８１
ＡｂｓｒｃＡｓＩｏｔｎｏｕｎａｋｔｃａｓｆａｉｎａｇｒｔｍｓａｅａｈｅｏｉｉｎｏｈｅｗｏｋ，ｔｅｏｔａｔＰｒｕｉｇｌｋｐａｄｐｃｅｌｓｉｃｔｌｏｉｏｉｏｈｒｔｔｅｋｙｐｓｔｏｆｔｅｎｔｒｓｈｙｎｔｏｌｒｖｄｈａｉｕｐｒｓｆｒｔｅＩｔｒｅ，ｂｔａｓａｅｓｒｎｆｕｎｅｎｉｓｐｒｏｍａｃｎｕｃｉｎｌｉｓｎｙｐｏｉｅｔｅｂｓｃｓｐｏｔｏｈｎｅｎｔｕｌｏｈｖｔｏｇｉｌｅｃｓｏｔｅｆｒｎｅａｄｆｎｔａｉｅ．Ｔｈｓｎｏｔｉ
的可能解，小候选解空间的大小，在候选解空缩并间中重复此过程，直到最终找到正确的解。不但能够对应逻辑意义上的在搜索空间中寻找解的问题，

基于IPv6防火墙多维IP分类算法论文

基于IPv6防火墙的多维IP分类算法摘要：本文首先介绍了目前几种主要的ip分类算法。

然后按ipv6环境对ip分类算法的需求设计实现了一种ipv6环境下的支持范围匹配的多维ip分类算法，介绍其基本思想，数据结构，预处理过程以及ip分类过程。

最后分析了该算法在ipv6环境下的适用性。

关键词：ipv6；防火墙；ip分类；多维ip分类算法中图分类号：tp393.03 文献标识码：a 文章编号：1007-9599 (2011) 22-0000-01multi-dimensional ip classification algorithm on ipv6 firewallluo wei(network support center of sichuan branch,china tietong,chengdu 610081,china)abstract:this paper describes the current of several major ip classification algorithm.then press the ipv6 environment,the demand for ip classification algorithm designed and implemented an ipv6 environment to support multi-dimensional range matching ip classification algorithm,introduce the basic ideas,data structures,process and ip pre-classification process.finally,an analysis of the algorithm applicability in ipv6 environment.keywords:ipv6;firewall;ipclassification;multidimensional ip classification algorithm ipv6是用来代替现行的ipv4协议的一种新的ip协议。

多维数据分类扩散模型代码-概述说明以及解释

多维数据分类扩散模型代码-概述说明以及解释1.引言1.1 概述多维数据分类方法是一种在数据科学和机器学习领域广泛应用的技术，它可以用于将复杂多维数据划分为不同的类别或群组。

随着大数据时代的到来，多维数据的处理和分析变得越来越重要。

在传统的数据分类方法中，通常只考虑数据的一个或少数几个维度来进行分类。

但是，现实世界中的数据往往是复杂、多样的，包含了大量的维度信息。

例如，在金融领域，市场数据通常包含了股票价格、交易量、市值等多个维度。

传统的分类方法很难充分利用这些多维度的信息，从而导致分类性能的下降。

多维数据分类方法旨在解决这个问题，它将多维数据的所有维度信息都考虑在内，从而更准确地进行分类。

这些方法通常基于数据的特征提取和模式识别技术，通过对数据的各个维度进行综合分析，得出更加准确和可靠的分类结果。

在本文中，我们将介绍多维数据分类的定义、方法和应用。

首先，我们将给出多维数据分类的基本定义，包括其目标和要解决的问题。

然后，我们将介绍一些常用的多维数据分类方法，包括基于统计学、机器学习和人工智能等领域的方法。

最后，我们将通过一些实际应用的案例，展示多维数据分类方法在不同领域的实际应用效果。

通过本文的阅读，读者将能够了解多维数据分类方法的基本原理和技术，并能够应用这些方法解决实际的分类问题。

同时，我们也将讨论多维数据分类方法的一些挑战和未来发展方向，以期为相关研究和实践提供一定的参考和借鉴价值。

1.2文章结构文章结构部分包括了本文的主要章节与子章节的概述，以及章节内容的简要说明。

本文主要按照以下结构组织：2. 正文2.1 多维数据分类2.1.1 定义2.1.2 方法2.1.3 应用2.2 扩散模型2.2.1 理论基础2.2.2 模型构建2.2.3 模拟实验2.3 代码2.3.1 编程语言选择2.3.2 算法实现2.3.3 示例代码在本文中，我们将首先介绍多维数据分类的概念和定义，然后介绍多维数据分类的常用方法。

多维包分类算法在防火墙中的应用

隐藏，据加密技术等。数
计算机应用与软件
从图１以看到，可通过在两个网络之间安装防火墙和正确
配置后可以达到以下目的：
２１卑０１
２）规则与元组的维数相同，将规则的第个字段投影到
轴上，轴上有 ≤ ２ｎ＋ｚ个不相交的区间产生。３）设定折叠向量Ｐ的长度为Ｐｂｔ，ｉ在轴上为每个区间ｔｓ
访问。防火墙是目前用来维护和实现网络安全的重要技术。
例如，我校校园网络作为学校重要的教学设施，当着学院担行政管理、教学科研、专业建设、生就业和人才交流等许多角招色，单位网络拓扑结构如图１所示。面临日益严峻的网络安全
ＡｂｔａｔｓｒｃＡｏｇｗｔｈｌｂｌａｉｎｏｔｒｅｐｌａｉｎ，ｔｅａｔｎａｔｒｂｅｆｔｅｓｃｒｔｅｗｒｎｏｍａｉｎａｄＳｉｈｖｌｎｉｔｅｇｏａｉｔｆＩｅ＇ｔａｐｉｔｈｓｏｎｎｃｏｈｔｄｎｏｌｍｓｏｅｕｙｏｎｔｏｋｉｆｒｔｎＯＯｌａｅｅｐｈｉｆｏ源自Ｆ６ｌ１十０｛
发，有效降低了网络性能的瓶颈。随着网络中信息资源指数级的增长，对包分类技术的研究已经成为计算机网络安全领域的
重要内容。
表２元组表
Ｒｌ２，］［２
Ｆ，２ｌＦ
Ｒ［，］２１１
ｈｗｖｒａｅｔｄｔｅｕｅｓｏｈｉｔｓｏｅｓｆｔｎｅｉｂｌｙｏｎｅｎｔｓｒｉｅｎｈｉｕｅｏ．ＡｔｐｅｅｔｈｉｗｌｔｃｎｌｇｏｅｅｆｃｅｈｓｒｎｔｅｒｒｔｆｔａｅｙａｄｒｌｉｔｆＩｔｒｅｅｖｃｓａｄｔｅｒｓｆｉｕｈａｉｔｒｓｎｅｆｅａｌｅｈｏｏｙｔｒｉｔｅｉｏｔｎｅｕｔａｓｉｅｌｇｗｔｈｒｂｅｏｅｗｏｋｅｕｔ，ｏｈａｉｏｈｎｒｄｃｉｎｏｉｅｌｔｃｎｌｇｓｈｍｐｒｔｓｃｒｙｍｅｎｎｄａｉｉｔｅｐｏｌｍｆｎｔｒｓｃｒｙａｉｎｈｉｎｔｅｂｓｓｆｔｅｉｔｏｕｔｆｗａｌｅｈｏｏｏｆｒｙｃａｓｆａｉｎｎｔｉａｅｗｈｖｔｄｅｔｅｌｓｉｃｔ，ｉｈｓｐｐｒｅａｅｓｕｉｄｈｍａｎｄａｆｔｅＡＦＶｌｏｔｍ．ＴｓｌｅｈｐｏｌｍｆｔｉｌｏｉｍｔａｎｉｏｉｉｅｏｈＢａｇｒｈｉｏｏｖｔｅｒｂｅｏｈｓｇｒｈａｔｈｔｉｍｕｔｉｎｉｎｌｌｉｒｒｔａｇｕｅｔｍｉｈｐｅｒｔｅｐｏｌｍｉｅｆｒｎｅｅｃｓｉｅｃｎｕｔｎｗｋｈｌｄｍｅｓｏａｅｌａｙｗｉｌｒｅｎｍｂｒｉｉｕｒｂｈｇｔａｐａｈｒｂｅｏｔｆｍｅｐｒｏｍａｃｘｅｓｖｏｓｍｐｉ，ｅｍａｅｔｅｏ

基于IPv6防火墙的多维IP分类算法

基于IPv6防火墙的多维IP分类算法罗蔚【期刊名称】《计算机光盘软件与应用》【年(卷),期】2011(000)022【摘要】This paper describes the current of several major IP classification algorithm.Then press the IPv6 environment,the demand for IP classification algorithm designed and implemented an IPv6 environment to support multi-dimensional range matching IP classification algorithm,introduce the basic ideas,data structures,process and IP pre-classification process.Finally, an analysis of the algorithm applicability in IPv6 environment.%本文首先介绍了目前几种主要的IP分类算法。

然后按IPv6环境对IP分类算法的需求设计实现了一种IPv6环境下的支持范围匹配的多维IP分类算法，介绍其基本思想，数据结构，预处理过程以及IP分类过程。

最后分析了该算法在IPv6环境下的适用性。

【总页数】1页(P116-116)【作者】罗蔚【作者单位】铁通四川分公司网络支撑中心,成都610081【正文语种】中文【中图分类】TP393.03【相关文献】1.一种基于IPv6防火墙的多维IP分类算法 [J], 罗蔚;刘乃琦2.基于IPv6协议的IPSec与防火墙协同工作设计与实现 [J], 李力;袁新治;郑超美;吴芳宇3.基于IPv4/IPv6过渡的防火墙构建 [J], 陈江;单桂军4.基于IPv6/IPv4环境下防火墙的设计与实现 [J], 赵婷婷;陈小春;杨娟5.基于IPV4/IPV6的防火墙系统浅谈 [J], 周文虎;刘淑芬;杨樱因版权原因，仅展示原文概要，查看原文内容请购买。

IPv6并行包分类算法的研究与设计的开题报告

IPv6并行包分类算法的研究与设计的开题报告一、选题背景随着互联网的快速发展和普及，IPv4地址已经逐渐不足以支撑网络的需求。

为了解决IPv4地址短缺的问题，IPv6作为协议的下一代标准已经被制定出来，并已经得到了广泛的应用和推广。

但是，正是因为IPv6地址的长度和表示方式与IPv4有很大不同，这对网络设备和路由器的处理能力提出了更高的要求。

为了更好地支持IPv6的路由和转发，研究和设计一种高效的IPv6并行包分类算法变得尤为重要。

二、研究内容本研究的主要内容是研究和设计一种高效的IPv6并行包分类算法。

具体来说，本研究将针对IPv6的特点，基于现有的IPv6包分类算法，探索并行算法的优化方向，提出一种既能满足高效性要求，又能够充分利用多核CPU性能的高效IPv6并行包分类算法。

三、研究方法本研究将采用以下研究方法：1. 文献综述：对目前IPv6并行包分类算法的研究成果进行综述和分析，了解该领域的研究现状，为本研究提供理论支持和借鉴。

2. 算法设计：基于IPv6的特点以及现有IPv6包分类算法，提出一种高效的IPv6并行包分类算法。

3. 算法实现：使用C++编程语言，利用多线程、SIMD等技术实现所提出的IPv6并行包分类算法，并进行性能测试。

4. 性能测试：设计测试用例，并在不同的网络环境下对所提出的IPv6并行包分类算法进行性能测试和比较，验证算法的有效性和高效性。

四、预期目标本研究旨在设计一种高效的IPv6并行包分类算法，既能够充分利用多核处理器的性能，又能够满足IPv6路由和转发的实际需求。

预期达到以下目标：1. 提出一种高效的IPv6并行包分类算法，单核性能和多核性能都能得到一定的提升。

2. 验证所提出的算法效果，并与现有算法进行性能比较，证明算法在实际应用中的高效性和可行性。

3. 在理论和应用方面都有一定的创新性和实际意义，提高IPv6路由和转发的效率，促进IPv6的快速发展。

五、研究意义IPv6并行包分类算法的高效性对于IPv6网络的发展有着至关重要的作用。

基于FPGA的报文数据分析模块的设计

基于FPGA的报文数据分析模块的设计FPGA（Field-Programmable Gate Array）是一种可编程逻辑设备，具有高度灵活的硬件配置能力，可以用于构建各种不同的数字电路。

在数据通信领域，报文数据分析是一项重要的任务，用于提取和分析从网络中传输的数据报文，以实现网络性能监测、故障排除等功能。

本文将介绍基于FPGA的报文数据分析模块的设计，包括设计目标、硬件架构、功能实现等方面。

希望通过本文的介绍，读者能够对基于FPGA的报文数据分析模块的设计有一个全面的了解。

首先，我们需要明确设计目标。

在设计过程中，我们的目标是实现一个能够高效地提取和分析报文数据的模块。

为了达到这个目标，我们需要考虑以下几个方面的问题：硬件资源利用率、数据处理速度、报文格式支持、功能扩展性等。

接下来，我们需要确定硬件架构。

基于FPGA的报文数据分析模块的硬件架构可以分为三个主要部分：报文接收部分、数据处理部分和报文输出部分。

报文接收部分负责接收从网络中传输的数据报文。

FPGA可以使用现有的网络接口模块，如以太网接口模块，来完成这一任务。

这些模块通常具有硬件协议栈和物理层接口，可以实现高速数据传输，并提供报文的数据链路层封装。

数据处理部分是整个模块的核心，负责对接收到的报文数据进行解析和处理。

在设计过程中，我们需要根据实际需求，选择合适的处理算法和数据结构。

例如，我们可以使用硬件形式的协议解析器来解析报文数据，并将解析后的结果存储在FPGA的内部存储器中。

为了提高处理速度，我们还可以使用流水线技术来并行处理多个报文。

报文输出部分负责将处理后的数据输出到外部设备或存储器中。

输出可以采用多种形式，例如，我们可以将处理结果通过以太网接口发送到上位机，或者将数据保存在SD卡或硬盘中。

为了提高输出效率，我们可以使用DMA（直接内存访问）技术来实现高速数据传输。

除了上述的主要硬件部分外，我们还可以考虑一些功能扩展部分。

例如，我们可以添加报文过滤功能，以便只处理特定类型的报文；我们可以添加报文统计功能，以便统计报文的数量、字节等信息；我们还可以添加报文分析功能，以便进行更深入的协议分析和故障排除。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

ｃｍｐｅｓｎｅｅｔｄｒｌｓｏａｈｄｍａｎａｄｒｏｇｎｉｅｅｆｒｌｓｒａｙｒｄｃｎｅｌｎｔｆｂｔｓｒｇｗｈｃｎｂｔｍａ，ｔｕｅｕｉｇｏｒｓｉｇｒｐａｅｕｅｎｅｃｏｉ，ｎｅｒａｚｄｓｔｏｅ，ｇｅｔｕｉｇｔｅｇｈｏｉｔｎｉｈｉｉｕｌｅｈｉｐｈｓｒｄｃｎｍｅｒｐｃｃｕａｃ．ＥｘｅｉｅｔｌｒｓｌｐｏｅｈａｈｍｏｙｓａｅｏｃｐｎｙｐｒｍｎａｅｕｔｒｖｓｔｔｔｅＣＢＰａｇｒｔｍｎｔｅｆｒｗａｌｅｖｒｎｎａｉｇ３％ｍｅｒｔａｅＢＶｌｏｉｈｉｅｌｎｉｏｍｅｔｓｖｎ５ｈｉｍｏｙｈｎｔｈａｇｒｔｍ，ａｉｇａｏｕ０ｔａｉａａｌｌｌｏｉｌｏｈｓｖｎｂｔ％ｈｎｔｂｔｒｌｇｒｔｉ６ｈｅｐｅａｈｍ，ｎｄｔｅａｇｒｔｍａｏｅｆｒｎｅｕｄｒａｃｓｏｔｏｉｔｎｖｒｍｅｔａｌｏｉｈｈｈｓａｇｏｄｐｒｏｍａｃｎｅｃｅｓｃｎｒｌｓｅｉｌｏｎｎ．
Ｍｕｔ— ｉｅｓｏａｒｌｌｃｅａｓｆｃｔｏｇｒｔｍｌｉｄｍｎｉｎｌＰａａｌｅＰａｋｔＣｌｓｉａｉｎＡｌｏｉｈｉ
ＷＡＮＧｂｇｔｎＩｎ－ｇｏ
（ｏｌｅｏｆｒｔｎＳｉｃｎｅｈｏｏｙＮａｊｇＵｎｖｒｉｆｅｏａｔｓａｄＡｔｎｕｉｓＮａｊｎ１０６ＣｉａＣｌｇｆｎｏｍａｏｃｅｅａｄＴｃｎｌｇ，ｎｉｉｅｓｙＡｒｎｕｉｎｓｏａｔ，ｎｉｇ２０１，ｈｎ）ｅＩｉｎｎｔｏｃｒｃ［ｓｒｃ］ｉｐｒｌｌＢｔｅｔｒＶ）ｎｇｅａｄＢｔｅｔｒＶ）ｌｏｉｍｓｒｅｓｒｐｅｅｔｔｅｏｅａａｌｌａｋｔｌｓｉｃｔｎＡｂｔａｔＢｔａａｌ，ｉＶｃｏ（ｅＢａｄＡｇｒｇｔｉＶｃｏ（ｅＡＢａｒｈｅｔｔｅｒｓｎａｉｆｈｒｌｃｅａｓａｏｇｔａｈｍｏｖｔｐｅｐｃｉｆｉ
定义１规则块）在规则集第ｊ１）（（≤ ≤５维上，将值相同的规则归并成一个规则块，规则块中记录规则的起点和终点、规则块覆盖的规则范围信息。定义２压缩率）假设有 Ⅳ条规则的规则集，经分块归并（后，在第．１）， ≤ ≤５维上形成Ｂ个规则块，定义Ｐ＝／（，ｊＢＮ，Ｐ（＜）Ｐ ≤１０称为该维的压缩率，Ｐ越小，压缩率越高。
ｍｅｒｓｇ，ｏｕｔｂｅｆｒｌｇｕｅｅｓｏｐｌａｉｎ．ｏａｄｅｓｔｉｉｕ，ｏｒｓｅｉＰｒｌｌＢＰｌｏｔｍｉｐｏｏｅ，ｂｍｏｙｕａｅｎｔｓｉｌｏａｅｒｌｓｓｔｆａｐｉｔｓＴｄｒｓｈｓｓｅＣｍｐｅｓｄＢｔａａｌ（ａｒｃｏｓｅＣ）ａｇｒｈｓｒｐｓｄｙｉ
１概述
报文分类是服务质量（ｕｌｙｏｅｖｃ，ｏ）ＱａｔｆｒｉＱＳ、网络入侵ｉＳｅ
（）Ｖ和ＡＶ算法并没有对Ｔｉ树进行路径压缩处理，２ＢＢｒｅ导致树的深度等于前缀的长度，对于Ｉｖ，Ｐ４查找一个ＩＰ地址，在最坏情况下需要访存３２次，ＩｖＰ６则需要１８次。２
规则集读入内存，记录各维的值，并用ｉ号标记规则的顺序。ｄ
个位串，当且仅当第ｉ个规则块的值覆盖此区间值时，称
该区间属于该规则块，并将位串对应的位置为１否则置为０，。步骤４对于源ＩＰ地址，目的ＩＰ地址这两维，按照同
为压缩规则集提供了可能。本文的主旨是减少预处理阶段的
内存占用。算法分为预处理和查找２个阶段：
作者简介：王桐桐（９４，，士研究生，１８－）男硕主研方向：并行算法，
高性能路由器
（）Ｖ与ＡＶ算法不能直接支持范围匹配，１ＢＢ不能应用到五维的报文分类环境下，位并行算法虽然能支持五维情况，但又会占用大量内存空问。
提出一种压缩位并行算法，通过报文分类压缩每个域上的重复规则并重新组织规则集，而缩短位图中位串的长度，从减少内存空间的占用。实验结果证明，该压缩位并行算法在不影响运行速度的前提下，明显减少了空间占用。关健词：位并行；位向量；聚合位向量；压缩位并行；多维分类；位串
第３７卷第１期８
、＿７幻ｌ３
・
计
算
机
工
程
２１年９月０１
Ｓｐｅｅ２ｅｔｍｂｒ０１１
ＮＯ．８１
ＣｏｐｔｒＥｎｉｅｒｎｍｕｅｇｎｅｉｇ
网络与通信・
一
文章编号：ｏｏ４８０１８一ｌ２一１０－２（ｌｌ一ｌ＿ｌ２）ｌ３
３１ＣＰ算法介绍．Ｂ通过分析来自１１个互联网服务提供商（ｔｒｅＳｒｉｅＯ１ｅｎｔｅｖｃｎＰｏｉｅＳ）７３个分类规则集得出：规则集中的协议类ｒｖｄｒＰ的９，Ｉ
型、源端口号、目的端口号这３个字段存在很多重复的情况，尤其是协议字段类型，从十几种到几十种不等，对于上万条规则的规则集来说，这种重复率甚至达到了９％以上，这就５
的结果。位并行报文分类算法就是基于这种思想，该算法
可以在多维上并行进行规则的查找，具有很快的执行速度；但是它只适用于小型规则集的匹配查找，随着规则集的增大，算法的内存消耗将急剧增加。位向量（ｉＶｃｒＢ算法与Ｂｔｅｔ，Ｖ）ｏ
位并行算法的基本思想相同，最大的改进在于引入了Ｔｉ树ｒｅ
集重新排序后的规则顺序为Ｒ至９每个规则块可确定其覆，盖的规则范围；重排结束后，根据规则集中记录的每个规则
所属于的块信息，确定每个规则块覆盖的规则范围，在规则块数据结构中记录。
的包头信息，根据包头中各维的值，并行地在各维度上进行查找，在规则区间集中找到合适的区问，读取其位串信息，从而可以得到报文在每维上匹配的规则集合，最后将每一位
定义３无用区间）假设规则集第维覆盖的整个规则区（间记为Ｒ，存在一个规则的覆盖区间Ｒ，凤属于Ｒ，但不属于其他任何规则块覆盖的区间，则称该区问为无用区间，其余区间称为有用区间。
２并行算法
随着网络服务种类的增加，多维报文分类的应用越来越
广泛，但许多算法只支持针对源和目的ＩＰ地址的二维分类。对于多维分类问题，简单的解决办法是将其分解成若干个子问题，然后将各子问题的结果进行 “ 与”操作，得出原问题
的匹配的规则集合取交集，优先级最高的即为匹配的规则。
步骤３对于协议类型、目的端口、源端１这三维，将３第ｆ１ ≤３维的所有规则块的起点和终点值投影到数轴上，（≤Ｊ）将数轴分割成若干个互不相交的小区间，为每一个区间分配
一
３２ＣＰ算法的预处理阶段．ＢＣＰ算法的预处理阶段主要分为４个步骤。Ｂ步骤１删除规则集中的重复规则得到规则集Ｆｌｒｉｅ，将ｔ
文献标识码：Ａ．Βιβλιοθήκη 中图分类号：Ｐ９Ｔ３３
种多维并行报文分类算法
王桐桐
（南京航空航天大学信息科学与技术学院，南京２０１）１０６
摘
耍：位并行、位向量和聚合位向量算法通过对多个域进行并行处理加快分类速度，但三者内存占用太大，不适用于大规则集。为此，
收稿日期：２１— —６０１３１０
Ｅｍｉｔ１４１６．ｍ－ａｌｔ８１＠１３ｏ：ｗ９ｃ
第３卷７
第１期８
王桐桐：一种多维并行报文分类算法
ｌ３１
（）１预处理阶段。主要负责对原始的规则集进行处理，为查找阶段提供必要的数据结构。（）２查找阶段。当报文到达时，首先从报文中提取出相应
［ｙｗｒｓｂｔａａｅ；ｔｅｔｒＢ；ｇｅａｅｔｅｔｒＡ）ＣｏｒｓｅｉＰｒｌｌＢ）ｍｕｔｄｍｅｓｏａｌｓｉｃｔｎｂｔｔｎＫｅｏｄ］ｉｐｒｌｌＢｉＶｃ（Ｙ）ＡｇｒｇｔＢｉＶｃ（ＢＶ；ｍｐｅｓｄＢｔａａｌ（Ｐ；ｌ—ｉｎｉｎｌａｓａｏ；ｉｓｉｇｌｏｄｏｅＣｉｃｆｉｉｒＤ０Ｉ１．９９．ｓ．００３２．１．８０７：０３６０ｉｎ１０ —４８０１１．ｓ２３
结构，使算法更加直观。聚合位向量（ｇｅａｅｉＶｃｒＡｇｒｇｔｄＢｔｅｔ，ｏＡＶ算法在ＢＢ）Ｖ算法的基础上引入聚集的思想，减少访存
位串的次数。ＢＶ和ＡＢＶ算法很好地利用了位串存储和并行处理的优点，但两者都存在以下不足：