网络流量分类算法比较研究
网络流量特征提取和分析算法研究

网络流量特征提取和分析算法研究随着互联网的普及和技术的不断发展,网络流量的规模和复杂性也在不断增加。
因此,如何从海量的网络流量数据中提取有用的信息和特征,成为了网络安全、网络管理、网络优化和数据分析等领域的重要问题。
为此,网络流量特征提取和分析算法的研究也逐渐成为了热门的研究方向。
一、网络流量特征提取算法网络流量的特征可以包括各种参数和指标,如带宽、时延、丢包率、流量大小、传输协议、应用类型等等。
因此,网络流量特征提取算法的目标就是从原始的网络数据包中提取出这些特征,并将其转换为可供后续处理和分析的特征向量。
常用的网络流量特征提取算法包括基于统计、基于模型和基于机器学习的方法。
其中,基于统计的方法主要使用了各种统计量和特征描述符来分析网络数据包的各种属性和分布。
例如,可以使用平均值、方差、中位数、极差、分位数等统计量来描述网络流量特征,还可以使用信息熵、互信息、相关系数等特征描述符来提取网络数据包的相对信息量和相关性。
基于模型的方法则从数据包流的角度出发,尝试利用预定义的模型来描述网络流量的特征。
这些模型可以包括马尔可夫链、自回归模型、分段线性模型等等。
例如,可以使用ARIMA模型来对网络数据包的时序变化进行建模,也可以使用分段线性模型来对网络数据包的流量大小和带宽进行拟合。
基于机器学习的方法则更加注重数据的自动化和智能化处理,它可以利用各种机器学习算法来自动分析和提取网络数据包的特征。
例如,可以使用支持向量机、随机森林、神经网络等机器学习算法来分类、聚类或回归网络数据包的各种特征。
二、网络流量特征分析算法网络流量特征分析算法则更加注重对网络流量特征的分析和解释,它可以基于网络流量的特征向量,对网络流量进行聚类、分类、异常检测、数据可视化等处理。
该算法可以从多个维度对网络流量特征进行分析,从而发现网络的潜在规律和异常情况。
常用的网络流量特征分析算法包括聚类算法、分类算法、异常检测算法和可视化算法等。
基于半监督学习的网络流量分类算法研究

基于半监督学习的网络流量分类算法研究近年来,随着网络技术的不断发展和普及,网络安全问题也愈加突出。
其中,网络流量分类是网络安全的一个重要领域,其目的是对网络流量进行分类,将正常流量与恶意流量区分开来,以保障网络的安全可信。
网络流量分类算法通常分为有监督学习和无监督学习两种方式。
有监督学习需要大量已知类别的流量样本作为训练集,通过构建分类模型对未知流量进行预测。
而无监督学习则是在无标签数据的情况下,通过数据分布等特征进行分类。
然而,由于训练样本的获取和标记成本较高,有监督学习的分类模型可能会导致过拟合与泛化性能差的问题。
相对而言,无监督学习虽然不需要标记,但它训练出的分类模型稳定性较差,分类效果可能并不理想。
因此,近年来基于半监督学习的网络流量分类算法备受关注。
半监督学习旨在在有限标记样本和大量无标记样本的条件下,通过挖掘不同样本之间的相似性或者差异性,提高分类模型的准确性。
基于半监督学习的网络流量分类算法有多种,常见的包括基于图的半监督学习和基于深度学习的半监督学习等。
其中,基于图的半监督学习是一种基于网络拓扑形态的分类方法。
该方法对网络流量的特征向量进行建模,并将其转换成图形结构上的节点。
然后,在有标记节点的同时,通过节点之间的连接与相似性计算出新的“虚拟标签”,从而对未知的节点进行分类。
相比于基于图的半监督学习,基于深度学习的半监督学习算法具有更好的泛化性能和适应能力。
最近提出的一种基于卷积神经网络(Convolutional Neural Networks,CNN)的网络流量分类算法,通过在CNN中嵌入半监督学习算法实现网络流量分类。
该方法利用卷积神经网络对网络流量进行分层特征提取,并将提取的特征向量输入到半监督学习算法中进行分类。
除了以上两种方法,还有基于网络嵌入的半监督学习算法等。
网络嵌入是一种将节点或网络图转化为低维向量表示的方法。
基于网络嵌入的半监督学习算法通过节点之间的相似度计算相互作用,将图中的相近节点嵌入到同一空间中,并通过半监督分类算法对其进行标记。
网络流量分类及其现状研究

商务交 易等 各种应用不断涌现 , 造成新兴应用层 出不穷 、 带宽消
耗急剧增加 、 安全问题 日益增多 , 如何 为用户提供一个安全 、 可靠
索策 略来选取流统计学特征 。H U A N G等人将粒子群算法用 于特 征搜索 , 但粒子被过多束缚 , 容易导致局部最优。2 0 0 9年 , L i 等人 利用遗传算法进行特征属性选择 , 搜索 能力 强 , 对求解大规模 复
消耗 时间较长的不足。2 0 1 2年 , Wa n g以流 的统计学特征为依据 , 提 出了一种基 于 f i l t e r 和w r a p p e r 的组合式 特征选择 ,获得 识别
议类型 ) 的单向数据包集合。只要数据包的上述五个要 素中有一
个 不相 同, 它们就不属于 同一条流。 在 流的定义的基 础上 , 网络流 量分 类是 指 :对流按 照其 应用 层 的应用类 型 ( 如 m 。 MA I L , www, P 2 P等 ) , 将网络 中存在的 T C P流或 U D P流进行分类。对 网络流量分类 的研究 主要 是网络流量特征选择和分类方法 两方
是实现 网络可控性的基础技术 , 在网络管理 、 服务质量保障 和网
络安全等领域都有应用 。 但随着网络的发展 , 网络速度不断提高 ,
新型的 网络应用和技术不断 出现 , 对网络流量分类术提 出了更 高 的要求 。
一
、
网 络流 量 的 定 义
流特征选择算法 ,通过曲线拟合趋势相关性属性进行特征选择 ,
面。
P 2 P的最优流特征子集 , 但该方法 的通用性有待提高 。
目前 , 各种新 的搜索机制和评价标准如支持 向量机 、 马尔可
夫、 粗糙集 、 神经网络等方法被广泛应用 于改进现 有的特征选择
《网络流量分类研究》课件

通过流量分类,可以更好地了解网络瓶颈和性能瓶颈,从而进行有针对性的优化。
2 安全分析
流量分类可以帮助识别恶意流量和网络攻击,提高网络的安全性。
3 流量控制
通过对流量进行分类和控制,可以优化网络带宽的使用,提高网络的质量。
基于端口号的流量分类技术
基于端口号的流量分类技术是一种简单而常用的方法,它通过识别数据包的 源/目的端口号来进行流量分类。
基于IP地址的流量分类技术
基于IP地址的流量分类技术是一种常见的方法,它通过识别数据包的源/目的I技术是一种流行的方法,它通过识别数据包的协议类型 来进行流量分类。
基于深度学习的流量分类技术
基于深度学习的流量分类技术利用神经网络结构和深度学习算法对网络流量 进行分析和分类。
《网络流量分类研究》 PPT课件
在这个PPT课件中,我们将深入探讨网络流量分类的背景、意义和应用。探讨 各种流量分类方法,包括基于端口号、IP地址、协议、深度学习和机器学习的 技术。以及流量分类对网络管理、优化和流量控制的重要性。
研究背景与意义
网络流量分类是一项关键的研究领域,它对于网络性能优化、安全分析和流量控制至关重要。
网络流量分类的概念与定义
网络流量分类是指根据网络数据包的特征和属性将流量进行分类和标识,以便更好地理解和管理网络通信。
网络流量分类的分类标准
网络流量可以根据不同的标准进行分类,如协议类型、应用类型、源/目的地地址等。
常见的流量分类方法
基于端口号的流量分类技术
根据数据包的源/目的端口号进行流量分类,适 用于传统的网络应用。
基于协议的流量分类技术
根据数据包的协议类型进行流量分类,适用于区 分不同协议的网络流量。
基于IP地址的流量分类技术
网络数据流量特征分析与识别方法研究

网络数据流量特征分析与识别方法研究随着互联网的快速发展和普及,网络数据流量的增长呈现出爆炸式的增长态势。
对网络数据流量进行分析与识别成为保护网络安全、优化网络性能以及推动网络资源管理的重要手段之一。
本文旨在研究网络数据流量特征分析与识别的方法,探讨如何准确地分析网络数据流量,并识别其中的相关特征信息。
一、网络数据流量特征分析的意义网络数据流量特征分析是对网络数据流量进行深入研究和理解的过程,通过分析网络流量中的特征,可以掌握网络的使用情况、用户行为以及网络应用的特点,对网络性能优化、网络故障排除、网络安全保护等方面起到重要作用。
准确分析网络数据流量特征,可以为网络管理者提供定量的数据支持,帮助其制定相应的网络策略和决策。
二、网络数据流量特征分析的方法1.基于统计学方法的网络数据流量特征分析统计学方法是一种常见且有效的网络数据流量特征分析方法。
可以通过统计和分析网络流量数据的分布情况、频率以及变化趋势等,揭示网络数据流量的主要特征,包括数据包的个数、字节数、流量大小、数据包长度等信息。
该方法具有简单易用、计算效率高的优点,适用于对网络流量整体特征进行分析和评估。
2.基于机器学习方法的网络数据流量特征分析机器学习方法在网络数据流量特征分析方面也有广泛的应用。
通过构建相应的模型,对网络数据流量进行训练和分类,可以提高对特定类型的网络流量进行准确识别的能力。
常见的机器学习算法包括朴素贝叶斯、决策树、支持向量机等。
这些方法能够从大量的特征数据中学习和归纳出网络流量的模式和规律,然后进行分类和预测,实现对网络数据流量的自动识别。
3.基于深度学习方法的网络数据流量特征分析深度学习方法是近年来快速发展的一种网络数据流量特征分析方法,深度学习算法可以自动从大量的网络数据中学习特征,利用神经网络的结构和参数进行分析和预测。
通过多层的神经网络结构,深度学习方法能够挖掘网络数据流量中的更深层次的特征和规律,提高网络数据流量特征分析的准确性。
基于机器学习的网络流量分类研究

基于机器学习的网络流量分类研究一、引言随着互联网的快速发展,网络流量的数量和种类不断增加。
对网络流量进行分类和分析,有助于了解网络行为和保护网络安全。
传统的基于规则的方法虽然简单,但无法适应网络流量快速变化的特点。
随着机器学习技术的发展,基于机器学习的网络流量分类逐渐成为研究热点,本文将详细探讨基于机器学习的网络流量分类研究。
二、网络流量分类的重要性网络流量分类是指对网络中传输的数据流进行分类和标记,以便更好地了解和管理网络流量。
网络流量分类的重要性体现在以下几个方面:1. 网络安全:通过对网络流量进行分类,可以识别异常流量和恶意行为,及时发现并防止网络攻击。
2. 网络管理:对网络流量进行分类和监控,可以了解网络中的流量分布和使用情况,从而优化网络资源分配和调整网络策略。
3. 服务质量优化:对网络流量进行分类和分析,可以根据不同类型的流量提供不同的服务质量,提升用户体验。
三、基于机器学习的网络流量分类方法基于机器学习的网络流量分类方法是利用机器学习算法对网络流量数据进行建模和分类。
主要包括以下步骤:1. 数据预处理:网络流量数据通常包括各种协议和特征,需要对原始数据进行处理和提取有用特征。
常用的预处理方法包括数据清洗、数据采样和特征选择等。
2. 特征提取:从网络流量数据中提取有用的特征,以供机器学习算法使用。
常用的特征包括包大小、传输速率、协议类型等。
3. 数据标记:需要为网络流量数据标记标签,即将不同类型的流量分为不同的类别。
一般采用人工标注或其他自动化方法进行标记。
4. 模型选择和训练:选择合适的机器学习算法,并使用标记好的数据进行模型训练。
常用的机器学习算法包括决策树、支持向量机和深度学习等。
5. 模型评估和优化:对训练好的模型进行评估和优化,包括计算准确率、召回率和F1值等指标,进一步优化模型性能。
四、基于机器学习的网络流量分类应用实例基于机器学习的网络流量分类已经在各个领域得到应用。
以下是几个常见的应用实例:1. 网络入侵检测:通过对网络流量进行分类,可以识别和检测各种网络入侵行为,如DDoS攻击、端口扫描等。
网络流量分类与分析技术研究综述

网络流量分类与分析技术研究综述网络流量是指通过网络传输的数据包的数量和速率。
在互联网时代,网络流量成为了信息传输的重要指标,通过对网络流量的分类和分析可以了解网络的使用情况、发现网络故障、提高网络性能等。
本文将对网络流量分类与分析技术进行综述,并介绍其应用领域和未来发展方向。
一、网络流量分类技术网络流量的分类是通过对流量数据包进行特征提取和识别,将流量划分为不同的类型。
常见的网络流量分类技术包括端口号识别、深度包检测、统计分析等。
1. 端口号识别端口号是TCP/IP协议中用于区分不同应用程序或服务的标识符。
通过识别数据包的源端口号和目的端口号,可以判断该流量所属的应用程序或服务。
例如,源端口号为80表示该流量属于Web浏览器的HTTP请求,而源端口号为443表示该流量属于使用HTTPS协议加密的Web服务。
2. 深度包检测深度包检测是指对数据包的负载进行深入分析,提取出更多的特征信息以进行分类。
深度包检测可以依靠不同的特征进行分类,比如协议头部信息、数据包长度、数据内容等。
通过深度包检测,可以识别出隐藏在加密协议中的流量类型,提高分类的准确性。
3. 统计分析统计分析是指通过对网络流量数据进行统计和分析,从中抽取出特征规律进行分类。
常见的统计方法包括数据包长度分布、时间序列分析、频谱分析等。
通过对流量数据的频率、持续时间、数据量等进行统计,并结合机器学习算法,可以建立分类模型,实现更精确的流量分类。
二、网络流量分析技术网络流量分析是指对网络流量数据进行解析、处理和分析,从中提取出有价值的信息和模式,为网络管理、安全监测、性能优化等提供支持。
常见的网络流量分析技术包括流量分析工具、数据挖掘、机器学习等。
1. 流量分析工具流量分析工具是一类专门用于捕获、存储和分析网络流量的软件工具。
其中最广泛使用的工具是Wireshark,它可以对网络流量进行抓包和分析,提供了丰富的功能和可视化界面,能够展现数据包的各个层级信息,并支持定制化的分析。
利用人工智能技术进行网络流量分析与分类研究

利用人工智能技术进行网络流量分析与分类研究随着互联网的快速发展和大规模应用,网络流量(Network Traffic)的分析和分类成为了保障网络安全、优化网络性能和发现网络异常的重要手段。
传统的网络流量分析方法局限于静态规则和人工经验,无法应对日益复杂和智能化的网络攻击。
而利用人工智能技术进行网络流量分析和分类研究,可以提高网络安全性和性能,并且为网络系统的运行提供更加智能的决策支持。
一、人工智能在网络流量分析中的应用人工智能技术在网络流量分析中发挥了重要的作用。
具体来说,机器学习、深度学习和数据挖掘等领域的算法和方法被广泛应用于网络流量数据的分析和分类。
它们能够自动地学习和识别网络流量中的模式、特征以及异常行为,从而帮助系统管理员发现并应对潜在的网络攻击和威胁。
1. 机器学习在网络流量分析中的应用机器学习是一种利用数据来训练算法模型并自动学习的方法。
在网络流量分析中,机器学习方法可以根据已有的网络流量数据训练模型,然后用于对未知流量进行分类。
常用的机器学习算法有朴素贝叶斯、决策树、支持向量机等。
2. 深度学习在网络流量分析中的应用深度学习是一种基于神经网络的机器学习方法,可以通过多层神经网络模型来进行数据分析和特征提取。
在网络流量分析中,深度学习方法可以自动地提取网络流量中的特征,并根据这些特征进行分类和判断。
常用的深度学习模型有卷积神经网络(CNN)、循环神经网络(RNN)等。
3. 数据挖掘在网络流量分析中的应用数据挖掘是一种从海量数据中发现模式和规律的方法。
在网络流量分析中,数据挖掘可以帮助发现网络流量中的关联规则、异常行为以及攻击模式。
通过分析和挖掘网络流量数据,可以提高对网络攻击的检测能力和响应能力。
二、利用人工智能的优势进行网络流量分析与分类相对于传统的网络流量分析方法,利用人工智能技术进行网络流量分析和分类具有以下几方面的优势:1. 自动化和智能化:人工智能技术可以自动地对海量的网络流量数据进行分析和分类。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
进行 Qo S调度 ; 为用 户提供 长期 有价 值 的分类 预测 ; 被 对 禁 的应 用或攻击进行检中建立一套分类规则 。聚类则是将具有 相似特征 的无 标识 的实例相 聚成簇 , 它是没有先验知识的分类 。 每个实例 即单 向流 , 由其特征 值 向量描述 。分类过程 的输入 是实例的特征 值 向量 , 出则 是通过 对给 定的 实例 输
能 达 到 分 类 准 确 度 要 求 的 特征 子集 。若 使 用 无 关 的 和 冗 余
最近邻算法[ ( —Ners ih os k 7k ] aet g b r,NN) Ne 是采用 欧 氏距离计算在 维特征空 间中每一个实例 与距 离它最近 的 k个数 据点之间的距 离。实例根据 其近邻 的类标号 进行分 类 。如果这个实例的近 邻 中含 有多个 类标 号 , 则将该 实例
指派到其最邻近的多数类 。 神 经 网络 ( e rl t是 高 度 互 连 的 由神 经 元 组 成 的 N uaNe)
的特征将大为降低分 类算法 的准 确率 , 同时随着 用来 描述 实 例的特征集维数 的增 加 , 需要 存储 和加工 的信 息量 也将
不 断地 增长 , 这使得 系 统更加 耗费 计算 资源 。因此理想 的 情况是选择 较小的且保 留 了相 关类 的最 基本 、 用信息 的 有
有 偏 斜 的 。过 滤 法 特 点 是 计 算 简 单 、 移 植 性 强 。 包 装 法 可
用 非线 性变换将 样本空间的分类问题转化为高维特征空 间
的分 类 问题 , 外 又 根 据 结 构 风 险 最 小 原 则 , 分 类 问题 转 另 将
特点是计算 复杂度 高 , 不适合高维特征 的计算 。
基 于 过 滤 方 法 又 分 为 基 于 相 关 过 滤 方 法 ( orl in C re t - ao
b sdFl r C S 、 于 一 致 性 过 滤 方 法 ( o s tny ae ie, F ) 基 t C n i ec s
化 为 在 特 定 约束 条件 下 寻 找 最 优超 平 面 的二 次 寻 优 问 题 l , 而避 免了分类 器对 样本 先验概率的依赖 , _ 从 g ] 有效提 高
1 )训 练过 程 , 检NCI J练数据 集并构 建分类器 模型 ; )测试 I 2 过程 , 使用 由训练过程得到 的模型对未知新实例进行分类 。
设T S表 示 训 练 数 据 集 , 由分 属 m 个 类 的 个 实 例 它
组成 :
T = { z , > , 2y > , , S < 1 1 < , 1 … < , > ) ( ) 1
前被加密和封装 的流 量 比例 在不 断增 长 。例 如 VP 和类 N 似 VP 的解决方 案、 N 数据包 加密 、 网络应 用 的端 口根 据需 要实行动态分配等 , 这使得 基于端 口号 匹配 和基于数 据包 检测的机制失灵 。第二 , 护特 征库需耗 费大量计算 资源 。 维
第 三 , 集 和解 析 载 荷 记 录 受 用 户 隐 私 权 等 法 律 问题 的 约 采
1 引 言
流 量 分 类 对 于 当 前 网 络运 营 的 优化 和未 来 网络 架 构 的 改 进 提 高具 有 重 要 意 义 。 流 量 分 类 的 主 要 目的 是 : 网 络 对 进 行 有 效 规 划 和设 计 ; 析 网络 中的 应 用 趋 势 ; 网络 资 源 分 对
向和后 向转发数据包 的总数 ) 数据包 长度 相关 属性 、 间 、 时
特征 子集 。 特 征选 择 方 法 分 为 过 滤 法 (ie) 包 装 法 ( a p r。 ftr 和 l wrp e)
网络 , 的输 出来 自其他 神经元 多权 重输入 的组合 。最简 它 单常用的是多层感知器 ¨ , 8 它是 由一个 神经 元 ( 征属性 ) ] 特 构成的单个输入层 , 一个 由神经 元 ( 类别 ) 成 的单个输 出 构
c ieL ann , hn er i ML) g 算法 , 使用 流特 征对 网络 流量进 行分
类 。其优点是不依赖 匹配协议端 口或解析协议 内容 的方式
来 识 别 网络 应 用 , 有 灵 活 性 和 可 扩 展 性 。 它 的 前 提 是 网 具
络层 的流应具有 可统计属性 , 诸如数据包数量相关属性 ( 前
束。
二元关系 TS中每一个 序偶 <z ,J Y >表示一个 实例 ( i
一
1… , ; , , 一1… , , 中 z是 对应 于第 i 实例 的输 z , m) 其 个
基于流特征统 计法 是利 用数 据挖 掘 中机器 学 习 ( — Ma
入特征值 向量 , Y则是输 出的类标 号 。分类过 程的 目标 是 : 从训练集 T S中找到这样一个 函数 一, z , ( )它对任意输入 未知 - z值输出类 的过程能达到最好 的预测效果 。其输 出 是预先定义 了类标号 的离散 值集 合 { Y , y } Y ,。 …, m 。分类 函数 , ) ( 是整个分类器模型的核心 。
了分 类 器 的分 类 准 确 性 和 稳 定 性 。
bsdFl rC ae ie , ON) 快速 相 关 性过 滤 法l ( atC rea t 和 _ F s orl— 3 ]
to - a e l r FC in b s d Fi e , BF) t 。
* 收 稿 日期 :0 1年 l 21 1月 1 7日, 回 日期 :0 1年 1 月 1 日 修 21 2 7 基 金 项 目 : 徽 医 科 大 学科 研 基 金 项 目 ( 号 :0 0 k0 0 资 助 。 安 编 2 1 x j4 ) 作者简介 : 勃 , , 士 , 彭 男 硕 工程 师 , 究 方 向 : 件 工 程 , 络 流量 分 类 。 研 软 网
结 点 , 根 据 测 试 结 果 将 样 本 划 分 到 该 结 点 中 。对 每 个 子 并 结 点 递 归 调 用 该 算 法 , 到 所 有 子 集 仅 包 含 同 一 类 别 的 数 直 据为 止。
特征选择是 流量 分类 的预处理步骤 。使用 特征选择 方 法可 自动地从初 始特 征集 中消除无关的和冗余 的特征_ 。 2 ] 特征子集 的质量对 于分类 算法 ( ML算法 ) 性能 而言 尤 为重要 。构建 ML分类器的关键在于能否找到 一个 最小且
Ab ta t Ae u aetafcca sfc to So u d me a m p ra c o n me o sn t r ciiisa di a e na h tt pci t src c rt r fi ls i a ini ff n a ntli o tn et u r u ewo k a t te n th sb e o o i nne— i v wor e s r me tf ralngtme km a u e n o o i .A o c mpaio fsx ag rt msO r fi lsiia in s do lw e t rsi o d td An lssa d rs n o i lo ih ftafcca sfc to bae n fo fa u e sc n uce . ay i n e p rm e ts o t tu ig faur eeinm eh d t e s p o tv co c ie( x ei n h w ha sn e t es lto t o h u p r et rma hn SVM ) meho a gh a c r c n te o t d h shi c u a y a d betrc mpua in l tto a p ro ma c o ewo k tafcca sfc to . e fr n efrn t r rfi lsiia in Ke o ds n t r r fi ls ic to y W r e wo kta f ca sf ain,ma hn er n c i c ielanig,fa u es lcin e t r ee to Cls a sNumbe TP3 3 r 9
集 探 测 和归 纳 而 构建 出来 的分 类 器 模 型 。模 型 可 表 现 为 流 程 图 、 策 树 、 经 网 络 图 等 。流 量 分 类 主 要 有 两 个 步 骤 : 决 神
2 基于流特征统计方法
早 期 网 络 流 量 分 类 使 用 基 于 端 口号 匹 配 方 法 和数 据 包 载 荷 特 征 检 测 方 法 [ 。前 者 方 法 简 单 、 件 实 现 容 易 , 者 1 ] 硬 后 则具有精度高的优点 , 这 些方 法均存 在局 限性 : 先 , 但 首 目
摘
要
准确的网络流量分类既是众多网络研究工作 的重要基础 , 也是网络测量领域 的研究热点 。基于流特征的六种分类算法进行 比
较分析 , 实验结果表明 , 特征选择方法 ,V 算法具有较高的整体准确率 和较好 的计算性能 , 使用 SM 适合用于网络 流量分类 。
关 键 词 网 络 流 量 分类 ;机 器 学 习 ; 征 选 择 特
2 1 年第 5 02 期
计算机与数字工程
1 3
3 特 征选择与分类算 法
3 1 特 征 选 择 .
2 )如果 中样 本分属 不 同的类 , 通过计算 , 择增 则 选 益 比例[ 最大的属性作 为分裂属 性 , 6 ] 以此 作为属 性测试 条 件将样本 划分为较 小子集。对测试条 件的每个输 出创 建子
相 关 属 性 ( 持 续 时 间 分 布 、 空 闲 时 间 、 据 包 到 达 时 间 流 流 数 间隔) 。 等 ML 流量 分 类 分 为 两 种 学 习 类 型 : 类 ( 监 督 学 习 ) 分 有 和 聚类 ( 监 督 学 习 ) 无 。分 类 是 从 一 个 预 先 定 义好 类 别 的实
中 图分 类 号 T 33 P 9