基于机器学习的网络流量分类研究发展报告

合集下载

基于机器学习的Internet流量分类

基于机器学习的Internet流量分类

的分类效果和特征选择对分类效果 的影 响。实验 结果表 明,V 对 流量分类 问题 具有 较 高的分类精度 和稳定性 , SM 通 过特征选择 , 以有效降低数据的维数 , 可 并一 定程度 上提 高分类的精度 。 关键词 : 流量分类 ; 器学习; 机 支持 向量机 ; 特征 选择
中图分 类号 : P8 ; P 9 .7 T 1 1 T 33 0 文献标志码 : A
1 1 机 器 学 习与 流 量 分 类 .
计 费需要标识不 同的网络应用 ; 网络 安全需 要进行 入侵检 测 和异常流发现 。然而 随着 Itre 底层 环境 和上层 的应用 发 ne t n 展 以及规模扩大 , 传统 的基 于传输层 端 口的应用识 别技术 已 逐渐不能适应 P P和被动 F ’ 2 I P等新 型应 用 。
1 示, 所 基于机 器学 习的流量分 类通 常是 在流 量采集 的流量
记 录上进行下面五个步骤的处理。
但存在 效率 问题 , 目前 的研究重点 主要集 中在不依 赖 于报 文 载荷 的方 法 , 例如 基 于传 输层 行 为 以及针 对 流量 特征 的 B ys ae 及其改进 方法 等 , 方法 对流 量 的建模 均存 在不 同 但 程度上的缺陷。机器学习方法技术 不依 赖匹配协议端 口或解 析协议 内容识别网络应用 , 而是 利用流 量在传输 过程 中表现
atoi tedt sbesb up  ̄ V c rMahn S M) ad tea et n o fa r eet n i c sict n w r uhra v a u st y Sp o et cie( V ti a o n f c o f et e sl i n l s a o ee h i u co a f i i

基于机器学习的IP流量分类研究

基于机器学习的IP流量分类研究
摘 要 I 量 分 类是 Itre 研 究 和 流 量 工 程 的 重要 基 础 , 年 来 网 络 应 用 类 别 和 Itre 流 数 量 在 快 速 增 长 。 P流 nent 近 nen t
流 量 分 类技 术 不 断 面 临 新 的挑 战 。 对基 于机 器 学 习的 I P流 量 分 类 方 法 进 行 了 系统 性 研 究 。 给 出 了这 类 流 量 分 类 方
a p cs a di iae h h ra e O i h s td e. e , u o s e t ,n n c tdt es o tg sn W n t e esu is Th n f rc mmo s u swee s mma i d, ih a ed t d o n is e r u rz whc r aa e
第 3 卷Leabharlann 第 1 期 7 2 21 0 0年 l 月 2





Vo. 7 No 1 13 . 2
De 01 c2 0
Com pu e Sce c tr in e
基 于 机 器 学 习的 I P流 量 分 类 研 究
刘 琼 刘 珍 黄 敏 ( 华南理 工大 学软 件学 院 广 州 5 0 0 ) 1 0 6
s e ,a e o te e k, trb t h n i g a d ca sf i l e p c ie y Att e e d t e p o p c n u on r k w l b lb tln c a t i u e c a g n n ls i t y me y r s e t l . h n , h r s e ta o rg i g wo k v d
t r e r fi l s iia in u i g ma h n e r i g i h a e . ma h ma ia e c ito sg v n f rt et c n l g e n tta fcc a sfc t sn c i ela n n t e p p r A t e t l s rp i n wa ie h e h oo y o n c d o o r fi ca sf a i n fr t Afe u v y n h e h o o y o r fi ls i c t n b s d o u e v s d l a n n n n ft a f ls i c t is . t rs r e i g t e t c n l g fta fcca sf a i a e n s p r ie e r i g a u ~ c i o i o d s p r ie e r ig, o u e v s d l a n n we c mme t d o h a a p e r c s ig, l s iia in mo e n e f r n ee a u t n e c t r e n e n t ed t r p o e sn c a sf t d la p ro ma c v l a i t. h e c o d o

基于机器学习的流量预测与优化方法研究

基于机器学习的流量预测与优化方法研究

基于机器学习的流量预测与优化方法研究流量预测与优化是目前网络技术与管理领域的热点研究方向之一。

随着互联网的迅猛发展,网络流量的规模和复杂性不断增加,如何准确预测网络流量并优化网络资源的利用效率成为了当务之急。

本文将基于机器学习的方法对流量预测与优化进行研究,探索一种有效的解决方案。

首先,我们需要了解什么是网络流量预测与优化。

网络流量预测是指通过分析历史数据和相关特征,预测将来某个时间段内的网络流量情况。

网络流量优化则是指通过合理地调度网络资源,提高网络的吞吐量、时延和性能稳定性,使网络能够更好地适应用户需求。

机器学习作为一种广泛应用于数据分析和预测的技术,可以为流量预测与优化提供有力的支持。

它可以通过大量的历史流量数据进行学习和建模,从而预测未来的流量情况。

同时,机器学习还可以根据当前网络环境和流量特征,动态调整网络资源的分配,以实现最佳的流量优化效果。

在流量预测方面,机器学习可以应用于时间序列预测、回归分析和分类问题等。

时间序列预测是指根据时间序列的变化规律,预测未来一段时间内的流量情况。

回归分析则是通过分析网络流量与相关特征之间的关系,建立数学模型,预测未来流量的数值。

分类问题则是将流量分为不同的类别,如高流量、低流量、正常流量等,以便网管人员根据不同的类别制定相应的优化策略。

机器学习在流量优化方面的应用可以包括带宽分配、路由选择、拥塞控制等。

带宽分配是指根据流量的需求情况,合理地分配带宽资源,以满足不同用户和应用的需求。

路由选择是指选择最佳的传输路径,以减小时延、保证带宽利用率,并避免网络拥塞。

拥塞控制则是通过分析网络拥塞的原因和特征,及时调整网络资源的分配,以维持网络的高性能状态。

在实际应用中,如何选择合适的机器学习算法和模型,是流量预测与优化的关键。

常用的机器学习算法包括决策树、支持向量机、神经网络、随机森林等。

根据流量特点和目标需求,可以选择最合适的算法用于预测与优化。

同时,还需要考虑模型的参数设置、特征选择、数据采样等因素,以提高预测准确性和优化效果。

基于机器学习的网络流量分类研究

基于机器学习的网络流量分类研究

基于机器学习的网络流量分类研究一、引言随着互联网的快速发展,网络流量的数量和种类不断增加。

对网络流量进行分类和分析,有助于了解网络行为和保护网络安全。

传统的基于规则的方法虽然简单,但无法适应网络流量快速变化的特点。

随着机器学习技术的发展,基于机器学习的网络流量分类逐渐成为研究热点,本文将详细探讨基于机器学习的网络流量分类研究。

二、网络流量分类的重要性网络流量分类是指对网络中传输的数据流进行分类和标记,以便更好地了解和管理网络流量。

网络流量分类的重要性体现在以下几个方面:1. 网络安全:通过对网络流量进行分类,可以识别异常流量和恶意行为,及时发现并防止网络攻击。

2. 网络管理:对网络流量进行分类和监控,可以了解网络中的流量分布和使用情况,从而优化网络资源分配和调整网络策略。

3. 服务质量优化:对网络流量进行分类和分析,可以根据不同类型的流量提供不同的服务质量,提升用户体验。

三、基于机器学习的网络流量分类方法基于机器学习的网络流量分类方法是利用机器学习算法对网络流量数据进行建模和分类。

主要包括以下步骤:1. 数据预处理:网络流量数据通常包括各种协议和特征,需要对原始数据进行处理和提取有用特征。

常用的预处理方法包括数据清洗、数据采样和特征选择等。

2. 特征提取:从网络流量数据中提取有用的特征,以供机器学习算法使用。

常用的特征包括包大小、传输速率、协议类型等。

3. 数据标记:需要为网络流量数据标记标签,即将不同类型的流量分为不同的类别。

一般采用人工标注或其他自动化方法进行标记。

4. 模型选择和训练:选择合适的机器学习算法,并使用标记好的数据进行模型训练。

常用的机器学习算法包括决策树、支持向量机和深度学习等。

5. 模型评估和优化:对训练好的模型进行评估和优化,包括计算准确率、召回率和F1值等指标,进一步优化模型性能。

四、基于机器学习的网络流量分类应用实例基于机器学习的网络流量分类已经在各个领域得到应用。

以下是几个常见的应用实例:1. 网络入侵检测:通过对网络流量进行分类,可以识别和检测各种网络入侵行为,如DDoS攻击、端口扫描等。

网络流量分类与分析技术研究综述

网络流量分类与分析技术研究综述

网络流量分类与分析技术研究综述网络流量是指通过网络传输的数据包的数量和速率。

在互联网时代,网络流量成为了信息传输的重要指标,通过对网络流量的分类和分析可以了解网络的使用情况、发现网络故障、提高网络性能等。

本文将对网络流量分类与分析技术进行综述,并介绍其应用领域和未来发展方向。

一、网络流量分类技术网络流量的分类是通过对流量数据包进行特征提取和识别,将流量划分为不同的类型。

常见的网络流量分类技术包括端口号识别、深度包检测、统计分析等。

1. 端口号识别端口号是TCP/IP协议中用于区分不同应用程序或服务的标识符。

通过识别数据包的源端口号和目的端口号,可以判断该流量所属的应用程序或服务。

例如,源端口号为80表示该流量属于Web浏览器的HTTP请求,而源端口号为443表示该流量属于使用HTTPS协议加密的Web服务。

2. 深度包检测深度包检测是指对数据包的负载进行深入分析,提取出更多的特征信息以进行分类。

深度包检测可以依靠不同的特征进行分类,比如协议头部信息、数据包长度、数据内容等。

通过深度包检测,可以识别出隐藏在加密协议中的流量类型,提高分类的准确性。

3. 统计分析统计分析是指通过对网络流量数据进行统计和分析,从中抽取出特征规律进行分类。

常见的统计方法包括数据包长度分布、时间序列分析、频谱分析等。

通过对流量数据的频率、持续时间、数据量等进行统计,并结合机器学习算法,可以建立分类模型,实现更精确的流量分类。

二、网络流量分析技术网络流量分析是指对网络流量数据进行解析、处理和分析,从中提取出有价值的信息和模式,为网络管理、安全监测、性能优化等提供支持。

常见的网络流量分析技术包括流量分析工具、数据挖掘、机器学习等。

1. 流量分析工具流量分析工具是一类专门用于捕获、存储和分析网络流量的软件工具。

其中最广泛使用的工具是Wireshark,它可以对网络流量进行抓包和分析,提供了丰富的功能和可视化界面,能够展现数据包的各个层级信息,并支持定制化的分析。

基于机器学习的网络流量预测技术研究

基于机器学习的网络流量预测技术研究

基于机器学习的网络流量预测技术研究网络流量预测技术是指利用机器学习方法对网络流量进行分析和预测的一种技术。

随着互联网的快速发展,网络流量的增长呈指数级增长,对网络的容量和性能提出了更高的要求。

因此,通过准确预测网络流量的变化趋势,能够帮助网络管理员更好地规划和优化网络资源配置,提高网络的稳定性和性能。

一、网络流量预测的背景和意义随着移动互联网、物联网等新兴技术的快速崛起,全球范围内的互联网用户数量和设备数量呈现出爆发式增长。

这使得网络流量呈现出高度复杂和时变的特点,对网络运营和管理提出了巨大挑战。

准确预测网络流量对提高网络性能、合理规划网络资源以及保障用户体验具有重要意义。

网络流量预测可以帮助网络管理员做出更加准确的决策,如优化调度算法、合理规划带宽、增加缓存容量等,从而提高网络的吞吐量、降低时延、减少丢包率等,提升网络的整体性能。

二、机器学习在网络流量预测中的应用机器学习是一种自动学习的方法,可以通过综合考虑多种因素提取数据的潜在模式和规律,并进行预测和决策。

在网络流量预测中,使用机器学习算法可以帮助我们从历史数据中发现潜在的规律,并将其应用于未来的流量预测。

常用的机器学习算法包括回归分析、决策树、支持向量机、神经网络等。

这些算法可以基于历史的网络流量数据进行训练和学习,构建出具有一定泛化能力的模型,从而对未来的网络流量进行预测。

三、机器学习网络流量预测技术的研究方法1. 数据采集与预处理:首先,需要收集大量的历史网络流量数据,包括流量大小、流量类型、流量分布等指标。

然后,对数据进行预处理,包括数据清洗、去噪、异常检测等步骤,以减小数据的干扰和误差。

2. 特征提取与选择:在机器学习中,特征的选择对预测模型的性能有着重要影响。

根据网络流量的特点,可以选择一些与流量相关的特征进行提取,如时间相关特征、流量分布特征、季节性特征等。

3. 模型训练与评估:在特征提取完成后,可以选择适合网络流量预测的机器学习算法进行模型的训练和学习。

基于机器学习的网络流量分析与优化

基于机器学习的网络流量分析与优化

基于机器学习的网络流量分析与优化现如今,网络已经深深的渗透我们的生活,并成为了我们日常生活中不可缺少的一部分。

然而,网络的发展也带来了一大堆的安全问题。

网络攻击已经成为了最常见和最危险的安全威胁之一。

由于网络中的流量非常庞大,手动分析网络流量已经变得几乎不可能。

解决这些问题的方法之一是利用机器学习技术进行网络流量分析和优化。

机器学习的优势机器学习是计算机科学中的一个重要分支,能够让机器从大量的数据中学习和预测,从而自动完成很多任务。

相较于传统的网络流量分析方法,机器学习具有以下优点:1.自动化:机器学习能够自动处理大量的数据,不需要人为干预。

2.实时性:机器学习可以在输入数据到达时立即分析和处理。

3.精确性:机器学习能够准确地识别和分类网络流量,同时也能够预测未来的网络攻击。

利用机器学习进行网络流量分析网络流量分析是一种非常重要的网络安全技术,它可以识别和分类网络流量,从而阻止恶意攻击。

利用机器学习进行网络流量分析是一种新型的方法,它可以处理大量的数据,并根据数据的模式进行分类和识别。

在网络流量分析领域,机器学习可以用于以下方面:1.流量识别:机器学习可以根据流量的属性和行为对其进行识别。

2.异常检测:机器学习可以从大量的数据中检测到异常流量。

3.攻击检测:机器学习能够自动识别和分类各种类型的网络攻击。

解决网络拥堵问题网络拥堵是网络中最常见的问题之一,机器学习可以通过优化网络流量来解决这个问题。

通过分析实时流量数据,机器学习可以预测网络拥塞,并提供更好的网络流量管理。

机器学习可以利用以下方法来解决网络拥堵问题:1.流量控制:通过控制流量的速率,可以防止网络拥塞。

2.优化路由:机器学习能够自动选择最优路由以优化网络流量。

3.质量服务(QoS):机器学习可以自动分配网络流量以确保重要的数据得到及时处理。

结语在当代互联网环境中,网络安全是一项十分重要的任务。

利用机器学习技术进行网络流量分析和优化可以帮助我们更好地保护网络安全,防止网络攻击,同时提高网络运行速度和质量。

基于SDN的网络流量监测与分析方法研究

基于SDN的网络流量监测与分析方法研究

基于SDN的网络流量监测与分析方法研究随着网络技术的不断发展和普及,网络流量的监测与分析变得越来越重要。

基于软件定义网络(SDN)的网络流量监测与分析方法由于其灵活性、可扩展性和可编程性的优势,成为当前研究热点之一。

本文旨在探讨基于SDN的网络流量监测与分析方法的研究进展,包括流量监测原理、分析方法以及应用场景。

首先,我们来了解一下基于SDN的网络流量监测的原理。

SDN将网络控制平面和数据平面分离,通过集中式的控制器来对网络进行管理和控制。

在SDN中,流量监测通过将流量转发表项指向特定的监测点来实现。

这些监测点可以是交换机、路由器或专用的监测设备。

通过在SDN控制器中定义流量监测规则,可以对网络流量进行实时的监测和分析。

其次,基于SDN的网络流量分析方法可以分为两类:在线分析和离线分析。

在线分析是在网络实时运行时对流量进行分析,可以及时发现网络中的异常情况。

而离线分析是在离线环境下对网络流量进行分析,可以对历史流量进行深入挖掘和分析。

这两种方法可以相互结合,实现全面而深入的网络流量监测与分析。

在基于SDN的网络流量监测与分析方法中,常用的技术包括流量采样、流量分类和流量预测。

流量采样是一种常用的方法,通过对部分数据包进行采样,可以减少流量监测的开销。

流量分类可以将网络流量按照协议、应用或用户进行分类,从而对不同类型的流量进行有针对性的分析。

流量预测可以通过统计学和机器学习算法来分析历史流量数据,从而预测未来的流量趋势。

基于SDN的网络流量监测与分析方法可以应用于多个领域,包括网络安全、质量保证和性能优化等。

在网络安全方面,基于SDN的网络流量监测可以实时检测和响应网络中的威胁和攻击,从而加强网络的安全防护能力。

在质量保证方面,基于SDN的网络流量监测可以对网络中的延迟、丢包和带宽等指标进行实时监测和分析,从而提高网络的服务质量。

在性能优化方面,基于SDN的网络流量监测可以识别网络中的瓶颈和故障,并根据实时的流量情况进行网络优化,从而提高网络的性能和效率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

为类型 i 的样本数, 记为 FP i . 基于以上概念, 下面给出评价分类模型准确性的 3 个常 用指标: 类准确率( recall ) 、 类可信度( precision ) 以及整体准 确率( overall recall) 的描述, 计算方法如公式( 1 ) ~ ( 3 ) 所示: recall( i) = TP i TP i + FN i TP i TP i + FP i
用负载加密与新型应用的不断涌现, 无法获取数据包负载明 文以及未知应用语法与特征则导致此方法的有效性逐步下 降. 另外, 此方法需要丰富的存储资源与计算能力, 难适应高 带宽网络流量实时在线分类的应用 . 为了克服上述两种方法的不足, 近年来许多研究者开始 利用机器学习方法解决流量分类问题 . 机器学习方法不依赖 匹配协议端口或解析协议内容识别网络应用, 而是利用流量 在传输过程中表现出来的 " 网络流 " ( flow ) 的各种统计特征 区别网络应用, 方法本身不受动态端口 、 载荷加密甚至网络地 址转换的影响. 本文将对近年来基于机器学习的网络流量分 类方法进行分类综述, 比较指出常见方法的优势与不足并讨 论未来利用机器学习进行网络流量分类研究的挑战与方向 .
输入, 分类器经过预测计算并给出分类结果 . 另外, 利用实时 采集的网络流量, 可实时更新分类器以达到更好的分类性能 .
2
2. 1
基于机器学习的网络流量分类
基于流统计特征的机器学习流量分类 2. 2
图 2 机器学习流量分类器在线分类应用 Fig. 2 Data flow w ithin an operational supervised M L traffic classifier 特征选择算法 选取能代表网络应用本质区别的流特征, 对于流量应用 分类非常重要. 在数据挖掘与机器学习应用中, 特征选择通常 用于对数据进行预处理, 包括降维、 去冗余、 过滤无关特征、 提 高学习精度等等. 特征选择算法可分为过滤 ( filter ) 与封装 ( w rapper) 两种方法. 其中, Filter 特征选择算法的评价函数与 分类器无关, 尽管具有通用性强、 算法复杂度低的特点, 但对 某一个具体的分类器选择的特征子集也许并不是最优的 . 这 一类特 征 选 择 算 法 较 多, 如基于相关性的子集搜索方法 [9 ] FCBF[10] 等. CFS[8] 、 基于一致性的子集搜索方法 CON 、 Wrapper[11] 方法与其相反, 采用分类器的错误概率作为 评价函数, 因此对特定的分类器可以找到最优的特征子集, 但 算法复杂度很高, 此类方法的代表算法有基于遗传算 法 的 w rapper 方法[12] 等. 另外, 目前无监督的特征选择算法还比较 少, 在样本类别未知的情况下, 需要选用无监督的特征选择算 [13 ] 法, 如 Dash 等特出的一种基于熵的 Filter 模型 . 2. 3 机器学习分类方法性能评估策略 针对某一机器学习分类模型, 模型评估是指评价分类模 型在未知样本集上处理分类问题的能力, 其关键指标是对未 知样本的预测准确率. 若网络流量中包含 n 条网络流样本, 分
Table1
Category i
Classifier judgments
TP( true positive) : 类型 i 中的样本被分类模型正确预测 的样本数, 记为 TP i ; FN ( false negative) : 类型 i 中的样本被分类模型预测为 其它类型的样本数, 记为 FN i ; FP( false positive) : 不属于类型 i 的样本被分类模型预测
[2 ]
目前, 互联网应用正向纵深方向发展, 新的应用模式( 如 P2P) 与应用需求不断涌现, 网络流量不断增长并呈现多样 化, 给互联网运营与管理带来巨大压力与挑战 . 实时网络流量 分类对帮助互联网服务提供商了解网络运行状态 、 优化网络 运营与管理具有重要的意义 . 借助网络流量分类, 网络管理者 可以实时将网络中所有流量按不同应用类型进行划分与分 析, 为部署服务质量控制( QoS ) 机制提供依据, 并针对不同类 型的应用提供不同的服务质量等级, 从而避免减轻网络拥塞, 确保关键业务服务质量, 维持网络高效通畅运行 . 同时, 依靠 流量分类, 网络服务提供商可以预测网络业务的发展趋势, 合理的规划网络基础体系结构,使用户得到更好的上网体 验. 另外, 在网络安全方面, 流量分类是入侵检测系统( intruIDS ) 的核心部分[1] , sion detection system , 可发现网络中的突 发流量( 如蠕虫传播、 大规模分布式拒绝服务攻击等) 与未知
Advances in Machine Learning Based Network Traffic Classification
Abstract: M L ( machine learning ) employs statistical netw ork flow characteristics to assist in the IP traffic classification identification and classification,w hich is different w ith traditional methods that depend on w ell know n application port numbers or deeply inspecting the contents of packet payloads. M Lbased netw ork traffic classification has been researched w idely and developed rapidly. This survey review s the significant w orks that cover the dominant period since 2004 ,and categorize,analyze and compare them according to their choice of M L strategies w hich include supervised, unsupervised and semisupervised learning algorithms. We importantly discuss the orientations and challenges for the employment of M Lbased traffic classifiers in operational IP netw orks. M ore specifically ,the time and continuous classification and scalability of claskey issues such as sample labeling bottleneck,skew ed data distribution,realsification algorithms are discussed. Key words: machine learning ; netw ork flow ; netw ork traffic classification; statistical characteristics
[6 , 7 ]
图 1 有监督机器学习流量分类训练过程 Fig. 1 Training process of supervised M L based IP traffic classification 基于有监督机器学习流量分类的一般过程如图 1 、 图2 所示. 在图 1 中, 首先利用已标注应用类型的网络流作为训练 样本集, 并提取网络流统计特征( 如流持续时间、 分组数量、 最大分组长度、 分组到达时间间隔等等) , 同时, 如果训练样 本数量庞大, 通常需要进行数据抽样处理以降低训练复杂度; 其次, 在训练过程中, 通常先利用特征过滤或特征选择算法求 有利于减少算法学习时所 出对分类识别最有效的特征组合, 需要的数据量,减少执行时间和提高分类正确性 . 然而, 特征 进而使得分类 选择算法往往会导致特征选择的局部最优性, 结果不稳定. 在图 2 中, 利用分类器对网络实时流量进行分 根据分类器需求提取网络流相应的统计特征作为分类器 类,
分析数据包的有效负载来判断其是否包含与已知应用匹配的 特征. 此方法需以 2 个假设作为应用前提: 除数据包源与接收 者外的第三方能提取每个 IP 分组载荷明文; 需要分类的每种 已知应用的语法与特征 . 在此 2 个假设成立的情况下, 基于数 据包深度解析的流量分类具有准确率高的特点 . 然而, 随着应
1取防御遏制措施 . 传统的流量分类主要基于端口与基于分组深度解析两种 方法. 使用端口进行流量分类 是通过检查分组的传输层端 口号, 然后根据 IANA 定制的知名端口号与注册端口号列表 将分组与应用对应起来 . 然而, 随着网络应用的不断更新发 展, 使用端口号进行流量分类的缺陷日益明显 . 已有研究表 [3 , 4 ] , 明 流行的 P2P 与被动 FTP 等新型网络应用普遍利用随 机端口进行数据传输, 进而导致基于端口的流量分类方法已 不再适用. 级产品中广泛采用基于数据包深度解析的方法 基于端口的流量分类具有众多不可靠因素, 因此在工业 [5 ] , 主要依靠
别属于 m 种网络应用类型, 那么对类型 i, 其测试结果的邻接 1 表如表 所示, 其中: 表 1 类别 i 测试结果邻接表 The contingency table for category i
Expert judgments True Positive Negative TP FN False FP TN
基于机器学习的网络流量分类研究发展报告
摘 要: 机器学习方法不依赖匹配协议端口或解析协议内容, 而是利用网络流的各种统计特征识别网络应用, 近年来得到了广 泛关注和快速发展. 本文总结了基于机器学习的网络流量分类方法自 2004 年来的研究进展, 并且按有监督、 无监督与半监督的 区别进行分类、 分析与比较. 重点讨论了基于机器学习的网络流量分类研究的挑战与方向, 即解决样本标注瓶颈、 样本分布不平 衡与动态变化、 实时与连续分类以及分类算法可扩展性等核心问题 . 关 键 词: 机器学习; 网络流; 网络流量分类; 统计特征
相关文档
最新文档