基于K—means的视频智能存储算法
基于K—means的改进人工蜂群聚类算法

蜂群 ( A B C ) 聚类算法。将 改进 的人 工蜂群 算法和 K . me a n s 迭代 相结合 , 使算 法对初 始聚类 中心的依赖性 和 陷入局 部 最优解的可能性 降低 , 提 高 了算法的稳定性。通过 基于反向学 习的初 始化策略 , 增强 了初始群体的 多样性。利用非线 性选择策略 , 改善 了过早收敛问题 , 提 高了搜 索效率 。通过对邻域搜 索范围的动 态调整 , 提 高 了算法收敛速 度 , 增强 了
o p t i m u m,a n A r t i i f c i a l B e e C o l o n y( A B C )c l u s t e i r n g l a g o r i t h m b a s e d o n K - m e a n s w a s p r o p o s e d i n t h i s p a p e r .T h i s a l g o i r t h m
I mpr o v e d a r t i ic f i a l be e c o l o n y c l us t e r i n g a l g o r i t h m ba s e d o n K- me a n s
CAo Yo n g c h u n‘ . CAI Zh e n g qi .SHA0 Ya bi n
J o u r n a l o t C o mp u t e r Ap p l i c a t i o n s
I S SN 1 001 . 9 081
20l 4. 01 .1 0
计 算机 应 用, 2 0 1 4 , 3 4 ( 1 ) : 2 0 4—2 0 7 , 2 1 7 文章编号 : 1 0 0 1 — 9 0 8 1 ( 2 0 1 4 ) 0 1 — 0 2 4— 0 0 4
基于复合形遗传算法的K—means优化聚类方法

用 以代 表 C个 类 型 。
K—m as 类算 法 适用 于 在 窄 间 旱 现椭 球状 en 聚
复形 , 然后进行寻优搜索 , 包括反射 、 延伸 、 搜索 , 替代
复合形 中 目标 函数最 大 的点一最 差 点 , 如此 反 复进 行 ,
分 布 时的聚类 , 它足 一种 迭代 的聚类 算法 , 代过 程 中 迭 不 断地 移动簇 集 中的成 员 直 至 得 到理 想 的簇 集为 止 。
基金 项 目 : 安 巾 软科 学 基金 (4 R 3 ) 两 0 K 0 6
作者简 介: 赵
锋(9 1) 女 , 1 一 , 河南驻马J人 , 8 占 硕士研究 , 主要研究方向为数据挖掘 、 复杂系统建模 仿 真。
维普资讯
・
6 O・
航 空 计 算 技 术
l K— en 聚类算法 m as
K—m as 法 以 k为参 数 , n个 对 象分 为 c en 算 把 个簇 , 以使簇 内具有 较高 的相 似度 , 簇 问 的相似 度较
低。相似度的计算根据 ・ 中对象的平均值 ( 个簇 被看 作簇 的重心) 来进行。其 I 作原理为: 首先随机从数据
算法——复合形遗传算法 , 利用复合形法的较强的局
部搜 索能 力来 改善 遗 传 算 法种 群 的质 量 , 发 挥 两种 在
算法优点的同时克服 r各 自的缺点与不足, 人大提高
了收敛速度 。
库的优点 , 但是 , 也存在着很大的局 限性 : 聚类效果受 到初 始时 聚类 r心 的 影 响很 大 , 算 法 是 采用 梯 度 法 f 1 该
求解极值 , 结果往往是 局部最优, 得不到全局最优 而 解 。遗传算法仿效了遗传学中生物从低级到高级 的进化过程, 将进化操作应用于一群对搜索空间( 或称
基于K-means聚类算法的网络个性化学习行为研究

再变化 时终止 】 代使 得选 取 的聚类 中心越来越 接近 真 实 的簇 中心 , 。迭 聚类效 果将越 来越 好 , 最后 把 所有对 象划分 为 k个簇 。 K— a¥ me/ 聚类 算 法 的具 体步 骤 : l
输入 : 聚类 的数 目 k和包 含 n个数据 对象 的数据集 X:{ X , , ; X , … x f 输 出 : 个 簇 { S , , , 目标 函数 最小 。 k S ,: … S } 使 1 选 取聚类个 数 k ) 。 2 从数据集 中随机选 取 k 对 象作为初 始 的聚类 中心 c , … , ) 个 C , c。
表现出不同的学习行为和个性特征 , 远程教育工作者应根据学生 的个性化学习行 为, 当地将学生分 适 类, 从而有针对性地采取个性化教学策略, 提高教学效果。本文研究聚类分析的经典算法 K— e l算 m a¥ l 法- , 2 将其应 用于学 生 的网络学 习行 为 , 】 建立 了数据 挖掘模 型 , 合理 将学 生分类 , 进而提 出相 应 的教 学
尹 帮 治
( 河源市广播 电视 大学 工程技术教学部 , 广东 河源 [ 摘 5 70 ) 100
要] 聚类是 指按 照事物 问的相似性对事物进行 区分和 分类 的过 程。对 网络个性化 学习行为 中的
大量数据 , 首先对样本数据进行 了预处理 , 然后运用数据挖掘算 法 中的 K—m a8 法进行 分类, c. 算 n 获取各 类与
第2 5卷 第 9期
V0 . 5 No 9 12 .
荆 楚理 工 学 院 学报
J u n lo i g h n v ri f e h oo y o r a fJn c u U i est o c n l g y T
一种基于局部异常因子(LOF)的k-means算法

一种基于局部异常因子(LOF)的k-means算法陈静;王伟【摘要】聚类分析算法是数据挖掘技术的一个重要分支,目前其研究已经广泛应用于教育、金融、零售等众多领域并取得了较好的效果。
本文结合了基于划分和密度的聚类思想,提出了一个适用于挖掘任意形状的、密度不均的、高效的聚类算法。
%Cluster analysis is an important research field in data mining,at present,the research has been applied to the financial, retail and other fields, and have achieved good results.This paper studied partition and density clustering algorithm, proposed a new algorithm which is suitable for mining arbitrary shape and uneven density.【期刊名称】《电子测试》【年(卷),期】2016(000)012【总页数】2页(P60-61)【关键词】数据挖掘;聚类算法;局部异常因子【作者】陈静;王伟【作者单位】青岛职业技术学院,山东青岛,266555;青岛职业技术学院,山东青岛,266555【正文语种】中文随着数据挖掘技术应用领域越来越广泛,聚类分析也接受着各种严峻的“考验”:处理的数据类型的多样化,对大数据集进行高效处理的迫切需求,对任意形状聚类的有效识别等等。
这些都要求聚类算法能够具体高效、灵活等特点,因此,寻求一个高效、灵活的聚类算法,是研究人员的当务之急。
聚类分析方法是数据挖掘技术应用最广泛的算法之一。
在机器学习领域,聚类分析算法属于无指导型学习算法。
给定一组对象,聚类分析自动地将其聚集成k个集群,每个集群中的对象具有极高的相似度,而属于不同集群的对象间的相似度很低。
基于K-means聚类的数字半色调算法

t h e me t h o d p a r t i t i o n e d t h e g r a y i ma ge i n t o t wo ,t h r e e a n d f o u r r e g i o n s u s i n g K— me a n s i ma g e s e g me n t a t i o n me t h o d .E a c h c l u s t e -
d o i : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 1 - 3 6 9 5 . 2 0 1 3 . 0 1 . 0 7 9
Di g i t a l h a l f t o n i n g a l g o r i t h m b a s e d o n K- me a n s c l u s t e r i n g
基于k-means改进算法的入侵检测系统的研究

当前 系统 的入侵检测 , 实现对入侵行为 的识别和 预防。
Dso eyi D tb s ) 是 指从 大 型数据 库 或数 据仓 i vr n aa a e , c
1 引言
随着 Ient n re 的迅速发展 , t 信息安全 日益受到人们 的关 注, 为网络安全一 个组成部分 的入侵检 测技术 作 被重视起 来 , 并逐渐成为 保障 网络信 息安全不可 缺少 的部分 。基于 内容的 网络安全解决方案成为 人们研 究
关 心 王 新 ( 湛江 师范学院 广东省湛江市 5 4 4 ) 2 0 8
摘要 : 文介绍 了入侵检测 系统的基本概念 , 本 分析 了数据挖掘技术在入侵检 测 系统 中的应用。本 文主要研 究 了聚
类分析 中的 k— a s算法在入侵规则 匹配 中的应 用 , 出了该算法 的不足 , me n 指 通过对传 统 k —me n a s算法的改进 解决 了聚类算 法固有的无法预知最佳聚类个数和分类过 细的问题 。提 高了系统的规 则匹配效率。 关键词 : 入侵检测 数据挖掘 聚类分析
trs 、 en ) 约束 ( o s a t) 可视 化 ( i azt n ) C nt is 、 rn V u lai s 等。 s i o
广泛地 审计 数据来得 到模 型 , 而精确地捕 获实际 的 从
入 侵和 正常 的行 为 模 式。数 据 挖 掘 ( M, aa Mi D D t n — i ) 又称 为 数 据 库 中 的知 识 发 现 ( D K o tg n , g K D, n wa e
一种基于遗传算法的Kmeans聚类算法
一种基于遗传算法的K-means聚类算法一种基于遗传算法的K-means聚类算法摘要:传统K-means算法对初始聚类中心的选取和样本的输入顺序非常敏感,容易陷入局部最优。
针对上述问题,提出了一种基于遗传算法的K-means聚类算法GKA,将K-means算法的局部寻优能力与遗传算法的全局寻优能力相结合,通过多次选择、交叉、变异的遗传操作,最终得到最优的聚类数和初始质心集,克服了传统K-means 算法的局部性和对初始聚类中心的敏感性。
关键词:遗传算法;K-means;聚类聚类分析是一个无监督的学习过程,是指按照事物的某些属性将其聚集成类,使得簇间相似性尽量小,簇内相似性尽量大,实现对数据的分类[1]。
聚类分析是数据挖掘技术的重要组成部分,它既可以作为独立的数据挖掘工具来获取数据库中数据的分布情况,也可以作为其他数据挖掘算法的预处理步骤。
聚类分析已成为数据挖掘主要的研究领域,目前已被广泛应用于模式识别、图像处理、数据分析和客户关系管理等领域中。
K-means算法是聚类分析中一种基本的划分方法,因其算法简单、理论可靠、收敛速度快、能有效处理较大数据而被广泛应用,但传统的K-means算法对初始聚类中心敏感,容易受初始选定的聚类中心的影响而过早地收敛于局部最优解,因此亟需一种能克服上述缺点的全局优化算法。
遗传算法是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化搜索算法。
在进化过程中进行的遗传操作包括编码、选择、交叉、变异和适者生存选择。
它以适应度函数为依据,通过对种群个体不断进行遗传操作实现种群个体一代代地优化并逐渐逼近最优解。
鉴于遗传算法的全局优化性,本文针对应用最为广泛的K-means方法的缺点,提出了一种基于遗传算法的K-means聚类算法GKA(Genetic K-means Algorithm),以克服传统K-means算法的局部性和对初始聚类中心的敏感性。
用遗传算法求解聚类问题,首先要解决三个问题:(1)如何将聚类问题的解编码到个体中;(2)如何构造适应度函数来度量每个个体对聚类问题的适应程度,即如果某个个体的编码代表良好的聚类结果,则其适应度就高;反之,其适应度就低。
(完整版)X-means:一种针对聚类个数的K-means算法改进
X-means:一种针对聚类个数的K-means算法改进摘要尽管K-means很受欢迎,但是他有不可避免的三个缺点:1、它的计算规模是受限的。
2、它的聚类个数K必须是由用户手动指定的。
3、它的搜索是基于局部极小值的。
在本文中,我们引入了前两种问题的解决办法,而针对最后一个问题,我们提出了一种局部补救的措施。
根据先前有关算法改进的工作,我们引入了一种根据BIC(Bayesian Information Criterion)或者AIC(Akaike information criterion)得分机制而确定聚类个数的算法,本文的创新点包括:两种新的利用充分统计量的方式,还有一种有效地测试方法,这种方法在K-means算法中可以用来筛选最优的子集。
通过这样的方式可以得到一种快速的、基于统计学的算法,这种算法可以实现输出聚类个数以及他们的参量值。
实验表明,这种技术可以更科学的找出聚类个数K值,比利用不同的K值而重复使用K-means算法更快速。
1、介绍K-means算法在处理量化数据中已经用了很长时间了,它的吸引力主要在于它很简单,并且算法是局部最小化收敛的。
但是它有三点不可避免的缺点:首先,它在完成每次迭代的过程中要耗费大量的时间,并且它所能处理的数据量也是很少的。
第二,聚类个数K值必须由用户自身来定义。
第三,当限定了一个确定的K值时,K-means算法往往比一个动态K值的算法表现的更差。
我们要提供针对这些问题的解决办法,通过嵌入树型的数据集以及将节点存储为充分统计变量的方式来大幅度提高算法的计算速度。
确定中心的分析算法要考虑到泰森多边形边界的几何中心,并且在估计过程的任何地方都不能存在近似的方法。
另外还有一种估计方法,“黑名单”,这个列表中将会包含那些需要在指定的区域内被考虑的图心。
这种方法不仅在准确度上以及处理数据的规模上都表现的非常好,而这个快速算法在X-means 聚类算法当中充当了结构算法的作用,通过它可以很快的估计K值。
基于K—means算法的电子政务用户细分模型研究
三 、C M 及 其对 电子 政务 的借 鉴意 义 R
1 R 的基本 内涵 及客户 细分 C M CR 是一 种 “ M 以客户 为 中心 ” 的企 业商 务战 略 ,强调 个 性化
按 照 部 门提供 服 务 .使 得 办事 程序 重 复 、繁 琐 用 户需 要访 问 多
个 部 门网 站 ,由原 本 跑 多个 衙 门转 变 为在 网 站 上 访 问 多个 网站 . 服 务 的易 用性 大打 折 扣 。 ( )服 务效 果 差 。由于 电子 政务 建 设初 3 务的高效性。 第二 阶 段 是从 用户 对 象 的角 度提 供 服务 .即 以应 用主 题 或 用
二 电子 政 务 的 发展 阶段 及 面 临 的 问题
{ 电子政 务 的发 展阶 段
所谓 电子政 务 就 是公 共管 理部 门应 用 现代 信息 和通 信 技术 . 将 管理 和 服 务 的一 项 项具 体 业务 通 过 网络 技术 进 行 集成 .在 互 联 网上 实现 组 织结 构 和 工作 流 程 的优 化重 组 超 越 时 间 、空 间 与部 门分 隔 的限 制 ,全 方 位地 向社会 提 供优 质 、规 范 、透 明的管 理 和
据提 供 服 务 ,例 如将 服 务按 照 部 门分 类 。这 一 阶 段提 供 服 务 的主
要 特 点有 :( )服 务可 用性 低 。在 电子政 务 建设 初 期 .大 多 数政 1 府 网站都 按 照部 门提 供服 务 .用 户 只有 了 解政 府 机 构职 能 .才能 选 择 部 门进入 相应 的 服务 窗 口 。 ( 2)服 务易 用性 低 。 大 多数 网站
经 过 多 年 建设 ,我 国 的电 子政 务 已取 得 了 巨大 的成 就 ,围绕 多样 化 的需 求 为依 据 提 供 的个 性化 定 制 化服 务 ,例 如 将 用户 进 关 系 国计 民生 的 大事 要 务 ,围绕 企业 和 社 会公 众 的 实际 需 求 ,政 政务 经 历 了按 部 门提 供 服务 、按 用 户对 象 或应 用 主题 提 供服 务 的 发 展阶 段 ,当前 ,迎来 了个性 化 服务 的 发 展阶 段 ,要 求充 分 以 用 户 需 求 为依 据 提 供 个性 化 服 务 。
基于 k -means 算法的共享单车停放点放置策略
基于 k -means 算法的共享单车停放点放置策略摘要:共享单车以一种分时租赁模式,广泛投放在校园、地铁站点、公交站点、居民区、商业区等公共服务区,为居民的出行带来很大便利。
而选择恰当的共享单车停放点,是节约企业成本,方便用户骑行的关键。
本文运用上海某时间段某品牌共享单车的使用情况(包括骑行开始时间,结束时间,以及骑行轨迹等),基于k-means算法,分析求解共享单车停放点安置位置的问题。
关键词:共享单车停放点;聚类模型;k-means算法0问题重述题目的研究对象限定为共享单车,给出了上海某时间段某品牌共享单车的使用情况数据,包括骑行开始时间,结束时间,骑行轨迹等,并且给出两个问题——分析共享单车使用情况的时空分布特点、给出共享单车停放点“电子围栏”的放置策略。
1问题分析对于问题一,按照骑行起点坐标、终点坐标统计共享单车的使用情况数据,并绘制坐标图,得到共享单车使用情况的空间分布;按照骑行开始时间、结束时间统计共享单车的使用情况数据,并绘制柱状图,得到共享单车使用情况的时间分布。
对于问题二,需要根据大量骑行起止位置确定若干共享单车停放点,即使用较少的单车停放点覆盖较多的骑行起止位置,于是考虑建立聚类模型,把骑行起止位置分为若干聚类,每一聚类安置一个共享单车停放点。
2模型假设1.假定单车在使用过程中无违法乱纪偷车现象发生 2.城市道路较为密集,两处位置间的路程可以用两点间的距离近似代替 3.调度工作水平无限高,可以忽略共享单车的调度时间3符号说明:用户数量;:第i个骑行起止位置横坐标;:第i个骑行起止位置纵坐标;,:第j个用户开始骑行的时间;,:第j个用户结束骑行的时间;:在第p时的共享单车使用量;,:在第p时第j 个用户的共享单车使用指标;:某用户骑行满一小时的使用指标;:选取的聚类中心数量;:第q个聚类中心;:第q个簇;:总成本;:用户出行成本:调度成本:建造成本:建造一个电子围栏的成本指标;4问题一模型将(,)绘制在坐标系中,得到共享单车使用情况的空间分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于K—means的视频智能存储算法
作者:郝伟杰等
来源:《电子技术与软件工程》2015年第14期
智能存储是指将视频序列分割成几个完整的部分,方便客户回溯、查找可疑信息和视频后期处理,对于纯背景画面或者是那些长时间几乎没有变化的画面,选择放弃存储,在节约存储代价的同时也精简了视频序列。
以摄像头异常检测为基础,在视频监控阶段提取视频图像的特征,利用K-means聚类算法将帧图像分门别类、然后将其存储到事先准备好的标签下,形成标准的视频文件。
其过程包括动态特征提取、利用聚类算法进行聚类、将视频帧图像分类存储。
【关键词】动态特征提取 K-means聚类算法信息增益比率智能存储
1 引言
监控设备的普遍性带来了视频信息的爆发式增长,将这些海量信息分门别类、做上标记,然后将其选择性的储存,这一需求随之变得越来越迫切,因为这样不但能够帮助用户有效的检索相关信息和迅速的获取感兴趣的视频信息,而且能够节省大量的内存,但是这项工作需要一个能够对这些海量视频进行自动分析和处理的智能监控系统来完成。
通过智能监控系统可以将视频流分为三类选择性的存储:
(1)有运动目标的视频序列,可以用来实现人群密度估计、运动目标检测等。
(2)放弃纯背景的视频序列,节省内存。
(3)恶意遮挡摄像头、扭动摄像头的视频序列,方便对异常事件的定性并报警。
视频智能存储算法一般是在摄像头异常检测算法的基础上完成的,摄像头异常检测的基础主要是背景建模或特征提取。
背景建模主要有单高斯模型、码本模型、混合高斯模型等,上述算法缺乏实时性,因此不适合应用到视频智能存储算法上去。
文献[3]中首次将轮廓波应用到摄像头干扰异常检测中,通过比较背景图像与视频图像的特征函数做出判断,虽然该算法缺少自适应性,但可以借鉴特征提取的方法。
2 视频序列分割原理及特征提取
为提取视频流的特征,借鉴文献[4]中的方法,将摄像头拍摄到的视频流截成两段,分别存储到两个不同长度的缓存区中去,即长缓存区和短缓存区。
帧图像顺序被存放在短缓存区中,若短缓存区中已满,则将短缓存区中最先进来的那一帧视频图像存放到长缓存区中去,若长缓存区中也已满,则将长缓存区中最先进来的那一帧视频图像丢弃。
其存储流程如图1所示。
每一次抽样检测时,长短缓存区都会被比较然后判断异常是否发生。
短缓存区中的每一帧都要和长缓存区中的每一帧进行比较,取其比较结果的中值,记为Dbetween。
将长缓存区中的任意两帧视频图像进行比较,取其比较结果的中值,记为Dlong。
图2是在拍摄的几段视频中,随机抽取的一段视频,其中含有的事件个数为8个,分别是:有运动目标的3个(比较高的3个红线)、被扭动的2个(比较低的2个红线)、被遮挡的3个(蓝绿混合的3个突出的线)。
数据没有做对数变换。
从图2可以看出直方图的绝对差能够准确的反映出来帧图像序列的变化,当视频画面出现明显的变化时,相应的数值分量会达到不同的峰值,然后可以借助于聚类技术将相同范围内的数据峰值聚类到一起(尤其是K-means聚类算法具有很好的实时性,其复杂度为O(n),n 为对象个数)以这些峰值点为依据,将缓存区中前后连续的帧图像序列存储到事先准备好的标签下面,完成视频的智能存储。
3 以信息增益比率的加权距离计算方法为基础的K-means聚类算法
K-means聚类算法是把n个数据对象划分为k个类别,使每个类别中的数据点到该类的聚类中心的距离的平方和最小,算法具体流程如图3所示。
全部对象每被分配完一次就会被重新计算聚类中心,不断重复,直到标准测度函数收敛为止,一般采用均方差作为标准测度函数:
E为数据集合中所有对象的均方差之和,P为任一对象数据点,mi为类别Ci的均值。
在计算对象到各个聚类中心的距离计算中,欧氏距离是常用的计算方法,而权值信息能够完全的反映各个特征分量在聚类或者分类过程中对未知类别的倾向程度。
所以准确的权值为提高聚类质量提供了一个可能,若每一变量均可被赋予一个权值,以表示其所代表属性的重要性。
那么带权值的欧氏距离计算公式为:
在统计属性中,信息增益是衡量属性价值的一个好的定量标准。
因此属性的信息增益值决定了属性在分类过程中的贡献大小,而在聚类算法中,相似度的度量使用的是距离的计算方法,特征属性作为距离计算中的一个子量,所以它的信息增益值可以作为权值表示该属性在距离计算过程中的贡献大小。
现假设样本数据集合为X={x1,x2,…,xN},其属性集合为A={A1,A2,…,Aq},设Ai(1≤i≤q)具有v个值,利用属性Ai将X划分为v个子集{X1,X2,…,Xv},设分类属性具有m个值,根据分类属性将样本集合划分成m个子集{C1,C2,…,Cm},设Xij为子集Xj中属于类Ci的样本数量。
基于信息增益比率的属性加权计算步骤如下:
(1)若属性是连续的则将其进行离散化处理,否则省略此步骤;
(2)含有未知属性值的训练样本进行相应的处理;
步骤3 根据聚类结果,借助于长短缓存区将其补全以视频流的形式存储到相应的标签下面,完成对视频的动态智能存储。
4.2 仿真实验
测试视频采用分辨率为320*240的视频序列,选取了50个事件,依照采样规则,从中抽取出来1675个数据,然后将其分为两部分,其中训练样本数据集的个数为400个,包括纯背景事件中的96个数据对象、出现运动目标事件中的103个数据对象、摄像头被扭动事件中的103个数据对象以及摄像头被遮挡事件中的100个数据对象;剩下的1275个数据对象为测试数据集,其中包括在纯背景事件中的378个数据对象、出现运动目标事件中的294个数据对象、摄像头被扭动事件中的306个数据对象以及摄像头被遮挡事件中的297个数据对象。
(1)计算权值。
将上述400个测试样本记为S,分布如表1所示。
然后将其归一化,则得到相应的权值。
(3)将上述权值带入距离的计算公式,实验结果如表3所示。
在展示实验结果之前先引入两个概念,即检测率ρr和误报率ρe,测试数据集T={T1,
T2,T3,T4},Ti为各个事件相对应的数据总数,i=1,2,3,4,经过聚类后所得到的数据集记为T_k={T_k1,T_k2,T_k3,T_k4},其中T_ki为各个事件相对应的数据总数,且
T_ki=ri+ei,i=1,2,3,4,ri表示被正确聚类的个数,ei表示被错误聚类的个数。
能够得出上述实验结果中较高的准确率,与视频序列的特征提取方法准确、及时分不开;而且在K-means聚类过程中,使用了信息增益比率的加权距离计算方法来度量样本数据点和当前聚类中心点的相似度,依靠权值各个特征分量能够在聚类算法中的优势发挥出来。
5 结论
基于K-means的视频智能存储算法取得了较好应用成果,在动态多特征组合的基础上利用聚类算法将视频序列分门别类,达到智能存储的目的。
如何简单快捷选择聚类中心和减少对于运动目标的重复存储,是接下来研究的重点。
参考文献
[1]谭铁牛.智能视频监控技术概述[C].北京:第一届全国智能视觉监控学术会议,2002.
[2]C R Wren,A Azarhayejani.Pfinder: Real-Time Tracking of The Human[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,vol.19,no.7, pp.781-785,1997.
[3]梁爽.基于轮廓波的摄像头干扰检测[D].河北师范大学,2012.
[4]徐红丽.智能视频监控中的摄像头异常检测[D].河北工业大学,2012.
[5]杨圣云,袁德辉,赖国明.一种新的聚类初始化方法[J].计算机应用与软件,2007,8(24):51-52.
[6]Sergios Theodoridis.Pattern recognition[M].China:Publishing House of Electronics Industry,2010.
作者简介
郝伟杰(1985-),男,硕士研究生学历。
现供职于阳煤集团深州化工有限公司。
研究方向为图形图像处理。
作者单位
1.阳煤集团深州化工有限公司河北省衡水市 053000
2.石家庄市环境监测中心河北省石家庄市 050000。