视觉显著性算法概述

合集下载

一种基于颜色和纹理的显著性目标检测算法

一种基于颜色和纹理的显著性目标检测算法

一种基于颜色和纹理的显著性目标检测算法丁祖萍;刘坤;王成【摘要】Visual saliency detection has very important applications in many aspects such as image segmentation, adap-tive compression and object recognition. This paper presents a saliency detection algorithm based on HSV color, texture and spatial position. By this method, the image is divided into small pieces in order to get the local information of the image, and color saliency map is computed in combination with theimages’color uniqueness and spatial distribution to compute color saliency map. At the same time, the paper uses Gabor filters at different scales and directions to get the tex-ture feature vector, and then calculates the difference of texture feature vectors to get the texture saliency map. Finally, the combination of the two gets a final saliency map. The experimental results show that this method can get satisfactory results in terms of detection and noise immunity, etc.%视觉显著性检测是很多计算机视觉任务的重要步骤,在图像分割、自适应压缩和识别物体方面都有很重要的应用。

视觉显著性检测:一种融合长期和短期特征的信息论算法

视觉显著性检测:一种融合长期和短期特征的信息论算法
钱 晓 亮

郭 雷
韩 军伟
胡新 韬


( 西北工业 大学 自动化 学院 西安
7 1 0 1 2 9 1
要: 针对传统视觉显著性检测算法单纯使用 当前观测图像 的信息或是先验知识的不足 , 该文引入了长 期特征和
短期 特 征 的概 念 ,分 别 代表 先验 知识 和 当前 观 测 图 像 的 信 息 ,并 提 出 了一 种 基 于 信 息 论 的算 法 将 它 们 融 合 。 首先 , 分别 根 据 人 眼 跟 踪 数 据 和 当 前观 测 图像 的 内容 来 训 练 长 期和 短期 稀 疏 词 典 并 对 图 像进 行 稀 疏 编 码 , 将 得 到 的稀 疏 编
第3 5卷 第 7期 2 0 1 3年 7月







Vo1 . 3 5NO. 7 Ju 1 .2 01 3
J ou r n a l o f El e c t r o ni c s& I n f o r ma t i o n T e c h n o l o g y
视觉显著性检测 :一种融合 长期和短期特征的信息论算法
码作 为长期和短期特征 。 其次 , 针对现有算法只能在整幅图像 上或 是在一个 固定大小的局部邻域 内进行统计的缺 陷,
该文 提 出一 种 基 于 信 息 熵 的特 征概 率 分 布 估 计 方 法 , 该 方 法 可 以根 据 当 前 观测 图像 的具 体 情 况 自适应 地 选 择 一 个 最 佳 的 区域 大 小 来 计 算 长 期 和 短 期特 征 出现 的概 率 。 最 后 ,利用 香农 自信 息 来 输 出 图 像 的 显著 性 检 测 结 果 。同 8种 流 行算 法 在 公开 的人 眼 跟 踪 测 试库 上进 行 的主 观 和 定 量 的 实验 对 比证 明 了该 文 算 法 的 有 效性 。 关键 词 :模 式 识 别 ;视 觉 显 著性 检 测 ;长 期 特 征 ; 短 期特 征 ;信 息熵 ;香 农 自信 息

视觉显著性检测

视觉显著性检测
Itti于1998年提出基于显著性的视觉注意模型,并在2001年度Nature上对该模型理论作了进一步的完善。 Itti的显著性模型最具代表性,该模型已经成为了自下而上视觉注意模型的标准。
图4 Itti模型
图5视觉显著性检测计算模型对于一幅输入的图像,该模型提取初级视觉特征:颜色(RGBY)、亮度和方位、 在多种尺度下使用中央周边(Center-surround)操作产生体现显著性度量的特征图,将这些特征图合并得到最终 的显著图(Saliency map)后,利用生物学中赢者取全(Winner-take-all)的竞争机制得到图像中最显著的空间位 置,用来向导注意位置的选取,最后采用返回抑制 (Inhibition of return)的方法来完成注意焦点的转移。视 觉显著性计算模型大致上可分为两个阶段:特征提取与特征融合。在特征融合阶段,可能存在自底向上的底层特 征驱动的融合方式,和自顶向下的基于先验信息与任务的融合方式。因此,视觉显著性检测模型框架大致表述为 如图 5所示。
算法
LC算法 HC算法
AC算法 FT算法
LC算法的基本思想是:计算某个像素在整个图像上的全局对比度,即该像素与图像中其他所有像素在颜色上 的距离之和作为该像素的显著值 。
图像中某个像素的显著值计算如下: 其中的取值范围为 [0,255],即为灰度值。将上式进行展开得: 其中N表示图像中像素的数量。 给定一张图像,每个像素的颜色值已知。假定,则上式可进一步重构: 其中,表示图像中第n个像素的频数,以直方图的形式表示。 LC算法的代码实现: 1、直接调用OpenCV接口,实现图像中像素的直方图统计,即统计[0,255]中每个灰度值的数量。 2、计算像素与其他所有像素在灰度值上的距离。 3、将灰度值图像中的像素值更新为对比度值(即距离度量)。

基于视觉显著性的图像融合研究

基于视觉显著性的图像融合研究

基于视觉显著性的图像融合研究随着计算机技术的不断发展,图像处理技术已经成为了一个不可忽视的领域。

其中,图像融合技术在许多领域都得到了广泛的应用,如监控、遥感以及医学图像等领域。

其中,基于视觉显著性的图像融合是当前研究的热点之一。

一、视觉显著性的概念和特征视觉显著性是指场景中与众不同的、引人注目的部分。

在人的视觉系统中,视觉显著性是通过底层特征和高层特征进行计算的。

底层特征指的是色度、亮度等基本的图像特征。

高层特征则是指图像的纹理、形状等高级特征。

而视觉显著性的计算则是通过这些特征综合得出的。

二、基于视觉显著性的图像融合技术基于视觉显著性的图像融合技术通过计算图像各部分的视觉显著性,从而实现对不同输入图像的融合。

这种算法的核心是图像区域的加权,以保持图像的平滑过渡。

该技术的应用非常广泛,如监控、遥感以及医学图像等领域。

三、基于“视觉热力图”的图像融合技术在视觉显著性的基础上,又出现了基于“视觉热力图”的图像融合技术。

这种技术可以给出一个与输入图像大小相同的视觉显著性热力图,这个热力图可以精确地区分图像中的显著部分和不显著部分。

该技术因其高效和精度而备受关注。

四、基于机器学习的图像融合技术除了视觉显著性之外,机器学习技术也被应用于图像融合领域。

机器学习技术可以自主学习图像特征,根据特征将各个图像区域分为显著和不显著。

这种技术的优点是可以应用于各种场景和各种类型的图像,与传统技术相比,融合效果更加自然、准确。

五、基于深度学习的图像融合技术深度学习技术在图像融合领域也得到了广泛的应用。

深度学习技术可以学习输入图像的特征,并以不断迭代的方式自主学习图像融合的过程。

深度学习技术可以在不看先前的图像融合结果的情况下自主进行图像融合,从而大大提高了融合效果和自主性。

六、结语基于视觉显著性的图像融合技术是目前图像处理领域中的热点之一。

不同于传统的图像融合技术,视觉显著性技术可以有效的保留图像的细节和显著部分,从而使得融合效果更加自然、准确。

基于超像素的显著性目标检测算法改进

基于超像素的显著性目标检测算法改进

基于超像素的显著性目标检测算法改进超像素是指在图像中将相邻像素按照一定规则进行分组,形成具有一定空间连续性的像素块。

在图像处理领域,超像素通过减少像素数量并保留图像中的重要结构信息,可以有效提高诸如显著性目标检测等计算机视觉任务的性能。

本文将讨论基于超像素的显著性目标检测算法改进的方法和技术。

显著性目标检测是计算机视觉中一个重要的任务,该任务旨在自动地从图像中准确地检测出显著性目标。

目前广泛应用的基于超像素的显著性目标检测算法通常包含以下几个步骤:超像素分割、显著性计算和二值化分割。

在超像素分割步骤中,图像被划分为多个超像素,以减少计算量并保留图像的结构信息。

在显著性计算步骤中,每个超像素被赋予一个表示其显著性的值,该值可用于衡量超像素相对于其周围区域的显著性程度。

最后,在二值化分割步骤中,基于显著性值,将图像分割为显著和非显著两个区域。

然而,现有的基于超像素的显著性目标检测算法仍然存在一些问题。

首先,超像素分割的质量对显著性检测的准确性有着很大的影响。

不同的超像素分割算法可能导致不同的分割质量,进而影响到显著性计算的结果。

其次,现有算法在显著性计算方面存在一定的不足,往往无法准确地捕捉图像中显著性目标的特征。

此外,二值化分割阶段的阈值选择也是一个有待解决的问题,往往需要手动调整。

针对以上问题,我们提出了几种改进基于超像素的显著性目标检测算法的方法。

首先,我们可以采用更先进的超像素分割算法,以提高分割的准确性。

近年来,一些基于深度学习的超像素分割算法取得了较好的效果,可以尝试将它们应用于显著性目标检测。

其次,我们可以引入更多的特征来计算超像素的显著性值。

例如,可以利用卷积神经网络提取图像的语义特征,并将其应用于显著性计算。

这样可以提高显著性计算的准确性和鲁棒性。

最后,在二值化阶段,可以使用自适应的方法选择合适的阈值,减少人工干预。

此外,为了进一步提高基于超像素的显著性目标检测算法的性能,还可以考虑以下几个方面的改进。

视觉显著性检测方法及其在轨道交通中的工程应用研究

视觉显著性检测方法及其在轨道交通中的工程应用研究

视觉显著性检测方法及其在轨道交通中的工程应用研究视觉显著性检测是计算机视觉领域的一个重要研究方向,主要用于模拟人眼视觉系统,对图像或视频中的显著性目标进行检测和定位。

视觉显著性检测方法可以应用于多个领域,其中之一就是轨道交通工程。

本文将探讨视觉显著性检测方法及其在轨道交通中的工程应用研究。

首先,我们来了解一下视觉显著性检测方法。

视觉显著性检测主要分为两个步骤:低层特征提取和显著性分析。

低层特征提取是指从原始图像中提取一些与显著性目标相关的特征信息,例如颜色、纹理、对比度等。

显著性分析是指基于低层特征对图像中的显著性目标进行定位和评估。

常用的视觉显著性检测方法包括频域方法、时域方法、时频域方法和深度学习方法等。

1.交通行为分析:通过对交通图像进行视觉显著性检测,可以提取交通参与者的行为特征,例如车辆的行驶轨迹、行驶速度、车距等。

基于这些行为特征,可以对交通状况进行分析,从而指导交通控制和规划。

2.目标检测与跟踪:在轨道交通监控系统中,往往需要对车辆、行人等目标进行检测和跟踪。

视觉显著性检测可以帮助识别并跟踪显著目标,从而提高监控系统的准确性和效率。

3.交通事件检测与预警:视觉显著性检测可以帮助监测交通中的异常事件,例如车辆违规、事故发生等。

通过及时检测并预警这些异常事件,可以提高道路交通的安全性和效率。

4.基于显著性的图像增强:视觉显著性检测可以帮助提高轨道交通监控图像的质量和清晰度。

通过对图像中的显著目标进行增强处理,可以使监控图像更加鲜明和清晰,提高交通监控系统的可用性和可靠性。

综上所述,视觉显著性检测是轨道交通工程中的一项重要研究内容,可以应用于交通行为分析、目标检测与跟踪、交通事件检测与预警以及图像增强等方面。

未来,随着计算机视觉技术的进一步发展和研究,视觉显著性检测方法在轨道交通领域的应用前景将更加广阔。

视觉显著性算法概述

视觉显著性算法概述

• 其中 为使用者设定的延迟因子。
PQFT模型
• 四元组图像可以表示为下列形式
q(t ) M (t ) RG(t )1 BY (t )2 I (t )3
其中 i , i 1,2,3,满足 i2 1 ,2 3 , 1 3 , 3 12 1 2 , q(t ) 可以写成如下形式
• 其中 I 为图像特征的几何平均向量, I hc 为对原始 图像的高斯模糊,采用 5 的二项式核。 5 为 L2 范数, x, y为像素点坐标 。
SR模型
• SR(Spectral Residual)模型是由Hou等人提出 来的,基于空间频域分析的算法之一,显著 R( f ) 图通过对剩余谱 做傅里叶逆变换得到。 • 剩余谱 定义为
S (Ik )
• 其中D( I k , Ii )为像素在Lab空间的颜色距离度量。如果 忽略空间关系,使得具有相同颜色的像素归到一起 ,得到每一个颜色的显著性值
S ( I k ) S (cl ) f j D(cl , c j )
FTS模型
• FTS(Frequency-Tuned Saliency)模型是由Achanta 等人提出的一种自底向上的显著性检测方法,通 过局部颜色和亮度特征的对比多尺度方法求像素 点显著值。 • 将原始图像由SRGB颜色空间转化成CIE颜色空间, 然后显著性映射定义为
S ( x, y ) I I hc
I ( x ) log( p ( x )) 为特征的概率密度函数。
p( x)
GBVS模型
• GBVS(Graph-Based Visual Saliency)模型是 在Itti的模型基础之上运用马尔可夫随机场 的特点构建二维图像的马尔可夫链,通过 求其平衡分布而得到显著图 • 算法步骤:

显著性检测算法在图像处理中的应用

显著性检测算法在图像处理中的应用

显著性检测算法在图像处理中的应用在现代社会中,图像处理技术得到了广泛的应用。

随着人工智能技术的发展,如何准确地检测出一张图片中的重要信息,成为了图像处理领域研究的重点之一。

本文将介绍显著性检测算法在图像处理中的应用。

一、显著性检测算法的概念显著性检测算法是一种自动分析图像的方法,旨在识别并提取图片中的重要信息。

它通过计算图像中每个像素的显著性值,即像素在整张图片中的重要程度,来确定哪些区域是最显著、最引人注意的。

目前常见的显著性检测算法主要有两种,一种是基于全局信息的算法,即通过计算整张图片的特征来识别显著区域;另一种是基于局部信息的算法,即通过计算每个像素周围区域的特征来识别显著区域。

根据不同的应用场景,我们可以选择不同的算法。

二、显著性检测算法在目标检测中的应用显著性检测在目标检测中有着广泛的应用。

在计算机视觉领域中,目标检测是一个基本的任务。

其核心思想是从一张图片中找出某个指定的目标物体,进而提高计算机处理图片的准确性。

在目标检测时,显著性检测算法可以帮助我们准确地识别出目标所在的区域,并将其与其他区域进行区分。

比如,在一个由多个物体组成的图片中,我们通过显著性检测算法可以很容易地判断出哪个物体是被观察者需要寻找的目标物体,从而实现准确的目标检测。

三、显著性检测算法在图像分割中的应用图像分割是图像处理领域中的一项基础任务,其目的是把一幅图片分成若干部分,以达到提取图片结构和元素的目的。

在图像分割时,显著性检测算法可以帮助我们准确地区分出每个区域的显著性,从而实现更加精准的分割。

根据不同的应用场景,我们可以采用不同的显著性检测算法来实现图像分割。

比如,在医疗图像分割中,通过对病灶进行显著性检测,可以帮助医生更加准确地进行病情诊断和治疗。

在自然场景的图像分割中,显著性检测算法可以帮助我们更好地识别出景观中的各个构成元素,进而提高图像的整体质量和观赏效果。

四、显著性检测算法在图像增强中的应用图像增强是一种常见的图像处理任务,旨在使图像更加美观,或者提高图像中某些细节的可见性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

AIM模型
• AIM(Attention-based on Information Maximization )模型利用香农的自信息度量,将图像的特征平 面变换到对应于视觉显著性的维度上。 • AIM假设:一个视觉特征的显著性就是该特征相 对于它周围其他特征提供的信息的差别度。 • 根据香农定理,图像特征对应的自信息通过下面 的公式进行计算
PQFT模型
t 1,2,, T, T • 假设 F (t ) 表示时间t时刻的输入图像, 为所有图像帧的总数。 F (t ) 分为红、绿、蓝三个颜 色通道,表示为 r (t ), g (t ),b(t ) ,那么,可以将三 个颜色通道扩展为四个广义的颜色通道:
g (t ) b(t ) 2 r (t ) b(t ) G (t ) g (t ) 2 g (t ) r (t ) B(t ) b(t ) 2 R(t ) r (t )
q(t ) f1 (t ) f 2 (t ) 2 f1 (t ) M (t ) RG(t ) 1 f 2 (t ) BY (t ) I (t ) 1
PQFT模型
• 将图像中每一个像素点表示为 q(n, m, t ) ,(n, m) 为空间坐标, t为时间坐标。四元傅里叶图像变化 写成 Q[u, v] F1[u, v] F2[u, v]2
SDSR模型
• 对于像素点i,与之对应的特征矩阵 Fi ,给 定像素点i周围相邻的像素点特征矩阵 Fj , 显著性映射为
Si

N j 1
exp(
1 1 ( Fi , F j )

2
)
Fi Fj • 其中 ( Fi , Fj )为矩阵 和 的余弦相似性, 为局部权重参数。局部特征矩阵的列表示 局部指导核的输出
研究现状
• Goferman将显著性分析算法分成以下三类
– 考虑局部特征的,如Itti 算法和GBVS 算法
– 考虑整体性的,如SR 算法和Achanta 等[3] 提出 的算法(IG 算法) – 局部与整体结合的,如Goferman等[7]和Liu 等 提出的算法
算法模型介绍
Itti模型
• Itti 模型中, 显著值是像素点在颜色、亮度、方向 方面与周边背景的对比值。该模型包括两个步骤: – 特征提取 – 显著图生成
PQFT模型
• 可将 q(t ) 表示为 Q(t ) 的极坐标形式
Q(t ) Q(t ) e(t )
• 其中 (t ) 为Q(t ) 的相位谱。设定 Q(t ) 1 ,则只剩 下相位信息q(t ) 。计算逆相位信息 q' (t ) 可得到
q' (t ) 0 (t ) 1 (t )1 2 (t )2 3 (t )3
• 时空显著性映射为 sM (t ) g * q ' (t )
2
• 其中g表示二维高斯平滑滤波。当输入为静态图像 M (t ) 0 。 时,
SDSR模型
• SDSR(Saliency Detection by SelfResemblance)模型由Seo等人提出的,通过 计算感兴趣像素点的特征矩阵与其相邻的 像素点的特征矩阵之间的相似性,来确定 像素点的显著性映射。 • 每一个像素点的局部图像结构表示成一个 局部描述子(局部回归核)矩阵;然后, 利用矩阵余弦相似计算量化每一个像素点 和它相邻的像素点对应的局部描述子矩阵 之间的相似性。
det(Ci ) ( xl xi )T Cl ( xl xi ) K ( xl xi ) exp( ) 2 2 h 2h
SDSR模型
SUN模型
• SUN(Saliency Using Natural Statistics)模型由Zhang 等人提出的,模仿视觉系统检测潜在的目标。 • 假设z代表视觉区域中的一个点。二值随机变量C代 表该点是否属于目标,L表示该点的坐标位置,F表 示该点的视觉特征。 定义为 , sz p(C 1 | F f z , L lz ) 分别表示点z的特征和坐标。根据贝叶斯定理
FTS模型
• FTS(Frequency-Tuned Saliency)模型是由Achanta 等人提出的一种自底向上的显著性检测方法,通 过局部颜色和亮度特征的对比多尺度方法求像素 点显著值。 • 将原始图像由SRGB颜色空间转化成CIE颜色空间, 然后显著性映射定义为
S ( x, y ) I I hc
• 其中 I 为图像特征的几何平均向量, I hc 为对原始 图像的高斯模糊,采用 5 的二项式核。 5 为 L2 范数, x, y为像素点坐标 。
SR模型
• SR(Spectral Residual)模型是由Hou等人提出 来的,基于空间频域分析的算法之一,显著 R( f ) 图通过对剩余谱 做傅里叶逆变换得到。 • 剩余谱 定义为
Self inf ormation ( bottom up saliency) Log likelihood ( top down knowledge of appearance )

log p(C 1 | L lz )
Location prior ( top down knowledge of t arg et ' s location)
I ( x ) log( p ( x )) 为特征的概率密度函数。
p( x)
GBVS模型
• GBVS(Graph-Based Visual Saliency)模型是 在Itti的模型基础之上运用马尔可夫随机场 的特点构建二维图像的马尔可夫链,通过 求其平衡分布而得到显著图 • 算法步骤:
– 特征的提取:与Itti 算法类似 – 显著图生成 :马尔可夫链方法
R( f )
R( f ) log(A( f ) hn ( f ) * log(A( f ))) • 其中, 为原图二维傅里叶变换得到的频域 A( f ) 空间, 为局部平均滤波器(一般n取3)
hn ( f )
QFT模型
• PQFT(Phase Spectrum of Quaternion Fourier Transform)模型是由Guo等人在Spectral Residual基础之上提出的,该方法通过计算图像 的四元傅里叶变换的相位谱得到图像的时空显著 性映射。 • 事实上,图像的相位谱即图像中的显著性目标。 图像中的每一个像素点都用四元组表示:颜色, 亮度和运动向量。 • PQFT模型独立于先验信息,不需要参数,计算 高效,适合于实时显著性检测
( bottom up saliency) T arg et dependent ( top down saliency)
• 对上式两边同时取对数,由于对数函数是单调增 加的,因此不会影响各点的显著值排列
log sz log p( F f z ) log p( F f z | C 1)
S (Ik )
• 其中D( I k , Ii )为像素在Lab空间的颜色距离度量。如果 忽略空间关系,使得具有相同颜色的像素归到一起 ,得到每一个颜色的显著性值
S ( I k ) S (cl ) f j D(cl , c j )
f z , lz
sz p(C 1 | F f z , L lz ) p( F f z , L lz | C 1) p(C 1) p( F f z , L l z )
SUN模型
• 假设特征和坐标相互独立,那么
sz p( F f z , L lz ) p( L lz | C 1) p(C 1) p( F f z ) p( L lz ) 1 p( F f z | C 1) p(C 1 | L lz ) p( F f z ) Likelihood Location prior T arg et independent
SUN模型

log p( F f z只依赖于点 ) z的视觉特征,独立于任何
先验信息。在信息论中,该项实际上求随机变量F 取值为时的 f自信息。 z log p(F f z C 体现了目标的先验信息。比如,当知 1) • 道目标物体为绿色时,那么该项的值在遇到绿色点 时比遇到蓝色点要大。 log p(C 1 L l独立于视觉特征,反映了目标物体位 • z) 置的先验信息。一般情况下,我们并不知道目标的 位置信息和目标的视觉特征,于是我们省略后两项 ,只剩下自信息这一项
研究现状
• 显著性检测一般分为两类
– 自下而上基于数据驱动的显著性区域突现 – 自上而下任务驱动的目标突现
• 本报告只关注自下而上的显著性检测算法
研究现状
• Achanta 将这些算法分成三类
– 基于低层视觉特征,代表性算法是文献[1]中提出的模 拟生物体视觉注意机制的选择性注意算法(Itti 算法) – 没有基于任何生物视觉原理的纯数学计算方法,如 Achanta 等[4] 提出的全分辨率算法(AC 算法) 和Hou 等 [5] 提出的基于空间频域分析的剩余谱算法 (Spectralresidual approach, SR) – 将前两种进行融合的方法,代表性算法是Harel 等[6] 提 出的基于图论的算法(Graph-based visual saliency, GBVS)
r (t ) g (t ) r (t ) g (t ) Y (t ) b(t ) 2 2
PQFT模型
• 类似于人类视觉系统,对立颜色通道定义为
RG(t ) R(t ) G(t ), BY (t ) B(t ) Y (t )
• 亮度通道和运动通道定义为
r (t ) g (t ) b(t ) I (t ) 3 M (t ) I (t ) I (t )
相关文档
最新文档