视觉显著性检测:一种融合长期和短期特征的信息论算法

合集下载

视觉显著性检测算法及应用

视觉显著性检测算法及应用

• 91•1.概述显著性检测是计算机视觉领域的一个受关注领域。

其主要工作是通过建立视觉注意模型来模拟人的视觉系统。

在过去几十年中,视觉显著性和相关的认知神经学得到了广泛的研究。

人的视觉注意机制可以抑制不重要的信息,将有限的认知资源集中在场景中的重要刺激上。

在计算机视觉领域,显著性的研究是提出一种模拟人视觉注意机制的模型。

2.显著性检测算法的进展早期的视觉显著性算法从输入图像中提取如颜色、亮度、方向、运动等多方面的基本特征,通过数学计算形成各个特征的关注图,然后对数据进行归一化操作并融合特性信息得到视觉显著图。

现有的显著性检测的方法更加充分利用了各种图像信息:有利用背景先验的分层信息融合的、结合前后背景信息的、中心矩阵的、考虑多角度信息、融合多模型的、基于稀疏矩阵、基于背景检测的各种显著性检测算法。

近年来,随着人工智能技术的快速发展,在图像显著性检测领域引进了基于深度学习技术的卷积型神经网络CNN。

与基于对比度线索的传统方法不同,基于CNN的方法不在依赖人工方法设定特征,而是通过CNN自动计算特征值,减少了对中心偏置知识的依赖性,因此很多研究者采用了这种方法。

基于CNN的模型通常包括数十万个可训练的参数。

神经元具备可变接受字段大小特性,并拥有提供全局信息的能力。

3.视觉显著性检测算法的应用3.1 在目标跟踪领域的应用可以将视觉将显著性算法应用到移动目标跟踪。

结合视觉注意机制建立运动目标跟踪框架,使用时空显著算法,在测试视频序列上生成视觉图,在视觉图中找到对应重要区域,最终建立跟踪模型模型,实现移动目标跟踪。

对于复杂环境下的运动目标跟踪问题,可以将粒子滤波跟踪算法和视觉显著性特征算法相结合,利用显著性检测算法对待检测图片进行处理,对目标状态进行预测时采用二阶自回归模型,然后强化中心区域,同时弱化四周区域,生成最终显著图。

然后在视觉显著图中提取像素值较大的作为目标区域,同时自适应融合颜色特征,最终可以实现运动目标的跟踪。

基于深度神经网络的视觉显著性检测算法研究

基于深度神经网络的视觉显著性检测算法研究

基于深度神经网络的视觉显著性检测算法研究近年来,随着计算机视觉技术的快速发展,视觉显著性检测算法在多个领域得到了广泛运用。

视觉显著性检测可以识别图像或视频中最显著的区域,从而使图像或视频的理解更加容易。

这项技术在广告、图像检索、自动驾驶、医疗等领域,都有着重要的应用。

在视觉显著性检测算法中,基于深度神经网络的方法日益受到人们的关注。

这种方法可以有效地提高检测准确度,同时也可以减少复杂性和处理时间,使得该技术更加实用和具有可操作性。

一般来说,基于深度神经网络的视觉显著性检测算法主要包括四个步骤:特征提取、特征融合、分类器和显著性图生成。

首先,通过卷积神经网络从原始图像中提取有用的特征。

然后,特征融合将不同卷积层的特征进行组合,以便提高特征的表示能力和适应性。

接着,使用训练好的分类器判断图像中每个像素是否显著。

最后,根据分类的结果,生成与原始图像尺寸相同的显著性图。

在这个过程中,深度神经网络的一个关键优点是,它可以通过反向传播算法直接从数据中学习特征,而不需要手动设计和选择特征。

这使得深度神经网络可以更加准确地检测图像中的显著性区域,同时也可以避免在特征设计过程中产生的错误。

目前,基于深度神经网络的视觉显著性检测算法已经在许多应用场景中得到了广泛的应用。

例如,在广告行业中,该技术可以帮助广告商确定哪些区域更具吸引力,进而提高广告的点击率。

在自动驾驶领域,视觉显著性检测技术可以帮助车辆更好地感知周围环境,从而提高行驶的安全性和稳定性。

同时,在医疗领域,该技术可以协助医生自动诊断病情,帮助减少医疗工作的难度和繁重程度。

基于深度神经网络的视觉显著性检测算法的未来发展方向也非常值得关注。

其中之一的发展方向是集成多种深度神经网络结构,以便更好地发挥各自的优势。

另外,还可以探索如何将深度神经网络模型应用到视频显著性检测中,进一步扩展视觉显著性检测技术的适用范围和准确度。

总之,基于深度神经网络的视觉显著性检测算法是一种快速发展的技术,具有广泛的应用前景。

视觉显著性检测:一种融合长期和短期特征的信息论算法

视觉显著性检测:一种融合长期和短期特征的信息论算法
钱 晓 亮

郭 雷
韩 军伟
胡新 韬


( 西北工业 大学 自动化 学院 西安
7 1 0 1 2 9 1
要: 针对传统视觉显著性检测算法单纯使用 当前观测图像 的信息或是先验知识的不足 , 该文引入了长 期特征和
短期 特 征 的概 念 ,分 别 代表 先验 知识 和 当前 观 测 图 像 的 信 息 ,并 提 出 了一 种 基 于 信 息 论 的算 法 将 它 们 融 合 。 首先 , 分别 根 据 人 眼 跟 踪 数 据 和 当 前观 测 图像 的 内容 来 训 练 长 期和 短期 稀 疏 词 典 并 对 图 像进 行 稀 疏 编 码 , 将 得 到 的稀 疏 编
第3 5卷 第 7期 2 0 1 3年 7月







Vo1 . 3 5NO. 7 Ju 1 .2 01 3
J ou r n a l o f El e c t r o ni c s& I n f o r ma t i o n T e c h n o l o g y
视觉显著性检测 :一种融合 长期和短期特征的信息论算法
码作 为长期和短期特征 。 其次 , 针对现有算法只能在整幅图像 上或 是在一个 固定大小的局部邻域 内进行统计的缺 陷,
该文 提 出一 种 基 于 信 息 熵 的特 征概 率 分 布 估 计 方 法 , 该 方 法 可 以根 据 当 前 观测 图像 的具 体 情 况 自适应 地 选 择 一 个 最 佳 的 区域 大 小 来 计 算 长 期 和 短 期特 征 出现 的概 率 。 最 后 ,利用 香农 自信 息 来 输 出 图 像 的 显著 性 检 测 结 果 。同 8种 流 行算 法 在 公开 的人 眼 跟 踪 测 试库 上进 行 的主 观 和 定 量 的 实验 对 比证 明 了该 文 算 法 的 有 效性 。 关键 词 :模 式 识 别 ;视 觉 显 著性 检 测 ;长 期 特 征 ; 短 期特 征 ;信 息熵 ;香 农 自信 息

基于深度学习技术的视觉显著性检测研究

基于深度学习技术的视觉显著性检测研究

基于深度学习技术的视觉显著性检测研究摘要视觉显著性检测是计算机视觉领域的一个重要研究方向,在许多应用中具有广泛的应用前景。

本文基于深度学习技术,对视觉显著性检测进行了研究。

首先,介绍了视觉显著性检测的背景及其在实际应用中的意义。

然后,分析了目前主流的视觉显著性检测算法,并详细介绍了基于深度学习技术的视觉显著性检测算法。

最后,通过实验验证了所提出算法的有效性。

关键词:深度学习,视觉显著性检测,卷积神经网络,特征提取,实验验证AbstractVisual saliency detection is an important research direction in the field of computer vision and has broad application prospects in many applications. In this paper, we study visual saliency detection based on deep learning technology. First, the background of visual saliency detection and its significance in practical applications are introduced. Then, the current mainstream visual saliency detection algorithms are analyzed, and the visual saliency detection algorithms based on deep learning technology are introduced in detail. Finally, the effectiveness of the proposed algorithm is verified through experiments.Keywords: deep learning, visual saliency detection, convolutional neural network, feature extraction, experimental verification引言视觉显著性检测是计算机视觉领域的一个重要研究方向,它可以识别图像中最引人注目的区域,为图像处理、图像检索、目标跟踪等应用提供有力的支持。

视觉显著性检测

视觉显著性检测
Itti于1998年提出基于显著性的视觉注意模型,并在2001年度Nature上对该模型理论作了进一步的完善。 Itti的显著性模型最具代表性,该模型已经成为了自下而上视觉注意模型的标准。
图4 Itti模型
图5视觉显著性检测计算模型对于一幅输入的图像,该模型提取初级视觉特征:颜色(RGBY)、亮度和方位、 在多种尺度下使用中央周边(Center-surround)操作产生体现显著性度量的特征图,将这些特征图合并得到最终 的显著图(Saliency map)后,利用生物学中赢者取全(Winner-take-all)的竞争机制得到图像中最显著的空间位 置,用来向导注意位置的选取,最后采用返回抑制 (Inhibition of return)的方法来完成注意焦点的转移。视 觉显著性计算模型大致上可分为两个阶段:特征提取与特征融合。在特征融合阶段,可能存在自底向上的底层特 征驱动的融合方式,和自顶向下的基于先验信息与任务的融合方式。因此,视觉显著性检测模型框架大致表述为 如图 5所示。
算法
LC算法 HC算法
AC算法 FT算法
LC算法的基本思想是:计算某个像素在整个图像上的全局对比度,即该像素与图像中其他所有像素在颜色上 的距离之和作为该像素的显著值 。
图像中某个像素的显著值计算如下: 其中的取值范围为 [0,255],即为灰度值。将上式进行展开得: 其中N表示图像中像素的数量。 给定一张图像,每个像素的颜色值已知。假定,则上式可进一步重构: 其中,表示图像中第n个像素的频数,以直方图的形式表示。 LC算法的代码实现: 1、直接调用OpenCV接口,实现图像中像素的直方图统计,即统计[0,255]中每个灰度值的数量。 2、计算像素与其他所有像素在灰度值上的距离。 3、将灰度值图像中的像素值更新为对比度值(即距离度量)。

视觉显著性算法概述

视觉显著性算法概述

• 其中 为使用者设定的延迟因子。
PQFT模型
• 四元组图像可以表示为下列形式
q(t ) M (t ) RG(t )1 BY (t )2 I (t )3
其中 i , i 1,2,3,满足 i2 1 ,2 3 , 1 3 , 3 12 1 2 , q(t ) 可以写成如下形式
• 其中 I 为图像特征的几何平均向量, I hc 为对原始 图像的高斯模糊,采用 5 的二项式核。 5 为 L2 范数, x, y为像素点坐标 。
SR模型
• SR(Spectral Residual)模型是由Hou等人提出 来的,基于空间频域分析的算法之一,显著 R( f ) 图通过对剩余谱 做傅里叶逆变换得到。 • 剩余谱 定义为
S (Ik )
• 其中D( I k , Ii )为像素在Lab空间的颜色距离度量。如果 忽略空间关系,使得具有相同颜色的像素归到一起 ,得到每一个颜色的显著性值
S ( I k ) S (cl ) f j D(cl , c j )
FTS模型
• FTS(Frequency-Tuned Saliency)模型是由Achanta 等人提出的一种自底向上的显著性检测方法,通 过局部颜色和亮度特征的对比多尺度方法求像素 点显著值。 • 将原始图像由SRGB颜色空间转化成CIE颜色空间, 然后显著性映射定义为
S ( x, y ) I I hc
I ( x ) log( p ( x )) 为特征的概率密度函数。
p( x)
GBVS模型
• GBVS(Graph-Based Visual Saliency)模型是 在Itti的模型基础之上运用马尔可夫随机场 的特点构建二维图像的马尔可夫链,通过 求其平衡分布而得到显著图 • 算法步骤:

视觉显著性检测关键技术

视觉显著性检测关键技术
速模型的训练和提高其泛化能力。
跨领域自适应与泛化能力
总结词
通过跨领域自适应和泛化能力,使得模型能够适应不同 的应用场景和数据分布,提高其鲁棒性和泛化性能。
详细描述
跨领域自适应和泛化能力是视觉显著性检测的未来研究 方向之一。通过引入领域适应技术,模型可以自动地适 应不同的应用场景和数据分布,从而提高其鲁棒性和泛 化性能。此外,还可以通过引入增量学习技术,使得模 型能够不断地从新的数据中学习新的知识,从而不断地 提高其性能和泛化能力。
要点二
详细描述
多尺度特征融合的关键在于如何有效地利用不同尺度的特 征信息。这可以通过设计合适的数据融合算法,将不同尺 度的特征进行有机的结合,从而使得模型能够更好地感知 不同空间尺度的显著性信息。此外,还可以通过引入多尺 度卷积核或自适应地调整卷积核的大小,使得模型能够在 不同的空间尺度上进行特征提取。
05
结论与展望
研究成果总结
1
显著性检测技术已经取得了显著的进步,广泛应 用于计算机视觉和图像处理领域。
2
现有的显著性检测方法主要基于人类视觉系统、 图像纹理、颜色、方向、运动等特征,以及深度 学习等机器学习方法。
3
这些方法在图像分割、目标检测、图像识别等方 面都取得了较好的效果,但仍然存在一些挑战, 如处理速度和精度等问题。
精度。
发展自适应的显著性检测方法, 根据不同的场景和任务需求,自 动调整模型参数和策略,提高处
理速度和效率。
结合深度学习等机器学习方法, 研究更加智能化的显著性检测方 法,实现更加精准的目标检测和
识别。
THANKS。
基于深度学习的显著性检测
• 基于卷积神经网络的显著性检测:这类算法通过训练卷积 神经网络来学习图像的特征表达,并利用这些特征来计算 显著性值。特点是可以更好地捕捉图像的特征信息,但需 要大量的训练数据和计算资源。

显著性检测算法在图像处理中的应用

显著性检测算法在图像处理中的应用

显著性检测算法在图像处理中的应用在现代社会中,图像处理技术得到了广泛的应用。

随着人工智能技术的发展,如何准确地检测出一张图片中的重要信息,成为了图像处理领域研究的重点之一。

本文将介绍显著性检测算法在图像处理中的应用。

一、显著性检测算法的概念显著性检测算法是一种自动分析图像的方法,旨在识别并提取图片中的重要信息。

它通过计算图像中每个像素的显著性值,即像素在整张图片中的重要程度,来确定哪些区域是最显著、最引人注意的。

目前常见的显著性检测算法主要有两种,一种是基于全局信息的算法,即通过计算整张图片的特征来识别显著区域;另一种是基于局部信息的算法,即通过计算每个像素周围区域的特征来识别显著区域。

根据不同的应用场景,我们可以选择不同的算法。

二、显著性检测算法在目标检测中的应用显著性检测在目标检测中有着广泛的应用。

在计算机视觉领域中,目标检测是一个基本的任务。

其核心思想是从一张图片中找出某个指定的目标物体,进而提高计算机处理图片的准确性。

在目标检测时,显著性检测算法可以帮助我们准确地识别出目标所在的区域,并将其与其他区域进行区分。

比如,在一个由多个物体组成的图片中,我们通过显著性检测算法可以很容易地判断出哪个物体是被观察者需要寻找的目标物体,从而实现准确的目标检测。

三、显著性检测算法在图像分割中的应用图像分割是图像处理领域中的一项基础任务,其目的是把一幅图片分成若干部分,以达到提取图片结构和元素的目的。

在图像分割时,显著性检测算法可以帮助我们准确地区分出每个区域的显著性,从而实现更加精准的分割。

根据不同的应用场景,我们可以采用不同的显著性检测算法来实现图像分割。

比如,在医疗图像分割中,通过对病灶进行显著性检测,可以帮助医生更加准确地进行病情诊断和治疗。

在自然场景的图像分割中,显著性检测算法可以帮助我们更好地识别出景观中的各个构成元素,进而提高图像的整体质量和观赏效果。

四、显著性检测算法在图像增强中的应用图像增强是一种常见的图像处理任务,旨在使图像更加美观,或者提高图像中某些细节的可见性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第7期
钱晓亮等: 视觉显著性检测:一种融合长期和短期特征的信息论算法
1637
带有任何倾向性,也就是自由观测(free-viewing), 而自顶向下的显著性检测则是与具体的任务相关 联[4],不具有通用性,因此,目前绝大部分的视觉显 著性检测算法都是自底向上的。 已经有很多学者提出了各自的视觉显著性检测 算法。Koch 等人[5]提出了第 1 个视觉显著性计算模 型和显著图的定义,而该领域具有里程碑意义的视 觉显著性检测算法则是由 Itti 等人 [6] 提出,他们 先将图像用高斯金字塔进行表示,然后在各层分别 计算亮度、颜色和方向的中心外围对比度,将这些 底层特征各自正则化后叠加得到各层的特征图,最 后将各层的特征图也分别正则化后叠加从而得到最 终的显著图。 文献[6]基于特征融合的视觉显著性模型 目前仍是领域内的一个重要分支[7,8]。此外,还有基 基于频域分析的显著 于图论的显著性检测算法[9,10], [1113] ,基于机器学习的显著性检测算 性检测算法 法 [1416] , 以 及 基 于 全 局 对 比 度 的 显 著 性 检 测 算 法[17]。 以上列举的视觉显著性算法基本都是只依赖当 前观测图像的信息进行计算,然而,Zhang 等人[18] 指出,人们长久以来积累的先验知识在显著性检测 中也发挥着重要的作用,并用大量的人们经常会看 到的自然场景图像来代表先验知识,具体实现上, 文献 [18] 从众多自然场景图像中随机选取了大量的 8 8 图像块并将其训练成稀疏词典,这个稀疏词典 就被看作是先验知识的一个浓缩集合。如果我们把 稀疏词典看作是滤波器,将利用稀疏词典对图像进 行稀疏编码的过程看作是对图像的滤波,得到的稀 疏编码就可以看作是图像的特征,进一步,根据长 期积累的先验知识而训练出的稀疏词典,本文称之 为“长期稀疏词典” ,由此而得到的特征,本文称之 为“长期特征” 。文献[18]利用长期特征进行视觉显 著性检测,并通过一些心理学图片的视觉显著性检 测实验来说明,相比于仅依赖当前观测图像的视觉 显著性检测算法,他们的算法可以有效地解释人类 视觉搜索的不对称性,证明了使用先验知识的必要 性。 像文献[18]这样通过长期特征进行视觉显著性检 测的算法还有文献[19-23]等。然而,过往的先验知 识毕竟是有限的,人们时常也会看到一些自己未曾 见过的场景,更何况,在具体的算法实现时,我们 得到的先验知识的集合事实上也只是庞大的人类先 验知识库的一个很有限的子集,以长期稀疏词典为 例,由于我们用于训练稀疏词典的自然场景图像数 量有限,由此得到的稀疏词典自然也不可能是能描 述任意一幅观测图像的完备基。 综上可以看出,单纯地使用当前观测图像的信
息或是先验知识都存在缺陷,因此,本文引入了短 期特征来代表当前观测图像的信息,并提出了一种 基于信息论的算法将它和长期特征进行融合,实现 先验知识和当前观测信息的有效结合。所谓短期特 征,就是根据当前观测图像训练得到一个“短期稀 疏词典” , 再根据短期稀疏词典对当前观测图像进行 稀疏编码得到“短期特征” ,相对于先验知识的长期 积累,当前观测图像只是人们当下短时间内获取的 信息,因此本文称之为“短期” 。此外,在参照 He [23] 等人 最新提出的稀疏词典的训练样本选取办法以 及使用 Mairal 等人[24]最近推出的 SPAMS 工具箱之 后,我们还对现有的长期特征的计算方法进行了改 进。 本文提出的基于信息论的算法是利用香农自信 [19,21] (Shannon self-information) 来定义视觉显著 息 性的输出。香农自信息的计算主要包含两个部分, 一部分是特征的计算,在本文中就是长期和短期特 征的计算,另一部分是特征概率分布的估计。现有 的特征概率分布估计方法可以分成两大类,一类是 在整幅图像上进行估计[18,19],另一类是在一个固定 大小的局部邻域内进行估计[21],这两类算法分别会 导致一些在局部范围内出现概率较小和在全局范围 内出现概率较小的特征可能被忽略,然而,这两类 特征往往都是人眼所关注的。针对以上不足,本文 算法提出了一种基于信息熵的特征概率分布估计方 法,该方法可以根据当前输入图像的具体情况自适 应地选择一个最佳的区域大小来估计特征的概率分 布。同 8 种流行算法在公开的人眼跟踪测试库(eyetracking database)上进行的主观和定量的实验对比 证明了本文算法的有效性。 本文的主要贡献可归纳如下:(1)针对现有视觉 显著性检测算法单纯使用当前观测图像的信息或是 先验知识的缺陷,本文引入了长期特征(代表先验知 识)和短期特征(代表当前观测图像的信息)的概念, 并提出一种基于信息论的算法将它们融合;(2)提出 了一种基于信息熵的特征概率分布估计算法,它可 以根据当前观测图像的具体情况自适应地计算出一 个最佳的区域大小来估计特征出现的概率;(3)同 8 种流行算法在公开的人眼跟踪测试库进行了主观和 定量的实验对比。
(Institute of Automation, Northwestern Polytechnical University, Xi’an 710129, China) Abstract: In order for removing the drawback of the traditional visual saliency detection methods which solely used the information of current viewing image or prior knowledge, this paper proposes an information theoretic algorithm to combine the long-term features which imply the prior knowledge with short-term features which imply the information of current viewing image. Firstly, a long-term sparse dictionary and short-term sparse dictionary are trained using the eye-tracking data and current viewing image, respectively. Their corresponding sparse codes are regarded as the long-term and short-term features, respectively. Secondly, to reduce the problem of existing methods which derivated features on the entire image or a local neighborhood with the fixed size, an information entropy based the estimation method of probability distribution of features is proposed. This method can infer an optimal size of region adaptively according to the characteristics of the current viewing image for the calculation of probability of the appearance of long-tern and short-term features. Finally, the saliency map is formulated by Shannon self-information. The subjective and quantitative comparisons with 8 state-of-the-art methods on publicly available eye-tracking databases demonstrate the effectiveness of the proposed method. Key words: Pattern recognition; Visual saliency detection; Long-term features; Short-term features; Information entropy; Shannon self-information
第 35 卷第 7 期 2013 年 7 月
电 子 与 信 息 学 报 Journal of Electronics & Information Technology
Vol.35No.7 Jul. 2013
视觉显著性检测:一种融合长期和短期特征的信息论算法
钱晓亮

*


韩军伟
胡新韬
西安 710129)


(西北工业大学自动化学院
要: 针对传统视觉显著性检测算法单纯使用当前观测图像的信息或是先验知识的不足, 该文引入了长期特征和
短期特征的概念,分别代表先验知识和当前观测图像的信息,并提出了一种基于信息论的算法将它们融合。首先, 分别根据人眼跟踪数据和当前观测图像的内容来训练长期和短期稀疏词典并对图像进行稀疏编码, 将得到的稀疏编 码作为长期和短期特征。 其次, 针对现有算法只能在整幅图像上或是在一个固定大小的局部邻域内进行统计的缺陷, 该文提出一种基于信息熵的特征概率分布估计方法, 该方法可以根据当前观测图像的具体情况自适应地选择一个最 佳的区域大小来计算长期和短期特征出现的概率。最后,利用香农自信息来输出图像的显著性检测结果。同 8 种流 行算法在公开的人眼跟踪测试库上进行的主观和定量的实验对比证明了该文算法的有效性。 关键词:模式识别;视觉显著性检测;长期特征;短期特征;信息熵;香农自信息 中图分类号: TP391.4 DOI: 10.3724/SP.J.1146.2012.01251 文献标识码: A 文章编号: 1009-5896(2013)07-1636-08
相关文档
最新文档