基于Grad-CAM与B-CNN的细粒度图像分类方法研究

合集下载

细粒度图像分类算法研究与实现

细粒度图像分类算法研究与实现

细粒度图像分类算法研究与实现第一章引言细粒度图像分类是计算机视觉领域一个重要而具有挑战性的问题。

相较于一般的图像分类任务,细粒度图像分类要求对相同类别的物体进行更为准确的分类。

在实际应用中,精确的细粒度图像分类算法可以帮助我们识别出产品的具体型号、判断某种物种的品种等。

第二章相关技术2.1 传统图像分类方法传统的图像分类方法主要包括特征提取和分类器构建两个步骤。

其中,特征提取是一个关键步骤,常用的方法包括SIFT、HOG等。

在细粒度图像分类中,传统的特征提取方法往往无法提取到足够细致的特征信息,导致分类准确率较低。

2.2 深度学习方法深度学习方法在细粒度图像分类中取得了显著的成果。

卷积神经网络(CNN)作为深度学习的核心模型,已成为细粒度图像分类的主流方法。

通过多层卷积和池化操作,CNN可以提取到更丰富的特征信息。

2.3 细粒度图像分类数据集数据集的选择对于算法的训练和评估至关重要。

目前常用的细粒度图像分类数据集有CUB-200-2011、FGVC-Aircraft、Stanford Dogs等。

这些数据集中包含了大量具有细粒度差异的类别,为算法的研究和实现提供了有力的支持。

第三章细粒度图像分类算法研究3.1 局部区域检测算法局部区域检测算法是一种常用的细粒度图像分类方法。

它通过在整个图像中检测并提取局部区域的特征,进而将物体分为不同的类别。

该算法主要包括区域选择、特征提取和分类器训练三个步骤。

3.2 基于注意力机制的算法注意力机制是一种模仿人类视觉注意力机制的思想,用于提高分类算法在细粒度图像分类中的表现。

通过学习注意力,算法可以关注物体的关键部位,提取到更准确的细粒度特征。

3.3 基于深度学习的算法深度学习在细粒度图像分类中的应用已经取得了很好的效果。

通过构建深度神经网络,可以从原始图像中直接学习到具有区分度的特征表示,从而实现更精确的分类。

同时,还可以通过迁移学习和模型融合等技术进一步提高算法的性能。

细粒度图像分类技术研究与应用

细粒度图像分类技术研究与应用

细粒度图像分类技术研究与应用一、细粒度图像分类技术概述细粒度图像分类技术指的是对含有多个子类别的图像进行分类任务。

相比较于普通图像分类,细粒度图像分类存在着更多的挑战,因为子类别之间差异微小,需要更加精细的特征提取和分类模型才能取得较好的性能。

近年来,深度学习技术的发展,尤其是卷积神经网络(CNN)的出现,大大推动了细粒度图像分类技术的提升。

下面就从特征提取和分类模型两个方面对细粒度图像分类技术的研究进展进行介绍。

二、细粒度图像特征提取作为图像分类任务不可或缺的一环,特征提取是影响分类精度的一个关键因素。

对于细粒度图像分类问题,传统的特征提取方法往往使用手工设计的特征,如颜色、纹理、外形等。

但这些方法对于细微的差别难以捕捉,而且在样本数量较大的情况下计算复杂度较高。

近年来,深度学习为特征提取带来了新的思路,其中以CNN技术为代表。

CNN的卷积和池化操作能够自动地从图像中提取出不同尺度、不同层次的特征。

在细粒度图像分类中,CNN被广泛应用于特征提取,同时也衍生出了各种改进版本,如深监督学习、注意力机制等。

另外,一些新的特征提取方法也涌现出来,如局部区域特征提取、多尺度特征融合等,帮助在处理细粒度图像时更好地捕捉到局部特征信息,达到更好的分类效果。

三、细粒度图像分类模型除了特征提取外,分类模型也是影响细粒度图像分类性能的关键因素。

传统的分类模型通常采用线性分类器或核方法。

在细粒度图像分类问题中,这些方法很难处理具备复杂结构和高度相似的子类别,因此需要更加复杂的分类模型。

深度学习中的卷积神经网络CNN被广泛应用于细粒度图像分类任务,成为当前最为主流的分类模型之一。

通过引入卷积和池化等操作,CNN可以清晰地提取图像中的特征,并进行无缝地分类识别。

其中,网络结构的设计、损失函数的定义以及特征的融合等方面均对CNN算法的性能起着关键作用。

基于CNN算法的许多改进版本也被提出,如基于注意力机制的CNN、多尺度CNN 等,这些模型可以更好地适应细粒度图像分类任务的特点。

细粒度图像分类算法在医学图像识别中的应用研究

细粒度图像分类算法在医学图像识别中的应用研究

细粒度图像分类算法在医学图像识别中的应用研究摘要:近年来,随着人工智能技术的发展,细粒度图像分类算法在医学图像识别领域得到了广泛的应用。

本文将探讨细粒度图像分类算法在医学图像识别中的应用,并分析其优势和挑战。

1. 引言医学图像识别在现代医学中起着重要作用,从疾病的早期诊断到治疗方案的确定,图像识别技术极大地帮助和促进了医学工作者的工作。

而在医学图像识别中,细粒度分类是一项关键任务,旨在精确地区分具有相似外观特征但功能和属性不同的病理学物体。

2. 细粒度图像分类算法细粒度图像分类算法通过学习和提取病理学图像中的区分特征,将病理学图像分为不同的细粒度类别。

常用的细粒度图像分类算法包括深度卷积神经网络(DCNN)、支持向量机(SVM)和传统的机器学习算法等等。

2.1 深度卷积神经网络(DCNN)DCNN是目前最先进和最常用的图像分类算法之一。

它通过多层神经网络学习抽取图像特征,并通过反向传播算法进行训练,从而实现准确的图像分类。

在医学图像识别领域,DCNN已经取得了显著的成果,例如中风CT图像和乳腺癌诊断等领域都有广泛的应用。

2.2 支持向量机(SVM)SVM是一种监督学习算法,适用于二分类和多分类问题。

它通过构建一个超平面来实现分类,并通过核函数来提取高维特征。

在医学图像识别中,SVM被广泛应用于与病理学相关的图像分类任务,如皮肤疾病识别、糖尿病视网膜病变识别等。

2.3 传统的机器学习算法除了DCNN和SVM,传统的机器学习算法如随机森林、朴素贝叶斯等也被广泛应用于医学图像识别中的细粒度图像分类任务。

这些算法具有较好的可解释性和易于实施的特点,在一些小样本和噪声较多的场景下表现出色。

3. 应用实例3.1 肺癌细胞分类医学图像识别中,快速、准确地识别肺癌细胞对于临床定位和治疗具有重要意义。

细粒度图像分类算法能够对肺癌细胞进行准确分类,有助于医生快速制定治疗方案,并评估疗效。

3.2 乳腺癌分级乳腺癌的分级对于治疗和预后评估至关重要。

使用改进自编码器的细粒度图像分类研究

使用改进自编码器的细粒度图像分类研究

使用改进自编码器的细粒度图像分类研究
魏赟;李凌鹤
【期刊名称】《小型微型计算机系统》
【年(卷),期】2022(43)1
【摘要】针对深度连续聚类算法(Deep Continuous Clustering, DCC)特征提取能力有限,对复杂图像不能提取足够有效细节特征的不足,本文提出一个新的循环卷积自编码器(Recurrent Convolutional Auto-Encoder, R-CAE).自编码器结合门控循环网络GRU和卷积网络CNN构造编码层;同时在门控循环网络GRU部分添加空间域注意力通道,增强网络的特征学习能力.图像信息经过R-CAE自编码器编码后获取细节信息,传入经典卷积神经网络学习特征;当优化结果接近或者达到聚类阈值的时候,获得最终的聚类结果实现分类.训练过程中,模型首先预训练,确定自编码器参数;然后结合编码部分和经典网络学习训练,微调网络参数.本文通过实验证明了改进方法结合DCC在聚类实验中优于大部分经典聚类算法,在针对真实图像的细粒度分类实验中也有显著的进步.
【总页数】6页(P111-116)
【关键词】深度聚类;自编码;GRU;CNN;细粒度图像分类
【作者】魏赟;李凌鹤
【作者单位】上海理工大学光电信息与计算机工程学院
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于RPN与B-CNN的细粒度图像分类算法研究
2.基于Grad-CAM与B-CNN 的细粒度图像分类方法研究
3.基于显著性融合的细粒度图像分类方法研究
4.基于改进变分自编码器的零样本图像分类
5.基于改进Bilinear CNN的细粒度图像分类方法
因版权原因,仅展示原文概要,查看原文内容请购买。

基于RPN与BCNN的细粒度图像分类算法研究

基于RPN与BCNN的细粒度图像分类算法研究
第 36卷第 3期 2019年 3月
计算机应用与软件 Como.3 Mar.2019
基于 RPN与 BCNN的细粒度图像分类算法研究
赵浩如 张 永 刘国柱
(青岛科技大学信息科学技术学院 山东 青岛 266000)
摘 要 随着大数据和硬件的快速发展,细粒度分类任务应运而生,其目的是对粗粒度的大类别进行子类分 类。为利用类间细微差异,提出基于 RPN(RegionProposalNetwork)与 BCNN(BilinearCNN)的细粒度图像分类 算法。利用 OHEM(OnlineHardExampleMine)筛选出对识别结果影响大的图像,防止过拟合;将筛选后的图像输 入到由 softnms(SoftNonMaximumSuppression)改进的 RPN网络中,得到对象级标注的图像,同时减少假阴性概 率;将带有对象级标注信息的图像输入到改进后的 BCNN中,改进后的 BCNN可以融合不同层特征并加强空间 联系。实验结果表明,在 CUB2002011和 StandfordDogs数据集平均识别精度分别达到 85.50%和 90.10%。 关键词 细粒度分类 类间差异 双向卷积网络 非极大值抑制 特征融合 中图分类号 TP391.41 文献标识码 A DOI:10.3969/j.issn.1000386x.2019.03.038
赵浩如等:基于 RPN与 BCNN的细粒度图像分类算法研究
211
Net网络结构作为整个网络的基本结构。Shen等[6]提 出一种迭代的传递策略来优化目标框,借助对象及部 分级标注框进行细粒度分类。Yao等[7]提出了多级的 由粗到细的目标描述方法进行细粒度分类,不需借助 标注框,但 识 别 率 不 如 最 前 沿 的 算 法。 Liu等[8]提 出 了基于全连接的注意力机制的网络结构进行细粒度分 类,未 考 虑 各 层 特 征 间 的 联 系。 Murabito等 [9]提 出 显 著性特 征 分 类 网 络 (SalClassNet)。它 包 括 两 个 子 网 络,网络 A计算输入图片的显著性特征,网络 B计算 网络 A输出的显著性特征进行细粒度分类,计算显著 性特征首先要计算图像像素对应正确分类标准化分数 梯度的绝对值,然后取三个颜色通道的最大值,因此, 计算成本太高。综上,为避免人工标注部位级标签花 费的巨 大 时 间,以 及 减 少 计 算 成 本。本 文 提 出 利 用 softnms和 OHEM优化 RPN算法得到更精确的对象级 标注,以防止背景的干扰,同时改进 BCNN网络,加强 不同层特征间的空间联系,提高识别精度。

基于深度卷积特征的细粒度图像分类研究综述

基于深度卷积特征的细粒度图像分类研究综述

基于深度卷积特征的细粒度图像分类研究综述一、本文概述随着技术的迅速发展,细粒度图像分类已成为计算机视觉领域的一个重要研究方向。

细粒度图像分类旨在区分具有细微差异的不同类别,如不同种类的鸟类、汽车型号等。

由于这些类别之间的差异往往非常细微,传统的图像分类方法往往难以取得理想的效果。

因此,研究基于深度卷积特征的细粒度图像分类方法具有重要的理论价值和实际应用意义。

本文旨在对基于深度卷积特征的细粒度图像分类方法进行全面的综述。

我们将介绍细粒度图像分类的研究背景和意义,阐述细粒度图像分类所面临的挑战和难点。

我们将重点介绍深度卷积特征在细粒度图像分类中的应用,包括卷积神经网络的基本原理、深度卷积特征的提取方法以及基于深度卷积特征的细粒度图像分类模型。

同时,我们还将对近年来提出的代表性方法进行详细介绍和比较,分析它们的优缺点和适用范围。

本文还将探讨细粒度图像分类领域的未来发展趋势,包括多模态数据融合、弱监督学习、迁移学习等方向的研究进展。

我们将对全文进行总结,并指出当前研究中存在的问题和不足,为未来的研究提供参考和借鉴。

通过本文的综述,我们希望能够为读者提供一个全面、深入的视角,了解基于深度卷积特征的细粒度图像分类方法的研究现状和发展趋势,为该领域的进一步研究提供有益的参考和启示。

二、深度卷积神经网络基础深度卷积神经网络(Deep Convolutional Neural Networks,DCNNs)是近年来计算机视觉领域取得重大突破的关键技术之一。

其强大的特征提取和分类能力,使得DCNNs在图像分类、目标检测、图像分割等多个子领域中都取得了显著的成果。

而细粒度图像分类,作为一种特殊且具有挑战性的图像分类任务,也从DCNNs的发展中受益良多。

深度卷积神经网络的基本结构包括卷积层、池化层和全连接层。

卷积层负责通过卷积运算,提取图像中的局部特征;池化层则负责对卷积层提取的特征进行下采样,以减少特征图的维度和计算量;全连接层则负责将前面层提取的特征进行整合,形成最终的分类结果。

基于机器学习的细粒度图像分类与识别技术研究

基于机器学习的细粒度图像分类与识别技术研究摘要:随着计算机视觉和人工智能的迅猛发展,图像分类和识别技术已经取得了巨大的进展。

然而,现有的图像分类算法在处理细粒度图像分类问题时仍然存在一定的挑战。

细粒度图像分类和识别的主要难点在于图像间的微小差异,如病态视角、尺度变化和背景干扰等。

本文将重点讨论基于机器学习的细粒度图像分类与识别技术,并探索其当前的发展和未来的研究方向。

第一节:细粒度图像分类与识别的挑战1.1 病态视角细粒度图像分类和识别通常需要在图像中识别和区分微小的细节特征。

然而,由于视角的变化,该任务变得非常困难。

视角的变化可能导致图像中的目标物体变形或遮挡,从而使得图像间的差异非常微小。

因此,解决图像分类中的病态视角问题是非常关键的。

1.2 尺度变化与病态视角类似,尺度变化也是细粒度图像分类中的一个重要挑战。

由于目标物体的尺寸可能因拍摄距离、图像分辨率等因素而发生变化,尺度变化导致目标物体在不同图像之间的大小差异变得微小。

因此,如何处理尺度变化并进行准确的分类和识别是需要解决的问题。

1.3 背景干扰细粒度图像分类中另一个常见的问题是背景干扰。

背景干扰可以是由于光线、摄像角度或环境等因素引起的。

这种背景干扰可能导致目标物体与背景混淆,使得分类和识别更加困难。

因此,如何提取出目标物体并将其与背景区分开来是非常重要的。

第二节:基于机器学习的细粒度图像分类与识别技术2.1 特征提取在解决细粒度图像分类和识别的问题时,首先需要从图像中提取有用的特征。

传统的特征提取方法如SIFT、HOG等已经在一定程度上取得了较好的效果。

然而,随着深度学习的兴起,基于深度卷积神经网络(CNN)的特征提取方法成为目前主流的选择。

通过使用预训练的CNN模型,可以从图像中提取出具有较好判别能力的特征,从而提高分类和识别的准确性。

2.2 特征选择和降维由于细粒度图像分类中存在大量无关特征,如背景干扰等,必要时需要进行特征选择和降维。

细粒度图像分类算法及其在医学图像分析中的应用研究

细粒度图像分类算法及其在医学图像分析中的应用研究摘要:细粒度图像分类是一种对同一类别下的图像进行分类的技术,与传统的图像分类有所不同。

本文介绍了细粒度图像分类的基本流程及其常用算法,探讨了细粒度图像分类在医学图像分析中的应用研究,包括肿瘤识别和病变分类等。

1. 简介细粒度图像分类(Fine-grained Image Classification)是一种对同一类别下的图像进行分类的技术。

与传统的图像分类不同,细粒度图像分类主要针对同一类别下的细微差别进行分类,例如不同品种的狗、不同种类的鸟等等。

细粒度图像分类技术具有一定的应用前景,尤其是在医学图像分析领域。

本文将介绍细粒度图像分类的基本流程及其常用算法,探讨细粒度图像分类在医学图像分析中的应用研究。

2. 细粒度图像分类基本流程细粒度图像分类的基本流程包括图像预处理、特征提取、特征选择和分类器构建等。

其中特征提取是整个流程的关键,也是影响分类精度的决定性因素。

(1)图像预处理图像预处理主要包括图像去噪、图像增强和图像变形等。

其中图像增强和图像变形是比较重要的预处理操作。

图像增强可以提高图像的对比度和亮度,减少图像中的噪声和干扰。

图像变形则可以使得样本数据具有更加丰富的表达能力。

(2)特征提取特征提取是整个流程的核心环节。

细粒度图像分类的特征提取主要分为三类:全局特征、局部特征和混合特征。

其中,全局特征指的是图像的整体表现,例如颜色、形状、纹理等。

局部特征指的是图像中局部区域的表现,例如鸟的翅膀、胸部、尾部等。

混合特征则是综合全局特征和局部特征进行分类。

(3)特征选择特征选择是特征提取后的一个重要操作。

特征选择可以减少特征的数量,提高分类器的精度。

特征选择的基本思想是寻找最相关的特征进行分类。

常用的特征选择方法包括过滤式和包裹式等。

(4)分类器构建分类器构建是整个流程的最后一步。

常用的分类器包括KNN、SVM、决策树和深度学习等。

选择合适的分类器可以提高分类的精度。

细粒度图像识别中的目标分类与检测算法研究

细粒度图像识别中的目标分类与检测算法研究摘要:细粒度图像识别是指在同一目标类别之间进行精细的分类和检测任务,其在许多实际应用中具有重要的意义。

本文将对细粒度图像识别中的目标分类与检测算法进行研究,探讨其方法和技术,并分析其挑战和未来发展方向。

1. 引言细粒度图像识别是计算机视觉领域中的一个重要研究方向,它涉及对细小目标类别进行准确分类和检测。

传统的图像分类与检测算法往往难以满足对细粒度图像的要求,因为细粒度图像存在相似的外观和结构特征,需要更加精细和高效的算法来处理。

2. 目标分类算法细粒度图像识别中的目标分类算法主要包括以下几种方法:2.1 特征提取在目标分类中,特征提取是非常关键的一步。

传统的方法主要依靠手工设计的特征来进行分类,如SIFT,HOG等。

然而,这些方法往往无法捕捉到细粒度图像中的细微差异,因此需要进一步改进。

2.2 深度学习深度学习在图像分类领域取得了巨大的成功,其卷积神经网络(CNN)结构能够自动学习特征并进行分类。

近年来,许多研究者将深度学习引入细粒度图像识别任务中,并取得了显著的成果。

2.3 序列化算法对于一些具有时序信息的细粒度图像,传统的分类算法往往无法准确处理。

因此,一些研究者提出了基于序列化的方法来解决这个问题,如LSTM等算法。

3. 目标检测算法细粒度图像识别中的目标检测算法主要用于定位图像中的目标,并给出其准确的边界框和类别信息。

以下是一些常用的细粒度图像检测算法:3.1 R-CNN系列算法R-CNN系列算法是一类基于区域建议的目标检测算法,其通过选择性搜索等方法生成候选区域,然后对区域进行特征提取和分类。

3.2 YOLO算法YOLO(You Only Look Once)算法是一种实时目标检测算法,其通过将目标检测任务转化为回归问题,直接在图像上进行目标位置和类别的回归预测。

3.3 SSD算法SSD(Single Shot MultiBox Detector)算法是一种单阶段目标检测算法,其通过多尺度特征图进行目标分类和边界框回归,具有较高的准确率和实时性。

细粒度图像分类算法在图像检索中的应用研究

细粒度图像分类算法在图像检索中的应用研究摘要:随着社交媒体和在线平台上图片的不断增长,图像检索技术变得越来越重要。

细粒度图像分类算法可以帮助我们在海量图像数据中准确地识别和分类图像,从而实现更精确的图像检索。

本文将探讨细粒度图像分类算法在图像检索中的应用研究。

引言:图像检索一直是计算机视觉和人工智能领域的研究热点。

传统的图像检索方法主要基于图像的全局视觉特征,如颜色、纹理和形状等。

然而,这些方法往往忽略了图像中的细粒度信息,导致检索结果的不准确性和不可靠性。

细粒度图像分类算法的出现,填补了这一空白。

一、细粒度图像分类算法概述细粒度图像分类算法是一种能够实现对图像中的细微差别进行识别和分类的算法。

它能够将具有类似外观的对象进行区分,例如不同种类的鸟、花等。

细粒度图像分类算法的核心思想是通过学习不同类别之间的具体特征来实现分类,它不仅考虑了全局特征,还着重于提取对象的局部特征。

二、细粒度图像分类算法的关键技术1. 特征提取:细粒度图像分类算法需要提取图像中的特定细节信息。

现有的特征提取方法主要通过深度学习技术来实现,如卷积神经网络(CNN)等。

通过CNN,我们可以高效地提取出图像中的低级和高级特征,为分类提供有力的支持。

2. 特征选择:由于细粒度图像分类算法需要关注图像的细节,因此特征选择变得尤为重要。

在选择特征时,应该考虑到特征的鉴别能力和稳定性。

常见的特征选择方法包括基于互信息和相关系数的方法等。

3. 模型设计:细粒度图像分类算法需要设计合适的模型来实现分类任务。

传统的方法主要使用SVM、随机森林等机器学习方法,而近年来,深度学习技术在细粒度图像分类中的应用越来越广泛。

目前,常用的深度学习模型包括Inception、ResNet、DenseNet等。

三、细粒度图像分类算法在图像检索中的应用1. 相似图像检索:细粒度图像分类算法可以帮助我们在大规模图像数据库中快速和准确地找到与查询图像相似的图像。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Computer Science and Application 计算机科学与应用, 2020, 10(5), 841-850 Published Online May 2020 in Hans. /journal/csa https:///10.12677/csa.2020.105087
Figure 1. CAM model 图 1. CAM 模型
CAM 方法用 GAP 层替换全连接层来接收最后一层卷积的结果,输出每一个特征图在每一个通道的 平均值,接着是全连接层接收这些平均值生成最后的预测值。选择最终全连接层节点的权重作为最后一 层卷积层的特征图的权值,并对特征图像按通道加权形成最后的类别激活映射图。
激活值, F k 为通道 k 的特征图,则:
∑ F k = x,y fk ( x, y )
(1)
对于某一个特定类别标签 c, Sc 表示的是 softmax 层的输入,则:
∑ Sc = k wkc F k
(2)
其中 wkc 是通道 k 映射为类别 c 的权重。所以根据式(1)、式(2):则:
∑ ∑ ∑ ∑ ( ) = Sc = k wkc x,y fk x, y
Received: Apr. 16th, 2020; accepted: May 1st, 2020; published: May 8th, 2020
Abstract
Fine-grained images are characterized by small differences between classes and large differences within classes. The differences between images mainly exist in subtle local areas, and local area localization and its representative feature extraction have become one of the main research issues in fine-grained image classification. In this paper, the fine-grained categorization method is studied based on the Grad-CAM and the Bilinear Convolution Neural Networks B-CNN. It uses the Grad-CAM model to locate the salient region in the original image, and crops the salient region image as the input of the bilinear CNN, fusing the global and local features to complete the classification. Experiments on the three datasets of CUB-200-2011, Stanford Dogs and Stanford Cars show that compared with the traditional model, this method can more accurately locate areas with significant image features and have better classification effects.
Fine-Grained Image Classification Algorithm Based on Grad-CAM and B-CNN
Shaowei Deng, Boquan Zhang Department of Computer, Guangdong University of Technology, Guangzhou Guangdong
收稿日期:2020年4月16日;录用日期:2020年5月1日;发布日期:2020年5月8日
摘要
细粒度图像具有类间差异小,类内差异大的特点。图像之间的差异主要存在于细微的局部区域,局部区 域定位及其代表性特征提取成为细粒度图像分类的主要研究问题之一。本文基于Grad-CAM和双线性卷
文章引用: 邓绍伟, 张伯泉. 基于 Grad-CAM 与 B-CNN 的细粒度图像分类方法研究[J]. 计算机科学与应用, 2020, 10(5): 841-850. DOI: 10.12677/csa.2020.105087
由于获取人工标注信息代价大,弱监督图像分类方法越来越受到重视。文献[8]提出两级注意力(Two level attention)算法,它关注对象级和局部级两个不同层次的特征。但是利用聚类算法得到的局部区域并 不十分准确,所以分类准确率有限。文献[9]提出基于双线性卷积神经网络(Bilinear Convolution Neural Networks, B-CNN)的弱监督分类模型,它由两路 VGGNet 构成。该模型将两个网络提取的卷积特征进行 双线性操作,以提高图像特征表达能力,实现了一个端到端训练的弱监督分类网络。但是该模型利用 VGGNet 作为特征提取网络,没有能充分关注物体判别性区域对分类准确率的影响。
细粒度图像分类主要分为强监督的分类方法和弱监督的分类方法。强监督细粒度分类方法除了需要 图像的类别标签之外,还需要标注框、局部位置等额外的人工标注信息,而这些人工的标注信息往往是 需要丰富的专业知识才能够获得,所以这一类方法的代价较高。文献[5]提出的 Part-based R-CNN,该算 法采用 R-CNN 对图像生成大量的候选区域,然后再对这些候选区域检测,给出每一个局部区域的评分值, 根据评分值确定最后的定位检测结果。结合全局特征(物体级别特征)和判别行更强的局部特征进行分类取 得了不错的效果,但是需要额外的人工标注开销,并且由于 R-CNN 算法产生大量的候选区域会大大增加 计算复杂度,造成检测速度较慢。文献[6]提出的 Part-Stacked CNN,它与文献[5]类似,也是分为两个步 骤,由定位网络与分类网络两部分组成,在定位网络中用到了 FCN (Fully Convolutional Network)提高了 分类准确率,并且加快了算法的效率,但同样是需要对象与部位级的标签。文献[7]提出了一种新颖的局 部区域检测模型,在细粒度图像分类中引入了协同分割,提出了一种无需借助局部区域标注信息,只需 要标注框就可以完成分割与对齐操作,分类准确度能够达到 82%。
DOI: 10.12677/csa.2020.105087
843
Байду номын сангаас
计算机科学与应用
邓绍伟,张伯泉
Figure 2. Grad-CAM model 图 2. Grad-CAM 模型
参考图 1、图 2 模型,设 fk ( x, y) 为最后一个卷积层输出的特征图中的第 k 个通道的 ( x, y) 位置上的
Open Access
1. 引言
近年来,随着图像数据的大规模增长,人们对图像分类提出了迫切需求,图像分类成为了热门研究 领域[1]。图像分类一般分为对象级分类和细粒度图像分类(Fine-grained image categorization) [2],细粒度 图像分类又被称为子类别图像分类(Sub-category recognition) [3],细粒度图像分类是对粗粒度图像中的更 小的子类别进行分类,如飞机型号、鸟类品种、服装款式与菜肴样式等。由于同一个粗粒度图像下的各 子类图像在几何结构上十分相似,造成细粒度图像类间差异小;而同一个细粒度类别下的图像,从物体 的形状、姿态、背景等角度来看都有可能产生极大的差异,致使子类内图像区分难度大。细粒度图像在 工业界与学术界都应用广泛,比如在道路交通管理上,可以识别不同车型的数量,计算实时的交通状况; 在生物学领域,可以帮助研究人员快速识别不同种类的物种,而不用受太大专业知识的限制。因此细粒 度图像分类成为研究热点和难点[4]。
2. 相关理论
2.1. 类别激活映射
2.1.1. CAM 具有区别性的显著性区域特征是分类的关键。类别激活映射(Class Activation Mapping, CAM) [11]提
供了一种解释图像分类结果的方法,它采用全局池化层(global average pooling, GAP),解决全连接层参数 过多、网络不易训练和容易过拟合等问题。该方法以 HeatMap 来映射图像中与该类别的最相近的即显著 性区域,使得模型有更强的解释性。是一种寻找图像中显著性区域的更好的方法。CAM 模型如图 1 所示。
Keywords
Fine-Grained Categorization, Bilinear Convolution Neural Networks, Grad-CAM, Salient Regions
基于Grad-CAM与B-CNN的细粒度图像分类方 法研究
邓绍伟,张伯泉 广东工业大学计算机学院,广东 广州
DOI: 10.12677/csa.2020.105087
842
计算机科学与应用
邓绍伟,张伯泉
综合以上,影响细粒度图像分类准确率的两个主要因素,一是对图像局部显著性区域的关注,二是 对局部区域特征的提取和表达。本文在 B-CNN 的基础上,提出一种基于 Grad-CAM [10]与 B-CNN 的细 粒度图像分类方法,该方法首先利用 Grad-CAM 模型提高对象级显著性区域检测结果,聚焦判别性区域, 去除无关区域对分类结果的影响,并且改用更加有效的特征提取函数,采用 B-CNN 模型对判别性区域进 行特征提取与分类,从而提高细粒度图像的分类准确率。这种方法不需要标注框和局部位置等人工标记 信息,也能够减少背景区域的干扰,在理论上将讲这种方法是一种有效的细粒度图像分类方法。
邓绍伟,张伯泉
积神经网络B-CNN模型对细粒度图像分类方法进行研究,它利用Grad-CAM模型定位原图像中的显著区 域,并裁剪出显著性区域图像作为双线性CNN的输入,融合全局和局部的特征,从而完成分类。在 CUB-200-2011、Stanford Dogs和Stanford Cars三个数据集上的实验表明,相较于传统模型,该方法能 够更加准确定位图像特征显著区域,具有更好的分类效果。
相关文档
最新文档