基于图像超分辨网络的目标检测算法
基于SVM的图像目标检测方法研究

基于SVM的图像目标检测方法研究图像目标检测是计算机视觉领域中的重要问题之一。
它的目的是从图像中识别出特定的目标或物体,以实现自动化处理。
近年来,支持向量机(SVM)成为了目标检测中的重要算法之一,因为它可以在不需要复杂的预处理的情况下进行目标分类和定位。
一、SVM基本原理SVM是一种有监督的学习算法,其基本原理是通过寻找能够清晰划分不同类别之间的超平面来进行分类。
这个超平面被称为决策边界,可以将不同类别的实例分开。
SVM的目标就是寻找到这个最优的超平面。
对于一个二分类问题,我们假设有$m$个样本组成的训练集$D={(x_1,y_1),(x_2,y_2),…,(x_m,y_m)}$,其中$x_i$是一个$n$维的向量,表示该样本在$n$个特征维度上的取值,$y_i$表示其所属的类别,$y_i=-1$或$1$。
SVM 的优化问题可以表达为:$$\begin{aligned} \min_{\omega,b}\frac{1}{2}\|\omega\|^2+C\sum_{i=1}^m\xi_i \\ s.t.~y_i(\omega x_i+b)\geq 1-\xi_i \\\xi_i\geq0,~i=1,2,…,m \end{aligned}$$其中,$\omega$是一个$n$维向量,$b$是一个常数,$\xi_i$是松弛变量,$C$是一个超参数,用于平衡分类正确和误分的权重。
该问题的解就是最优的决策边界,也就是我们需要找到的 SVM模型。
二、图像目标检测中的SVM应用在目标检测中使用SVM算法,通常需要通过以下步骤进行。
1. 特征提取在检测图像中的目标时,首先需要从图像中提取出有效的特征向量。
这些特征向量通常包含了目标的形状、纹理、亮度等方面的信息,它们是SVM分类的输入。
2. 训练SVM模型通过将目标与非目标的特征向量提交给SVM算法进行训练,可以利用SVM构建一个分类模型。
在训练阶段中,通常使用交叉验证等技术来选择SVM模型的参数,以获得更好的性能。
基于超像素技术的视频目标检测方法研究

基于超像素技术的视频目标检测方法研究近年来,视频监控技术在各行各业得到了广泛应用,其中目标检测技术是视频监控的核心技术之一。
随着计算机技术的不断发展,基于超像素技术的视频目标检测方法逐渐成为了研究热点。
一、超像素技术简介超像素技术是一种将图像分割为若干连通的、不重合的、均匀分布的像素集合的图像分割技术。
超像素实际上就是一种像素级别的图像聚类算法,用来将相似的像素聚到一起,从而形成一个类似于真实物体的区域。
超像素技术主要可分为基于环路切割的超像素和基于图论的超像素两种类型。
基于环路切割的超像素分割方法利用图像边界及颜色相似度对图像进行分割,不过容易受到边缘干扰,分割结果的鲁棒性较低;而基于图论的超像素分割方法利用图论算法对图像像素进行聚类分割,处理速度快,分割结果鲁棒性较好。
二、基于超像素技术的视频目标检测方法基于超像素技术的视频目标检测方法是一种将超像素技术应用于视频目标检测中的方法。
该方法通过将视频中的每一帧图像分割成若干超像素,并分别对不同超像素进行特征提取和分类,最终得到视频中目标的位置和属性信息。
基于超像素技术的视频目标检测方法的优点在于它可以处理复杂的场景,并具有较高的检测精度。
在一些含有遮挡、光照变化、背景复杂等因素的复杂环境中,该方法可以更好地保持检测过程的鲁棒性。
三、基于超像素技术的视频目标检测方法的改进虽然基于超像素技术的视频目标检测方法具有一定的优势和应用前景,但是该方法仍然存在不足之处。
其中最大的问题就是分割过程中的质量控制和超像素的数目确定。
对于上述问题,目前学术界和工业界采取了多种解决方案。
其中较为简单的方法是使用像素级别的特征描述器,将超像素的描述能力增强,从而减少误检和漏检的情况。
另外一种方法是动态确定超像素的个数,将超像素数目作为一个参考函数,通过对图像质量的分析来调整超像素的个数,从而提高超像素的质量和数量的平衡性。
四、基于超像素技术的视频目标检测方法的应用前景基于超像素技术的视频目标检测方法在安防、交通、医疗等领域均有广泛应用。
基于图像处理的目标检测与识别技术研究

基于图像处理的目标检测与识别技术研究随着计算机科学和人工智能技术的快速发展,图像处理技术已经成为了计算机视觉中的重要分支。
在生产、医疗、安防等领域,图像处理技术的应用正在变得越来越广泛。
其中,目标检测与识别技术是目前图像处理的研究热点之一。
本文将从实现思路、研究现状和发展趋势三个方面来详细阐述基于图像处理的目标检测与识别技术研究。
一、实现思路目标检测与识别技术主要是通过计算机视觉技术,实现对图像中目标的自动识别和预测。
其中,最核心的技术实现思路是从图像中提取出目标的特征,并使用机器学习算法进行分类和识别。
其中,目标特征主要包括颜色、形状、纹理、尺寸、比例等多个方面,每个方面都会对最终的目标检测与识别效果产生影响。
在目标特征提取方面,计算机视觉技术主要是通过图像处理、图像分割、图像特征提取等方法来实现。
在机器学习算法方面,包括支持向量机、决策树、神经网络等多种方法都可以用于目标检测与识别。
二、研究现状目标检测与识别技术是图像处理领域的一个重要研究方向,目前国内外也有不少相关的研究工作。
在研究方法方面,传统的方法是基于图像特征提取和模板匹配的方法。
这类方法主要是通过提取图像局部特征和设计特定的模板来实现目标检测与识别。
例如,SIFT、SURF、HOG等算法都是局部特征提取的经典算法。
而将局部特征组成的向量或“词袋”作为输入,在基于视觉单词或者基于聚类的分类方法中,可以有效地进行目标检测。
但是,这类算法存在一些缺陷,如对光照、尺度、旋转等因素敏感,同时匹配效率低下等问题。
另外,近年来,基于深度学习的算法也被广泛应用于目标检测和识别领域。
深度学习主要是通过建立多层神经网络,实现对大量标注图像的学习,最终得到一个有效的模型来实现目标检测和识别。
其中,最经典的算法是深度卷积神经网络(CNN),这种算法可以对图像中的目标进行端到端的检测和识别。
此外,还有更多全局特征提取方法也得到了广泛的应用,例如FCN、SSD、YOLO等算法。
基于深度卷积神经网络的高分辨率遥感图像分类与目标识别技术研究

基于深度卷积神经网络的高分辨率遥感图像分类与目标识别技术研究高分辨率遥感图像是现代遥感技术中的重要组成部分,对于地质勘探、环境监测、城市规划等领域具有重要的应用价值。
然而,由于遥感图像具有复杂的光谱、空间和角度信息,传统的遥感图像分类与目标识别技术往往面临效果不理想的问题。
为了解决这一问题,基于深度卷积神经网络的高分辨率遥感图像分类与目标识别技术应运而生。
深度卷积神经网络(DCNN)是一种能够自动学习特征表示的神经网络模型。
与传统的遥感图像处理方法相比,DCNN具有更强的特征表达能力和更好的自适应性,可以提取出更具有区分度的特征,从而提高分类和目标识别的准确性与效率。
在高分辨率遥感图像分类方面,基于DCNN的方法通常包括两个关键步骤:图像特征提取和分类器设计。
图像特征提取是通过DCNN网络对输入的遥感图像进行多层卷积和池化等操作,提取出具有代表性的图像特征。
常用的DCNN模型有AlexNet、VGGNet、ResNet等。
此外,为了进一步提高特征的区分度,还可以在DCNN的末尾添加一些全局池化层或归一化层,从而捕捉到更多的上下文信息。
分类器设计是将提取出的图像特征输入到一个分类器中,进行具体的分类任务。
常见的分类器包括全连接神经网络、支持向量机(SVM)、随机森林等。
其中,全连接神经网络是一种常用的分类器模型,可以通过训练多个隐层和输出层的神经元参数,实现遥感图像的分类任务。
在目标识别方面,DCNN同样具有很大的优势。
通过DCNN网络的多层卷积和池化操作,可以提取目标图像的丰富特征,进一步进行目标检测与识别。
常见的目标识别方法包括基于DCNN的物体检测方法(如Faster R-CNN、YOLO等)和基于DCNN的目标识别方法(如FusionNet、Object-Contextual Convolutional Neural Network等)。
这些方法通过引入多尺度特征融合、上下文信息捕捉等技术,提高了遥感图像目标识别的准确性和鲁棒性。
计算机视觉中的图像分割与目标检测

计算机视觉中的图像分割与目标检测随着计算机技术的发展和进步,计算机视觉的应用逐渐成为现实。
在计算机视觉领域中,图像分割和目标检测是两个重要的任务。
本文将就图像分割和目标检测的概念、算法原理以及应用领域进行详细介绍。
一、图像分割图像分割是将一幅图像分割成若干个区域或者像素的过程。
其目的是将图像分为具有独立语义的子图像,从而更好地实现对图像内容的理解和分析。
图像分割在计算机视觉中被广泛应用,如医学图像分析、图像识别、图像压缩等。
图像分割算法有很多种,常见的包括阈值分割、边缘检测、区域生长等。
阈值分割是最简单的图像分割方法,其基本思想是根据像素的灰度值与设定的阈值进行比较,将像素分为不同的区域。
边缘检测是通过提取图像中的边缘信息来实现分割的方法。
区域生长算法则是以种子点为起点,通过生长的方式将与种子点相连的像素归为同一区域。
二、目标检测目标检测是计算机视觉中的另一个重要任务,其目的是在图像中找出感兴趣的目标并进行位置的确定。
目标检测在很多应用领域都有广泛的应用,如智能交通监控、人脸识别、无人驾驶等。
目标检测的算法也有多种,常见的有基于特征的方法和基于深度学习的方法。
基于特征的方法主要是通过提取图像中的特征信息,并采用分类器来进行目标的检测。
其中,常用的特征包括Haar特征、HOG 特征等。
基于深度学习的方法则是利用神经网络对图像进行端到端的处理,通过卷积神经网络(CNN)或者循环神经网络(RNN)实现目标的检测。
三、图像分割与目标检测的应用图像分割和目标检测在众多领域中都有广泛应用。
以医学图像分析为例,图像分割能够帮助医生更好地分割出肿瘤等病灶区域,从而为疾病的诊断提供更准确的依据。
而目标检测则能够帮助医生快速定位并识别出疾病部位,为手术治疗提供指导。
在智能交通监控领域,图像分割可以将车辆与背景进行分离,为车辆的跟踪和计数提供基础。
目标检测则能够实现对交通标志、车辆等感兴趣目标的实时检测和识别,从而帮助交通管理部门进行交通流量统计和道路安全监控。
基于神经网络的目标检测算法

基于神经网络的目标检测算法近年来,随着深度学习技术的发展,基于神经网络的目标检测算法逐渐成为了计算机视觉领域的热门研究方向。
这种算法可以通过学习大量数据来自动识别图像中的物体,实现自动化的目标检测。
目标检测算法在许多领域都有广泛的应用,例如智能安防、自动驾驶、人脸识别等。
目前,基于神经网络的目标检测算法已经成为了目标检测领域的主流技术,其核心思想是通过深度学习方法来实现自动目标检测。
基于神经网络的目标检测算法的主要流程如下:1. 提取特征对于一个给定的图像,首先需要提取出特征信息,以便后续的目标检测任务。
传统的视觉特征提取算法主要包括SIFT、HOG等,而在深度学习领域中,卷积神经网络(CNN)已经成为了目标检测算法中最常用的特征提取方法。
2. 目标分类在完成特征提取之后,就需要对图像中的目标进行分类。
在深度学习中,一般采用卷积神经网络来进行目标分类,可以通过训练网络来识别不同的目标种类。
3. 边界框回归目标检测的最终目的是确定图像中目标的位置。
在完成目标分类之后,需要进一步对目标位置进行精确定位。
边界框回归是一种常用的方法,通过学习目标边界框的位置和大小信息,来实现目标位置的确定。
4. 非极大值抑制在完成目标检测之后,可能会出现重叠的目标框,必须通过一些方法来消除这些重叠的目标框,以确保每个目标只被检测一次。
非极大值抑制(NMS)是一种常用的解决方法,它会对目标框进行排序并移除掉重叠度较高的目标框。
基于神经网络的目标检测算法的实现主要依靠深度学习框架,目前主要有TensorFlow、PyTorch等。
在实现目标检测算法时,需要借助已有的数据集进行训练,例如COCO、PASCAL VOC等公共数据集,也可以通过自己的数据集来进行训练。
虽然目标检测算法在深度学习领域已经取得了不小的进展,但是仍存在一些挑战。
例如在低光、多目标、遮挡等复杂环境下的目标检测仍然存在一定的难度。
此外,目前的目标检测算法大多需要耗费大量的计算资源和GPU内存,限制了其在实际应用中的普及。
基于CNN模型的高分辨率遥感图像目标识别

基于CNN模型的高分辨率遥感图像目标识别一、概述随着遥感技术的快速发展,高分辨率遥感图像在军事、民用等领域中的应用越来越广泛。
高分辨率遥感图像可以提供更为精细的地表信息,为目标识别、地物分类、环境监测等任务提供了丰富的数据基础。
高分辨率遥感图像中目标的多样性和复杂性,使得传统的目标识别方法面临着巨大的挑战。
研究高效、准确的高分辨率遥感图像目标识别方法具有重要的理论和实际意义。
卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,具有强大的特征提取和模式识别能力。
近年来,CNN 在计算机视觉领域取得了显著的成果,被广泛应用于图像分类、目标检测、语义分割等任务。
将CNN模型应用于高分辨率遥感图像目标识别,有望提高识别的准确性和效率。
本文旨在探讨基于CNN模型的高分辨率遥感图像目标识别方法。
简要介绍高分辨率遥感图像的特点和目标识别的挑战详细阐述CNN模型的基本原理和常用结构介绍基于CNN模型的高分辨率遥感图像目标识别方法,包括数据预处理、网络结构设计、模型训练和优化策略等通过实验验证所提出方法的有效性和优越性,并与现有方法进行对比分析。
1. 遥感图像目标识别的背景和意义随着遥感技术的飞速发展,高分辨率遥感图像在军事、民用等领域发挥着越来越重要的作用。
遥感图像目标识别作为遥感图像处理的核心技术之一,其准确性直接影响到遥感信息的利用效率。
高分辨率遥感图像目标识别旨在从复杂的遥感图像中精确地提取出所需的目标信息,为决策者提供有力的数据支持。
在军事领域,高分辨率遥感图像目标识别对于敌方目标的侦察、监控和打击具有重要意义。
精确的目标识别可以为军事决策提供实时、准确的信息,提高作战效率,降低战争风险。
在民用领域,高分辨率遥感图像目标识别在环境保护、城市规划、灾害监测等方面具有广泛的应用。
例如,通过识别遥感图像中的植被、水体、建筑物等信息,可以有效地监测土地覆盖变化,为环境保护和城市规划提供科学依据。
利用图像处理的方法提高目标检测的准确性

利用图像处理的方法提高目标检测的准确性在现代科技发展的时代,图像处理技术作为一项重要的技术逐渐在各个领域得到应用,其中之一就是目标检测。
目标检测是计算机视觉中的一个重要任务,旨在自动地从图像或视频中识别和定位特定的物体。
然而,由于图像中噪声、光照变化、遮挡等因素的存在,以及目标的大小、形状和姿态的多样性,目标检测的准确性一直是一个挑战。
为了提高目标检测的准确性,人们利用图像处理的方法进行改进。
图像处理是一种将数字图像通过各种算法和技术进行分析、处理和改善的过程。
以下将介绍几种利用图像处理的方法来提高目标检测准确性的技术。
首先,基于图像增强的方法。
目标检测的准确性受到图像质量的影响,因此图像增强可以提高目标检测的准确性。
图像增强的方法包括灰度变换、直方图均衡化、滤波等。
通过对图像进行增强处理,可以增加目标的对比度,减少噪声的干扰,从而提高目标检测的准确性。
其次,基于特征提取的方法。
特征提取是目标检测中的一个关键步骤,通过提取图像中的特征来描述目标的形状、纹理等信息。
常用的特征提取方法有HOG特征、SIFT特征、SURF特征等。
这些方法可以从图像中提取出与目标相关的特征,并用于目标的分类和定位,从而提高目标检测的准确性。
然后,基于目标模型的方法。
目标模型是目标检测中的一个重要概念,它是对目标的外观和空间位置分布进行建模。
基于目标模型的方法可以通过学习目标的模型来进行目标检测。
常用的目标模型包括传统的统计模型和机器学习模型,如支持向量机、神经网络等。
通过构建和训练目标模型,可以更好地适应目标的变化和多样性,提高目标检测的准确性。
此外,基于深度学习的方法也取得了很大的进展。
深度学习是一种通过模拟人脑神经网络来解决问题的机器学习方法。
在目标检测中,深度学习模型如卷积神经网络(CNN)和循环神经网络(RNN)等可以学习到更复杂的特征表示,并通过多层次的处理来实现目标检测。
基于深度学习的方法能够自动地学习和提取图像中的特征,具有较强的适应性和泛化能力,因此在目标检测中取得了很好的效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文章编号:1007-1423(2019)25-0047-04DOI:10.3969/j.issn.1007-1423.2019.25.010基于图像超分辨网络的目标检测算法畅青,冯晶明,洪伟杰,薛凯(四川大学计算机学院,成都610065)摘要:目标检测一直是计算机视觉研究领域的核心问题。
当前,视觉识别任务仍然容易受到各种图像退化的影响,如图像模糊和图像低分辨率。
为此,提出一种基于图像超分辨网络的目标检测算法。
首先,搭建一个轻量级的图像超分辨网络对输入图片进行像素信息恢复和局部细节增强;然后在重建图片上搭建目标检测网络对各种类型的目标进行检测和定位;最终,将检测结果映射会原始图片。
实验证明,经过融合图像超分辨重建网络,该算法实现更好的性能。
关键词:目标检测;图像超分辨率;多尺度检测器基金项目:四川省科技创新苗子工程(No.2018048)0引言目标的检测与跟踪技术在计算机视觉领域有着广泛的应用,例如在视频监控、无人驾驶、机器人等领域都有着举足轻重的价值。
随着深度学习算法与技术的飞速发展,更是带动了该技术在性能、速度等方面取得了质的飞跃。
然而随着社会的发展,需求的不断提高,我们在研究算法高效性的同时还要考虑算法所训练出的模型在实际应用上的性能与速度。
在深度学习出现之前,目标检测需要根据一定的先验知识,通过建立某种数学模型来完成目标检测,应用比较广泛的有:帧差法[1]、Hough变换[2]、光流法[3]、滑动窗口模型[4]、可变形部件模型[5]等。
这些传统的目标检测方法通过手工设计的特征来组合并进行分类。
然而由于需要依赖于研究人员的经验,因此,传统的方法的泛化能力较差,鲁棒性较低。
受益于深度学习的发展,最近几年,目标检测作为计算机视觉的基础性任务取得了长足的进步。
尤其是R-CNN[6]创造性的将检测任务划分为两个阶段:产生候选区域和目标识别。
随后众多优秀的工作[7-9],都采用这种两阶段的管道实现了巨大的性能提升。
与此同时,众多单阶段检测算法[10-12]也在不断刷新着COCO挑战赛的记录。
尽管不断有新的检测框架问世,视觉识别任务仍然容易受到各种图像退化的影响,包括图像模糊和图像低分辨率。
COCO数据集上的检测结果表明:识别不同尺度的目标依然是检测任务一项重大挑战。
进一步提高对小目标和模糊目标的检测精度和召回率是优化目标检测框架总体性能的核心方式。
小目标本身在图片中所占区域较小,所涉及的像素数量少。
模糊目标本身含有大量的噪声导致像素质量过低。
本身像素信息的匮乏加上卷积神经网络池化操作对特征图的浓缩,导致神经网络难以对小目标及模糊目标提取出充足的特征。
图像超分辨率可以作为一种输入数据增强消除这些弊病并以此为目标检测提供积极的影响。
1算法实现针对图像模糊和低分辨率问题以及目标检测高实时性要求,本文提出了基于图像超分辨率的多尺度检测算法。
该算法首先依靠一个轻量级的图像超分辨网络对输入图片进行重建;然后在重建图片上搭建目标检测网络对各种类型的目标进行检测和定位;最终,将超分辨图像上的检测结果映射回原始图像。
1.1图像超分辨重建模块超分辨重建模块是我们算法的核心。
它负责丰富图片中微弱目标的像素信息和局部细节。
对输入图片的重建质量将直接关系微弱目标的检测。
为了和之后的检测任务相兼容,我们采用深度卷积神经网络设计该模块,而不是采用传统的超分辨算法。
其详细的结构图1所示。
图像超分辨重建模块可以很清晰的被拆解为3个阶段:特征提取,非线性映射和反卷积重建。
前两个阶段主要是对输入图片进行特征提取和处理,最后一个阶段根据所提取的特征进行图片的恢复和重建。
我们使用Conv(c i,w i,h i,f i)代表一个卷积层,并且定义反卷积层为DeConv(c i,w i,h i,f i)。
其中,c是指卷积核的通道数;w、h代表卷积核的宽和高;而f指示卷积核的个数。
图1超分辨重建网络示意图特征提取:超分辨模块并不直接对RGB图像进行处理。
该模块对于输入的RGB格式的3通道图片,首先转化为YCrCb模式,并且只将Y通道通过CNN网络;然后将输出的结果再和另外两个合成生成新的YCbCr模式图片,最后再转回BGR模式。
在特征提取这个阶段,我们使用3次3×3的卷积层来提取特征,目的是为了加深重建网络的深度,从而提升图片的重建性能。
非线性映射:非线性映射是影响图片重建性能的最重要的阶段。
同样是最有可能节约计算成本的阶段。
直接由高维低分辨的特征映射到高分辨特征空间SRCNN[13],会带来巨大计算量。
基于这样的考虑,我们参照FSRCNN[14]的网络设计。
首先,使用16个3×3的卷积核对高维的特征进行压缩,这个策略可以极大的降低参数的数量;然后,为了加深网络的深度,我们使用3个3×3卷积层在低纬度的特征空间完成特征映射。
最后,为了确保重建图像的修复质量,我们使用64个卷积核去扩充高分辨率特征的维度。
反卷积重建:超分辨重建模块的最后一个阶段是使用一系列反卷积核上采样和聚合高分辨率特征,产生高分辨率的重建图像。
反卷积本质是卷积的逆过程,所以本算法设定反卷积步长s=2。
这决定了图像的上放大倍数为2。
图2目标检测模块示意图1.2目标检测模块骨架网络结构:如图2所示,目标检测模块的输入是一张经超分辨重建网络重建过后的600×600×3的图像,其中3代表图像的R、G、B这三个通道。
我们首先使用64个7×7的卷积核以步长为2对输入图片进行卷积运算。
三后经过64个3×3的卷积和以及maxpooling之后形成特征图B0。
然后我们使用128个3×3的卷积核对B0进行卷积并池化,以进一步进行特征提取产生特征图b1;之后的特征图B2、B3、B4均是在前一层特征图的基础上使用残差网络中的“瓶颈结构”获得。
“瓶颈结构”包括数次卷积运算(2次3×3卷积和1次1×1卷积)和一次特征图元素级相加。
这些大小不同的特征图(feature map)大小不同,感受野不同,对应的默认框(default box)也不同。
预测子模块:本文算法在多个尺度的特征图上进行目标分类和标定框位置回归。
预测子模块负责在每一个特征层级上检测不同尺度的物体。
它本质上是两个任务明确的子网,第一个子网对各个尺度的特征图进行卷积对象分类。
第二个子网对各个尺度的特征图进行卷积标定框回归。
目标分类子网预测每一个默认框关于C个目标类别的概率。
我们采用全卷积结构而非全连接层去设计该模块。
对于256通道的特征图,我们首先使用两次3×3的卷积层进一步进行特征提取与整合,然后使用ReLU 函数进行激活;最后,使用一个3×3的卷积层来进行得分预测,而最终的概率值将会通过sigmoid 激活函数得到。
平行于目标分类子模块,我们将另一个小的全网络同样附加到每个特征图之后,以便将每个默认框的偏移量回归到附近的ground-truth Box 。
回归子网同样2次3×3的卷积结构进行特征整合,并最终使用4A 个3×3的卷积核获得每个空间位置上的回归预测值,其中A 是每个空间位置上设定的默认框的数量。
尽管分类子模块与回归子模块结构十分相似,但必须注意的是,分类子网与回归子网并不共享参数。
1.3网络训练超分辨网络采用均方误差作为损失函数:L sr =min w 1n ∑i =1nF ()LR i s =2;w -HR i 22(1)其中LR is =2和HR i 分别代表低分分辨率图像和高分辨率训练图像,s 被设置为2意味着本算法重建出来的图像尺寸是原图的两倍,F ()LR is =2;w 是低分辨率图像经过网络前馈计算所得到的输出。
所有的权重w 通过随机梯度下降算法进行优化。
目标检测模块训练的代价函数是focal 损失[12]和标准smooth L1损失的加权和:L dect =1N()αL fo cal ()p +()1-αL smoo th ()x ,pr ,gr (2)其中,N 是正样本的数量and 权重因子α经交叉验证后设置为0.5。
pr 和gr 分别是预测的偏移量和ground truth 偏移量。
2实验结果分析本文实验在Win10操作系统下进行程序编写、调试以及效果展示。
算法所依赖的硬件配置为:四核CPU 、8G 运行内存、GTX1080Ti 显卡。
实验所利用的数据集为MS COCO 数据集。
超分辨网络的重建效果图如图3所示,在MS COCO 数据集上的目标检测评估效果如表1所示。
通过实验表明,本算法可以有效地对低分辨图像进行重建,其效果要好于双三次差值的结果。
对于目标检测任务而言,本算法可以有效地提升目标检测的性能,尤其是对小目标的检测有着巨大的促进作用。
此外,我们设置重构图片为输入图片的两倍,是一个性能与精确度的较好折中。
整体算法相当的高效,并且满足鲁棒性的要求。
但本文算法也存在一定的不足,对于输入图像过大的图像,本文算法会带来巨大的内存消耗而不能取得很好的效果。
(a )原图(b )超分辨图像(a )原图(b )超分辨图像图3超分辨效果图,图片数据来源于为MS COCO 标准数据集表1MS COCO 数据集上的检测结果3结语本文使用超分辨重构网络对输入图片进行重建之后,应用目标检测网络对目标进行检测。
该方法使用超分辨网络,有效地丰富了图片中目标的像素信息以及局部细节;同时采用深度卷积特征,有效地解决了传统的检测模型对手工特征的依赖问题;另外,通过使用focal 损失,类别不平衡的问题也得到了缓解。
试验结果表明,该模型对于低分辨率的图像能够实现很好的检测效果。
但对于较大的图片,该方法会造成不小的内存消耗,而且检测的精确度仍然有待提高,性能仍然需要改善,这将是后期需要研究和改进的地方。
参考文献:[1]Singla N.Motion Detection Based on Frame Difference Method[J].International Journal of Information&Computation Technology,2014,4(15):1559-1565.[2]Merlin P M,Farber D J.A Parallel Mechanism for Detecting Curves in Pictures[J].IEEE Transactions on Computers,1975,100(1):96-98.[3]Horn B K P,Schunck B G.Determining Optical Flow[J].Artificial Intelligence,1981,17(1-3):185-203.[4]Viola P,Jones M.Rapid Object Detection Using a Boosted Cascade of Simple Features[J].CVPR(1),2001,1:511-518.[5]Felzenszwalb P F,Girshick R B,McAllester D,et al.Object Detection with Discriminatively Trained Part-Based Models[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,32(9):1627-1645.[6]Girshick R,Donahue J,Darrell T,et al.Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C].Pro-ceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014:580-587.[7]Ren S,He K,Girshick R,et al.Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks[C].Advances in Neural Information Processing Systems,2015:91-99.[8]Dai J,Li Y,He K,et al.R-FCN:Object Detection via Region-Based Fully Convolutional Networks[C].Advances in Neural Information Processing Systems,2016:379-387.[9]He K,Gkioxari G,Dollar P,et al.MasK R-CNN[C].Computer Vision(ICCV),2017IEEE International Conference on.IEEE,2017: 2980-2988.[10]Liu W,Anguelov D,Erhan D,et al.SSD:Single Shot Multibox Detector[C].European Conference on Computer vision.Springer,Cham,2016:21-37.[11]Redmon J,Farhadi A.YOLO9000:Better,Faster,Stronger[J].arXiv preprint,2017.[12]Lin T Y,Goyal P,Girshick R,et al.Focal Loss for Dense Object Detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2018.[13]Dong C,Loy C C,He K,et al.Learning a Deep Convolutional Network for Image Super-Resolution[J],2014.[14]Dong C,Loy C C,Tang X.Accelerating the Super-Resolution Convolutional Neural Network[J],2016.作者简介:畅青(1993-),男,山西运城人,硕士,研究方向为计算机视觉与图像处理冯晶明(1994-),男,四川南充人,硕士,研究方向为计算机视觉与图像处理洪伟杰(1994-),男,福建泉州人,硕士,研究方向为计算机视觉与图像处理薛凯(1993-),男,山东青岛人,硕士,研究方向为计算机视觉与图像处理收稿日期:2019-07-05修稿日期:2019-07-24Object Detection Algorithm Based on Image Super-Resolution NetworkCHANG Qing,FENG Jing-ming,HONG Wei-jie,XUE Kai(College of Computer Science,Sichuan University,Chengdu610065)Abstract:Object detection has always been the core task in the field of computer vision.At present,visual recognition tasks are still vulnerable to var⁃ious image degradation,such as image blurring and low-resolution.Proposes an object detection algorithm based on image super-resolu⁃tion network.Firstly,builds a lightweight image super-resolution network to restore the pixel information and enhance the local details of the input image;then builds a new detection network on the reconstructed image to detect and locate various objects;finally,maps the test results to the original image.Experiments show that the proposed algorithm achieves better performance by fusing image super-resolution reconstruction network.Keywords:Object Detection;Image Super-Resolution;Multi-Scale Detector。