多尺度卷积特征融合的SSD目标检测算法
卷积神经网络中的多尺度特征融合技术(十)

卷积神经网络(Convolutional Neural Network,CNN)是一种用于图像识别和分类的深度学习模型,已经在计算机视觉领域取得了巨大的成功。
在图像处理中,多尺度特征融合技术是CNN中的一个重要方面,能够有效地提高模型的识别性能。
一、多尺度特征融合的意义在图像处理中,不同的尺度下会呈现出不同的特征信息,而多尺度特征融合技术能够将这些不同尺度下的特征信息有效地整合在一起,提高模型对图像的理解和识别能力。
这种技术可以使CNN在处理各种尺度的图像时更加灵活和高效。
二、多尺度特征融合的方法在CNN中,常用的多尺度特征融合方法包括金字塔结构、并行结构和级联结构。
其中,金字塔结构是将图像通过不同的滤波器提取出不同尺度的特征,并将这些特征图级联在一起;并行结构是在不同尺度下分别构建多个CNN模型,然后将它们的特征进行融合;级联结构是将不同尺度下的特征图串联在一起,然后通过卷积操作进行特征融合。
三、多尺度特征融合的应用多尺度特征融合技术在图像识别、目标检测和语义分割等领域都有着广泛的应用。
在图像识别任务中,通过多尺度特征融合技术,模型可以更好地捕捉图像的细节信息,提高识别准确率;在目标检测任务中,多尺度特征融合技术可以提高模型对不同尺度目标的检测能力;在语义分割任务中,多尺度特征融合技术可以更好地识别图像中的不同物体,并进行像素级的分割。
四、多尺度特征融合技术的挑战和发展趋势尽管多尺度特征融合技术在图像处理领域有着广泛的应用,但是在实际应用中仍然面临着一些挑战。
例如,多尺度特征融合技术需要更大的计算资源和存储空间,会增加模型的复杂度和训练时间;此外,多尺度特征融合技术的参数调整和优化也是一个复杂的问题。
未来,随着深度学习技术的不断发展,多尺度特征融合技术将会朝着更高效、更灵活的方向发展,进一步提高模型的性能和应用范围。
综上所述,多尺度特征融合技术在卷积神经网络中具有重要的意义,能够有效提高模型的识别性能。
改进SSD的交通标志目标检测算法

改进SSD的交通标志目标检测算法作者:肖丹东陈劲杰来源:《软件导刊》2020年第05期摘要:以Faster R-CNN为代表的two-stage目标检测算法检测速度慢,而one-stage目标检测算法中的SSD算法虽然检测速度快,但对交通标志类小目标的检测效果不佳。
因此在SSD 算法VGG16骨干网络上引入感受野块(RFB)结构,既提升检测速度又可在小目标检测上达到良好的检测精度。
与此同时,为提高网络分类精度,在损失函数中加入中心损失。
将SSD 算法与改进的SSD算法在VOC数据集上进行训练,对比其性能可知,改进后算法mPA值达到80.7%,相比SSD300(VGG16)算法提高了3.5%。
该算法在LISA traffic sign数据集上训练,在迁移学习的基础上得到的mPA值为78.4%,检测单张图像平均耗时为20.5ms,可满足实时性要求。
关键词:交通标志;小目标检测;RFB结构;中心损失DOI:10. 11907/rjdk. 191977 开放科学(资源服务)标识码(OSID):中图分类号:TP312 文献标识码:A 文章编号:1672-7800(2020)005-0048-040 引言交通标志信息是交通场景中的重要环境信息,是保证先进驾驶辅助系统(Advanced Driver Assistant System, ADAS)正常运行的必要条件。
目前基于计算机视觉的目标检测算法可部分满足场景信息检测需求[1],但在实际应用中还存在一些缺陷。
基于OpenCV的目标检测方法,如HOG(histogram of oriented gradient)、SIEF(scale-invariant feature transform)等方法使用人工设定先验条件的方式进行检测,导致算法鲁棒性差,难以适应交通标志类复杂的交通场景检测;如果算法应用到大范围的智能化作业,不仅算法耗时、监管人力消耗较大,同时算法实时性指标也难以满足[2]。
基于改进SSD的高效目标检测方法

基于改进SSD的高效目标检测方法WANG Wenguang;LI Qiang;LIN Maosong;HE Xianzhen【摘要】为改善一阶段目标检测算法检测精度较差的缺陷,提出一种基于SSD的高效多目标定位检测算法FSD.该算法主要从两个方面对一阶段目标检测算法进行改进:设计了一个更高效的密集残差网络,即R-DenseNet,通过采用一种更窄的密集网络结构形式,在保持特征提取容量的同时降低了计算复杂度,从而提高了算法的检测和收敛性能;改进了损失函数,通过抑制易分样本在损失函数中的权重,提高算法的鲁棒性,改善了目标检测中样本失衡的现象.采用Tensorflow深度学习框架部署网络,并在搭载Nvidia Titan X的Ubuntu上开展实验,实验表明FSD在COCO和PASCAL VOC这两个目标检测数据集上上都取得了最高的检测精度,其中FSD300D的检测精度相比SSD300有3.7%提升,检测相率比SSD有10.87%提升.%In order to improve the defect of poor detection accuracy of the one-stage object detection algorithm, an efficient multi-target location detection algorithm FSD based on SSD is proposed. The algorithm mainly improves the one-stage object detection algorithm from two aspects: on the one hand, it designs a more efficient dense residual network, namely R-DenseNet, by adopting a narrower dense network structure form to maintain feature extraction. The capacity reduces the computational complexity, which improves the detection and convergence performance of the algorithm. On the other hand, the loss function is improved. By suppressing the weight of the easily-divided samples in the loss function, the robustness of the algorithm is improved, and the phenomenon of sample imbalance in object detection is improved. The Tensorflow deeplearning framework is used to deploy the network, and experiments are carried out on Ubuntu equipped with Nvidia Titan X. Experiments show that FSD achieves the highest detection accuracy on both COCO and PASCAL VOC object detection data sets, among which FSD300 detection accuracy compared with the SSD300, there is a 3.7% improvement, and the detection phase rate is 10.87% higher than that of the SSD.【期刊名称】《计算机工程与应用》【年(卷),期】2019(055)013【总页数】8页(P28-35)【关键词】深度学习;目标检测;特征融合;样本失衡;卷积神经网(CNN)【作者】WANG Wenguang;LI Qiang;LIN Maosong;HE Xianzhen【作者单位】School of Information Engineering, Southwest University of Science and Technology, Mianyang ,Sichuan 621010, China;School of Information Engineering, Southwest University of Science and Technology, Mianyang ,Sichuan 621010, China;School of Information Engineering, Southwest University of Science and Technology, Mianyang ,Sichuan 621010, China;School of Information Engineering, Southwest University of Science and Technology, Mianyang ,Sichuan 621010, China【正文语种】中文【中图分类】TP391 引言随着深度卷积神经网络的提出和发展,目标检测算法取得了巨大的进步[1-2]。
resnet-50 模型 多尺度特征融合公式

resnet-50 模型多尺度特征融合公式文章标题:探究ResNet-50模型中多尺度特征融合公式的深度与广度在深度学习领域中,ResNet-50模型是一种非常重要的卷积神经网络模型,在图像分类、目标检测和语义分割等任务中表现出色。
其中,多尺度特征融合公式更是ResNet-50模型中的重要组成部分,对于提高模型的性能和效率具有重要意义。
在本文中,将深入探讨ResNet-50模型中多尺度特征融合公式,从简单到复杂、由浅入深的方式进行全面评估,帮助读者更深入地理解这一重要概念。
1. ResNet-50模型概述ResNet-50模型是由微软研究院提出的一种深度残差网络,它是ResNet系列网络中的一员。
相较于传统的卷积神经网络,ResNet-50模型在处理深层网络时能够避免梯度消失和梯度爆炸的问题,使得网络的训练更加容易和稳定。
在ResNet-50模型中,卷积层、池化层和全连接层交替堆叠,形成了深度的神经网络结构。
ResNet-50模型中的多尺度特征融合公式也是其性能优异的重要原因之一。
2. 多尺度特征融合公式的作用在计算机视觉任务中,图像中的不同目标和背景往往具有不同的尺度和特征。
为了有效地捕捉这些特征,ResNet-50模型中引入了多尺度特征融合公式,以综合利用不同尺度下的特征信息。
多尺度特征融合公式的作用主要包括:- 识别和定位不同尺度下的目标- 提高模型对图像整体和局部特征的感知能力- 增强模型对目标和背景之间的语境关系的理解3. 多尺度特征融合公式的具体形式在ResNet-50模型中,多尺度特征融合公式通常采用平均池化和最大池化的方式进行特征融合。
具体而言,对于不同尺度下的特征图,通过平均池化和最大池化操作分别提取其平均值和最大值,在保留特征信息的同时实现不同尺度特征的融合。
对于两个尺度下的特征图A和特征图B,可以通过以下公式进行融合:融合特征图 = (平均池化(A) + 最大池化(B)) / 24. 多尺度特征融合公式的个人观点与理解在我看来,多尺度特征融合公式能够帮助ResNet-50模型更好地理解图像中的丰富信息,从而提高模型在目标检测和语义分割等任务中的性能。
多尺度特征融合方法

多尺度特征融合方法
多尺度特征融合方法
多尺度特征融合是一种常见的技术分析方法,可以帮助提取不同尺度的特征信息,并提高模型的鲁棒性和准确性。
以下是几种常见的多尺度特征融合方法:
1. 金字塔法(Pyramiding):将不同尺度的特征点按顺序组合在
一起,形成一个更大的特征空间。
金字塔法的优点是能够将不同尺度的特征信息结合起来,形成更全面的特征描述。
2. 级联特征融合(Merged 特征):将不同尺度的特征点进行加权融合,形成一个新的特征向量。
级联特征融合的优点是能够平衡不同尺度的特征信息,避免信息过载和失真。
3. 小波变换法(Wavelet Transform法):利用小波变换在不同尺度上的特性,将不同尺度的特征信息进行分离和融合。
小波变换法的优点是可以处理不同频率和不同尺度的特征信息,缺点是需要对小波系数进行编码和解码。
4. 遗传算法(Genetic Algorithms法):是一种自适应的优化方法,可以在不断尝试中找出最优的特征融合方案。
遗传算法法的优点是可以针对复杂的特征组合问题进行优化,缺点是需要大量的试验数据和计算资源。
以上是几种常见的多尺度特征融合方法,不同的方法适用于不同的场景和问题。
在实际应用中,需要根据具体情况选择最合适的方法。
特征融合的分类和方法精选全文

特征融合的分类和⽅法1、特征融合的定义特征融合⽅法是模式识别领域的⼀种重要的⽅法,计算机视觉领域的图像识别问题作为⼀种特殊的模式分类问题,仍然存在很多的挑战,特征融合⽅法能够综合利⽤多种图像特征,实现多特征的优势互补,获得更加鲁棒和准确性的识别结果。
2、特征融合的分类按照融合和预测的先后顺序,分类为早融合和晚融合(Early fusion and Late fusion)早融合(Early fusion):就是在特征上进⾏融合,进⾏不同特征的连接,输⼊到⼀个模型中进⾏训练。
(先融合多层的特征,然后在融合后的特征上训练预测器,只有在完全融合之后,才进⾏检测。
)这类⽅法也被称为skip connection,即采⽤concat、add操作。
这⼀思路的代表是Inside-Outside Net (ION)和HyperNet.两个经典的特征融合的⽅法:(1)concat:系列特征融合,直接将连个特征进⾏连接。
两个输⼊特征x和y的维数若为p和q,输出特征z的维数为p+q。
(2)add:并⾏策略,将这两个特征向量组合成复合向量,对于输⼊特征x和y,z=x+iy,其中i是虚数单位。
晚融合(Late fusion):指的是在预测分数上进⾏融合,做法就是训练多个模型,每个模型都会有⼀个预测分数,我们对所有模型的结果进⾏融合,得到最后的预测结果。
(通过结合不同层的检测结果改进检测性能,尚未完成最终融合之前,在部分融合的层上就开始检测,会有多层的检测,最终将多个检测结果进⾏融合)。
这⼀类研究思路的代表有两种:(1)feature不融合:多尺度的feture分别进⾏预测,然后对预测结果进⾏综合,如Single Shot MultiBox Detector(SSD),Multi-scale CNN(MS-CNN).注意:SSD,全称Single Shot MultiBox Detector,是Wei Liu在ECCV 2016上提出的⼀种⽬标检测算法,截⾄⽬前是主要的检测框架之⼀,相⽐Faster RCNN有明显的速度优势,相⽐YOLO⼜有明显的mAP优势(不过已经被CVPR 2017的YOLO9000超越)。
一种改进的SSD目标检测算法

R-CNN米用selective search提取候选区域,然后进
行特征提取,用获得的特征进行分类,用非极大
值抑制和边界框回归进行精确检测。Fast R-CNN 是在R-CNN的基础上,进行了相关改进,将特征
提取、区域分类等融合在一起,将分类与回归同 时训练,极大地提升了训练中的空间耗费问题,
DSSD
ResNet-101 300x300 78.6
STDN DenseNet-169 300x300 78.1
FSSD
VGGNet 300x300 78.8
FP Reconfig VGGNet 300x300 79.6
于特征金字塔融合方法和级联检测器的两类方 法。特征金字塔融合方法主要有FPN⑵、TDM⑶、 DSSD [ 41FSSD⑸和FP Reconfig⑹,该类方法通 过将语义更深的特征聚集到较浅的层次来解决 小目标检测中的模糊性,通常,从主干中提取的 一组特征映射跨尺度融合在一起,产生金字塔式 的表示,在此基础上进行后续的检测操作。最早 Lin等人提出了特征金字塔网络(Feature Pyramid Network,FPN ),该网络通过迭代上采样和像素加 法,将较高层次的判别特征融合到较低层次上, 融入高层的语义信息和低层的位置信息。在此基
•108 -
础上,提出了TDM,将融合操作由像素加法改为
像素级联。除了这两项基础工作外,还提出了一
些更为复杂的特征金字塔融合方法,如FSSD重构
了特征金字塔,通过把网络中某些特征进行尺度 调整,特征图较小的层进行上采样来统一到同一
尺寸,并通过级联对特征连接。DSSD算法通过利
用上下文信息和反卷积操作,单向融合了低层特
基于改进SSD的行人检测算法

第34卷第3期2023年9月广西科技大学学报JOURNAL OF GUANGXI UNIVERSITY OF SCIENCE AND TECHNOLOGY Vol.34No.3 Sept.2023基于改进SSD的行人检测算法张伦,谭光兴*(广西科技大学自动化学院,广西柳州545616)摘要:针对目前主流的目标检测算法在检测行人时无法兼顾精度与实时性的问题,提出一种改进单次多框检测器(single shot multibox detector,SSD)的行人检测算法。
首先,将高效通道注意力机制引入浅层网络中并重新分配特征权重,引导网络更加关注小尺度行人的特征信息;其次,构造一种新的特征融合模块以改善浅层特征语义信息不足的问题;最后,通过优化原始先验框的参数来生成适用于检测行人的先验框。
实验结果表明,改进后的算法在PASCAL VOC2007行人测试集上的平均精度达到82.96%,较SSD提高了3.83%,在小尺度行人测试集上提高了5.48%,同时检测速度达到了69.2FPS,满足实时性的要求。
关键词:单次多框检测器(SSD);行人检测;注意力机制;特征融合中图分类号:TP391.41DOI:10.16375/45-1395/t.2023.03.0130引言行人检测作为计算机视觉领域中的研究热点之一,是指判断图像或视频帧中是否存在行人并标记其具体位置,在视频监控、智能安防以及自动驾驶等领域应用越来越广泛[1]。
虽然现有的方法在行人检测任务中已取得一些研究进展,但由于行人姿态多变、相互遮挡以及小尺度行人目标特征信息较少等因素的影响,仍然存在被误检、漏检的问题,因此对行人检测方法还需进一步研究。
近年来,随着深度学习的迅速发展,基于深度学习的行人检测方法在行人检测技术中占据了主导地位,该方法主要分为两阶段检测算法和单阶段检测算法。
两阶段检测算法首先生成目标的候选区域,然后将其送入分类器中进行分类和回归[2]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Received2018-10-08,Accepted2018-12-21.CNKI网络出版:2019-01-21,http://kns.cnki.net/KCMS/detail/11.5602.TP.20190118.1125.008.html
计算机科学与探索JournalofFrontiersofComputerScienceandTechnology
多尺度卷积特征融合的SSD目标检测算法陈幻杰1,王琦琦1+,杨国威1,韩佳林1,尹成娟1,陈隽2,王以忠11.天津科技大学电子信息与自动化学院,天津3002222.麦克马斯特大学电子与计算机工程系,加拿大汉密尔顿L8E、L8W+通讯作者E-mail:wangqiqi@tust.edu.cn
摘要:提出了一种改进的多尺度卷积特征目标检测方法,用以提高SSD(singleshotmultiboxdetector)模型对中目标和小目标的检测精确度。该方法先对SSD模型低层特征层采用区域放大提取的方法以提高对小目标的检测能力,再对高层特征层进行特征提取以改善中目标的检测效果。最后,利用SSD模型中原有的多尺度卷积检测方法,将改进的多层特征检测结果进行融合,并通过参数再训练以获得最终改进的SSD模型。实验结果表明,该方法在MSCOCO数据集上对中目标和小目标的测试精确度分别为75.1%和40.5%,相比于原有SSD模型分别提升16.3%和23.1%。关键词:单次多框目标检测器(SSD)模型;多尺度特征融合;目标检测;深度学习文献标志码:A中图分类号:TP391.41
陈幻杰,王琦琦,杨国威,等.多尺度卷积特征融合的SSD目标检测算法[J].计算机科学与探索,2019,13(6):1049-1061.CHENHJ,WANGQQ,YANGGW,etal.SSDobjectdetectionalgorithmwithmulti-scaleconvolutionfeaturefu-sion[J].JournalofFrontiersofComputerScienceandTechnology,2019,13(6):1049-1061.
SSDObjectDetectionAlgorithmwithMulti-ScaleConvolutionFeatureFusionCHENHuanjie1,WANGQiqi1+,YANGGuowei1,HANJialin1,YINChengjuan1,CHENJun2,WANGYizhong1
1.CollegeofElectronicInformationandAutomation,TianjinUniversityofScienceandTechnology,Tianjin300222,China2.DepartmentofElectricalandComputerEngineering,McMasterUniversity,HamiltonL8E,L8W,Canada
Abstract:Inthispaper,itisproposedthattheaccuracyofsmallandmediumobjectsdetectionofSSD(singleshotmultiboxdetector)canbeimprovedbyincorporatingamodifiedmulti-scaleconvolutionfeaturefusionmethod.Inordertoenhancesmallobjectsdetection,theregionmagnificationextractiononthelow-layerfeaturemapsisadopted.Then,featuresareextractedfromthehigh-layerfeaturemapstomakethedetectionofmediumobjectsbetter.Thesefeaturesarefinallyfusedbythemulti-scaleconvolutiondetectionmethodasintheoriginalSSD
1673-9418/2019/13(06)-1049-13doi:10.3778/j.issn.1673-9418.1810005JournalofFrontiersofComputerScienceandTechnology计算机科学与探索2019,13(6)
1引言随着计算机视觉的快速发展,目标检测技术受到了越来越广泛的关注[1-4]。深度学习[5]作为人工智能的新兴领域,在目标检测上相比于传统方法[6-7]具有更高的鲁棒性和准确性。近年来,相继出现了多种基于深度学习[8-10]的目标检测方法,如R-CNN(region-basedconvolutionalneuralnetwork)[11]模型、FastR-CNN[12]模型、FasterR-CNN[13]模型、SSD(singleshotmultiboxdetector)[14]模型等。其中,SSD模型是检测精确度相对更高的网络,但是由于SSD模型用于检测的低层特征层只有一层,特征细节信息较少,导致其对小占比目标检测效果较差。很多学者在提升SSD模型小占比目标检测能力方面进行了相应的研究。Wen等[15]提出一种改进SSD算法,即通过引入Atrous[16]滤波器、SeLU[17]激活函数以及新设计的数据增广规则以提高小占比目标检测效果。Xing等[18]以SSD算法为基础,根据不同尺寸目标分布规律以优化特征层缩放因子,其在行人检测目标尺寸较小以及遮挡问题上有了一定的改善,并获得了较低的漏检率。Tang等[19]在SSD模型的基础上提出了多视窗方法,即利用多个视窗多通路的SSD模型进行同时检测以提升准确率,但该方法区域划分方式不固定,目标被拆分检测,其对于目标检测的鲁棒性和准确性将产生一定的影响。Fu等[20]
提出了DSSD(deconvolutionalSSD)模型,其采用特征提取能力更强的网络Residual-101,并结合反卷积模块加入上下文信息提高小占比目标检测能力,其检测精确度(meanaverageprecision,mAP)相比SSD模型提升1.4%。但由于该模型网络层数更深,其在TITANX显卡上检测速度为每秒9帧图像,而SSD模型检测速度为每秒46帧图像,DSSD模型检测实时性较差。Jeong等[21]提出RSSD(rainbowSSD)模型,即通过改进特征融合的方式,结合池化和反卷积操作
更加充分地利用模型特征,使得检测到更多的小占比目标,其在检测精度mAP上相比于SSD模型提升1.3%,相比于DSSD模型基本持平。Li等[22]提出FSSD(featurefusionSSD)模型,通过特征融合和下采样操作重构模型多尺度特征,丰富特征细节信息,以提高在小目标上的检测效果,其检测精确度mAP相比于RSSD模型提升了0.3%,相比DSSD模型提升0.2%,相比SSD模型提升1.6%。由于该模型为轻量级特征融合模块,其检测速度更接近SSD模型,其检测性能超过了许多先进的目标检测算法。本文方法检测速度为每秒23帧图像,相比于SSD模型虽有所下降,但是依然具有一定的实时性。本文根据SSD模型不同特征层对不同大小目标在检测上的针对性,在主要用于检测小占比目标的低层特征层和中等占比目标的高层特征层上分别进行相应的改进,并对改进后的SSD网络进行了再训练。本文选取FSSD模型做对比实验,通过比较mAP值验证本文模型对中目标和小目标的检测效果。实验结果表明再训练后的改进型SSD网络,比再训练同样次数的原有SSD网络的检测能力更强,对中目标和小目标的检测效果更佳。
2SSD模型2.1SSD模型结构SSD模型是端到端的单次卷积神经网络,在结构上,SSD模型主要是在基础网络VGG(visualgeometrygroupnetwork)上添加新的网络结构,并采用多尺度卷积检测的方式来进行目标检测。具体SSD模型结构如图1所示。2.2SSD模型多尺度特征分析SSD模型多尺度作用体现在利用不同层级、不同尺度的特征图来进行目标框定检测,其多尺度计算过程在数学上的定义公式为[23]:
architecture.Moreover,theparametersofthepresentmodelareobtainedviatheparameterretraining.OntheMSCOCOtestset,thepresentmodelshowsthatthemAP(meanaverageprecision)ofmediumandsmallobjectsdecetionis75.1%and40.5%respectively,whichisnearly16.3%and23.1%higherthantheoriginalSSD.Keywords:singleshotmultiboxdetector(SSD);multi-scalefeaturefusion;objectdetection;deep-learning
1050陈幻杰等:多尺度卷积特征融合的SSD目标检测算法
Tn=φn(Tn-1)=φn
(φn-1(⋯φ1(I)))(1)
R=D(dn(Tn
),dn-1(Tn-1),⋯,dn-s(Tn-s)),n>s>0(2)
其中,Tn为第n层特征图,φn为由第n-1层特征图得到第n层特征图的非线性运算,φ
1
(I)为由输入图
像I得到第一层特征图的运算,d
n
(⋅)为第n层特征图
上相应尺度范围的检测结果,D(⋅)为将所有中间检测结果进行集合得到的最终结果R。由式(1)、式(2)可看出,第n层特征信息由第n-1层特征信息决定,且每层特征图只负责其对应尺度的检测。因此,对于SSD模型需假设每层特征足够复杂才能更精确地检测目标。其特征图需具有足够的分辨率以表达细节特征,由足够深的网络提取得到更抽象特征,还需包含适当的上下文信息才能更准确地检测出目标。而在SSD模型中特征提取逐层抽象,低层特征主要对应于细节信息,高层特征主要对应于抽象的语义信息[24]。如果目标在原图中占比越小,特征信息经过层层卷积、池化等操作,在高层特征层上保留的信息越少,对于占比越小的目标检测也越不敏感。因此SSD模型主要利用低层细节特征检测小占比目标,高层抽象特征检测中等占比目标和大目标。但是SSD模型中用于小目标检测的低层卷积层仅有一层为Conv4_3,特征表达能力不够,细节信息不足。而高层卷积层虽包含5层,但其对于中目标的特征提取依然不充分,这导致SSD模型对于中目标和小目标检测效果弱于大目标。具体的SSD模型中目标和小目标检测结果如图2所示。图2中将SSD模型用于检测的低层特征层Conv4_3、高层特征层Fc7、Conv9_2进行可视化,并