HOG算法在机器人3D视觉技术中的应用
HOG 研究报告

HOG特征提取方法研究摘要:本文详细介绍了HOG特征提取方法中用到的理论知识和实验,分别阐述了梯度的计算、三线性插值和区块表量化,然后对HOG的结果进行可视化,最后对HOG的优缺点进行总结。
关键字:HOG,梯度,三线性插值,标准化1. 引言方向梯度直方图(Histogram of Oriented Gradient,HOG)是一种用于目标检测的特征描述子,广泛应用在计算机视觉和图像处理领域。
在2005年的CVPR上被Navneet Dalal和Bill Trigg提出,并用在静态图像的行人检测中,取得了显著的效果。
作者是法国国家计算机技术和控制研究所French National Institute for Research in Computer Science and Control (INRIA)的研究员,后来,他们也将其应用在电影和视频中的行人检测,以及静态图像中的车辆和常见动物的检测。
2. 国内外研究现状HOG自2005年提出以来,引用率为11600多次,HOG的改进和应用广泛。
3. 方法分析HOG的基本思想是利用局部图像的密集梯度特征,体现图像中物体的边缘特征,在一幅图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述。
具体的实现方法是:首先将图像分成小的连通区域即细胞单元(cell)。
然后采集细胞单元中各像素点的梯度或边缘的方向直方图。
最后,把这些直方图组合起来就构成了特征描述子。
为了提高性能,把这些局部直方图在图像的更大范围内即区间(block)进行对比度归一化(contrast-normalize)。
所采用的方法是,首先计算各直方图在这个区间中的密度,然后根据这个密度对区间中的各个细胞单元作归一化。
通过这个归一化后,能对光照变化和阴影获得更好的效果。
与其他特征描述子比较,HOG描述子有很多优点,首先,由于HOG是在图像的局部细胞单元上进行操作,所以它对图像几何的和光学的形变都能保持良好的不变性,这两种形变只会出现在更大的空间领域上。
基于HOG和粒子滤波器的行人目标检测与跟踪

基于HOG和粒子滤波器的行人目标检测与跟踪随着计算机视觉研究的深入,行人目标检测与跟踪在智能监控、自动驾驶等领域中得到了广泛应用。
基于HOG(Histogram of Oriented Gradients)和粒子滤波器的方法是一种常用且有效的行人目标检测与跟踪算法。
HOG是一种用于图像特征提取的方法,通过计算图像中局部区域的梯度直方图来描述图像的特征。
在行人目标检测中,首先将图像分成多个小的块,并计算每个块的梯度直方图。
然后,通过将这些直方图串联起来,得到整个图像的特征描述。
最后,利用支持向量机(SVM)等分类器进行目标检测。
而粒子滤波器是一种用于目标跟踪的方法,通过利用目标在连续帧之间的运动模型和观测模型来估计目标的位置。
在行人目标跟踪中,首先通过HOG方法提取目标的特征。
然后,根据目标的运动模型和观测模型,利用粒子滤波器算法进行目标位置的估计和更新。
通过不断迭代,可以实现对行人目标的准确跟踪。
基于HOG和粒子滤波器的行人目标检测与跟踪算法具有以下优点。
首先,HOG方法能够有效地提取图像中的行人特征,具有较高的检测准确率。
其次,粒子滤波器算法能够根据目标的运动模型和观测模型进行目标位置的估计和更新,具有较好的跟踪鲁棒性。
最后,该算法结合了目标检测和跟踪的优点,能够实现对行人目标的精确检测和跟踪。
然而,基于HOG和粒子滤波器的行人目标检测与跟踪算法也存在一些挑战和不足之处。
首先,HOG方法对光照、遮挡等因素较为敏感,可能影响检测准确性。
其次,粒子滤波器算法对目标的运动模型和观测模型的选择较为敏感,需要进行合理的参数设置和模型训练。
此外,算法的实时性和计算复杂度也是需要考虑的问题。
综上所述,基于HOG和粒子滤波器的行人目标检测与跟踪算法具有广泛应用前景。
通过不断改进和优化算法,可以提高行人目标检测与跟踪的准确性和鲁棒性,为智能监控、自动驾驶等领域的应用提供更好的支持。
人脸关键点检测与3D重建技术研究

人脸关键点检测与3D重建技术研究人脸关键点检测与3D重建技术是计算机视觉领域的研究热点之一。
它涉及了计算机视觉、图像处理和深度学习等多个领域的交叉应用,具有广泛的应用前景和重要的研究意义。
本文将探讨人脸关键点检测与3D重建技术的原理、方法和应用,并对相关研究进展进行综述。
一、人脸关键点检测技术人脸关键点检测是指在给定的人脸图像中自动定位特定关键点的过程,例如眼睛、鼻子、嘴巴等。
在过去的几十年中,人脸关键点检测技术取得了显著的进展,从传统的基于特征提取和分类的方法发展到深度学习技术的应用。
传统的人脸关键点检测方法主要基于人工设计的特征提取和分类算法,例如Haar特征、HOG特征和SIFT特征等。
这些方法需要手动设计特征,并且对光照、姿态和遮挡等因素敏感,导致检测结果的准确度和鲁棒性较低。
随着深度学习的发展,基于卷积神经网络(CNN)的方法在人脸关键点检测任务上取得了巨大的突破。
通过大量的训练数据和深层网络结构,CNN能够自动学习图像中的特征表示,提取更具有判别性的特征用于关键点检测。
在这方面,一些经典的CNN模型,如LeNet、AlexNet、VGGNet和ResNet等,都被成功应用于人脸关键点检测。
二、人脸3D重建技术人脸3D重建是指通过从一个或多个2D图像中恢复人脸的3D 结构。
它可以用于生成逼真的三维人脸模型,进而在虚拟现实、人机交互、人脸识别和表情分析等领域中得到广泛应用。
人脸3D重建技术主要有以下几个步骤:首先,从输入的2D图像中提取特征点或特征描述子,例如人脸关键点和纹理特征。
然后,根据这些特征点或描述子估计人脸的姿态和形状,并建立起3D模型的初始估计。
最后,通过优化算法迭代地调整模型参数,使得3D模型与输入图像尽可能吻合。
在人脸3D重建技术中,传统的方法主要基于多视图几何和结构光等技术。
多视图几何方法通过从多个视角观察人脸并匹配特征点来恢复3D结构。
而结构光方法则利用投影纹理或红外传感器等设备,测量人脸表面的形状和纹理信息。
HOG算法在机器人3D视觉技术中的应用

HOG算法在机器人3D视觉技术中的应用吴鑫;张文广;刘帅【摘要】HOG算法在行人检测和手势识别中有很好的试验效果,是一种优秀的特征描述符.通过对HOG算法做适当变形处理,使其应用于Kinect的RGB和深度图像,以此描述目标物体的3D特征信息,通过libSVM分类器训练模板,并进行物体的分类和识别.试验结果表明:利用RGB和深度信息的HOG识别系统比只利用二维信息的识别系统有着更高的识别准确率.【期刊名称】《农业科技与装备》【年(卷),期】2013(000)001【总页数】3页(P35-37)【关键词】视觉技术;RGB图像;深度图像;梯度方向直方图(HOG)【作者】吴鑫;张文广;刘帅【作者单位】营口供电公司,辽宁营口115000【正文语种】中文【中图分类】TP391.4随着图像处理和模式识别技术的发展与完善、图像采集技术和设备的更新换代及新一代计算机的出现,机器人视觉这门新科学得到了长足的发展。
2009年,微软推出了新型的3D体感摄像机——Kinect,它是应用于XBOX360的体感周边外设(见图1)。
这种相机能够实时、同步采集代表色彩信息的RGB 图像和代表空间距离信息的深度图像(见图2),从而反映出实际物体的三维特征信息。
在特征描述符方面,法国的N.Dalal和B.Triggs在2005年首次提出了梯度方向直方图(HOG)算法,并将其用于行人检测,复旦大学的王利明将HOG用于街景识别也取得不错的效果。
本研究通过对HOG算法做适当处理,使其应用于Kinect的RGB和深度图像,以此描述目标物体的特征信息,通过libSVM分类器训练模板,并进行物体的分类和识别。
HOG特征主要是用来计算局部图像梯度方向信息的统计值。
与其他特征描述符相比,HOG算法的操作是在图像的局部细胞单元这一层次进行的,具有良好的几何和光学不变性。
其实现方法是:首先将整幅图像分成一定数量的子图像,再将各子图像按照一定的规则分割成细胞单元,然后采集细胞单元中各像素点的梯度方向直方图,计算各直方图在子图像中的密度,根据这个密度对子图像中的各个细胞单元做归一化处理,最后把这些直方图组合起来就可以构成特征描述器(见图3)。
hog原理

hog原理HOG原理:从图像中提取特征HOG(Histogram of Oriented Gradients)是一种用于图像识别和目标检测的特征提取方法。
它的原理是将图像分成小的单元格,计算每个单元格内像素的梯度方向和大小,然后将这些信息组合成一个向量,作为该单元格的特征。
这些向量可以被用来训练机器学习模型,以识别图像中的不同物体。
HOG原理的发展历程HOG原理最初由Navneet Dalal和Bill Triggs在2005年提出。
他们的研究表明,使用HOG特征可以在不需要先验知识的情况下,对不同的物体进行分类和检测。
这种方法在计算机视觉领域中得到了广泛的应用,尤其是在人脸识别和行人检测方面。
HOG原理的实现步骤HOG原理的实现步骤可以分为以下几个部分:1. 图像预处理在使用HOG特征进行物体检测之前,需要对图像进行预处理。
这包括将图像转换为灰度图像、对图像进行归一化和平滑处理等。
2. 计算梯度在图像预处理之后,需要计算每个像素的梯度。
这可以通过使用Sobel算子或其他梯度算子来实现。
梯度的大小和方向可以用以下公式计算:G = sqrt(Gx^2 + Gy^2)θ = arctan(Gy / Gx)其中,Gx和Gy分别是x和y方向上的梯度,G是梯度的大小,θ是梯度的方向。
3. 划分单元格将图像分成小的单元格,通常是8x8像素或16x16像素。
每个单元格内的像素梯度可以用一个直方图来表示。
4. 归一化对于每个单元格内的直方图,需要进行归一化处理,以消除光照和对比度的影响。
常用的归一化方法是L2范数归一化。
5. 组合特征将每个单元格内的归一化直方图组合成一个向量,作为该单元格的特征。
这些向量可以被用来训练机器学习模型,以识别图像中的不同物体。
HOG原理的优缺点HOG原理的优点是可以在不需要先验知识的情况下,对不同的物体进行分类和检测。
它还可以处理不同尺度和旋转的物体,并且对光照和对比度的变化具有一定的鲁棒性。
三维霍夫变换

三维霍夫变换三维霍夫变换(3D Hough Transform)是一种图像处理技术,用于在三维空间中检测物体的形状和位置。
它是二维霍夫变换的扩展,可以应用于三维模型重建、目标检测和姿态估计等领域。
本文将介绍三维霍夫变换的原理、算法以及应用。
一、原理三维霍夫变换的原理基于极坐标的转换。
在三维空间中,一个点的位置可以由它的坐标表示,即(x, y, z)。
而霍夫变换则将点的位置表示为参数空间中的一个点,该点与待检测物体的某个参数相关联。
对于三维空间中的线段,可以通过其在参数空间上的投影进行检测。
二、算法三维霍夫变换的算法与二维霍夫变换类似,主要包括以下几个步骤:1. 确定参数空间:根据待检测物体的特性选择适当的参数空间,为每个参数建立对应的投票矩阵。
2. 构建投票矩阵:遍历图像中的每个点,将每个点在参数空间上的投票结果累加到对应的投票矩阵中。
3. 提取特征:根据投票矩阵的结果,提取出具有较高得票数的参数组合,作为待检测物体的特征。
4. 检测与定位:根据提取的特征,对图像进行检测和定位,获取待检测物体的形状和位置信息。
三、应用三维霍夫变换在许多领域中有广泛的应用。
1. 三维模型重建:三维霍夫变换可以用于从多个二维视图中重建三维模型。
通过在不同视角下进行三维霍夫变换,可以将多个二维投票矩阵叠加得到最终的三维投票矩阵,从而估计出物体的三维形状。
2. 目标检测:三维霍夫变换可以用于目标检测,特别是对于三维物体的检测。
通过在参数空间中查找具有较高得票数的参数组合,可以准确地定位图像中的目标物体。
3. 姿态估计:三维霍夫变换可以用于姿态估计,即确定物体在三维空间中的方向和角度。
通过分析在不同姿态下的霍夫变换结果,可以获得物体的姿态信息。
四、总结三维霍夫变换是一种有效的图像处理技术,可以用于三维模型重建、目标检测和姿态估计等应用。
它通过将图像点的位置转换为参数空间中的投票,实现对待检测物体的形状和位置的准确提取。
随着计算机视觉技术的不断发展,三维霍夫变换在各个领域中将发挥更重要的作用。
快速Hough变换及其在机器人双目视觉系统中的应用
快速Hough变换及其在机器人双目视觉系统中的应用
肖中凯;方建军
【期刊名称】《广西轻工业》
【年(卷),期】2008(24)6
【摘要】通过分析常用的Hough变换算法,开发了一种新的用于圆检测的快速Hough变换,与现有的Hough变换算法进行比较,新设计算法速度更快,该方法对圆形对象提取具有很好的效果.把此快速Hough变换应用在机器人双目视觉系统中,机器人可以成功的识别圆形物体,并实现对物体经行准确抓取.
【总页数】2页(P83-84)
【作者】肖中凯;方建军
【作者单位】北方工业大学机电学院,北京,100041;北方工业大学机电学院,北京,100041
【正文语种】中文
【中图分类】TP317.4
【相关文献】
1.双目视觉在助老助残机器人定位系统中的应用
2.双目视觉快速匹配在喷涂机器人中的应用
3.快速Hough变换(FHT)在实时识别目标系统中的应用
4.双目视觉技术在机器人柔性分拣系统中的应用
5.双目视觉技术在机器人柔性分拣系统中的应用
因版权原因,仅展示原文概要,查看原文内容请购买。
基于hog图像特征的人脸识别系统设计与实现
Techniques of Automation &Applications基于hog 图像特征的人脸识别系统设计与实现付智军(重庆财经职业学院应用设计系,重庆402160)摘要:人脸识别是一种典型的计算机图像视觉技术应用。
本文以该技术为背景,给出一个基于hog 特征算子来描述目标的人脸识别系统。
该系统提取被检测图像的hog 特征并使用Adaboost 学习算法训练识别分类器,从而对目标特征进行分类判断。
通过实验可以发现,使用hog 特征结合分类器的方法对人脸进行识别可以获得较高的检测率,具有良好的应用价值。
关键词:人脸识别;hog 特征描述子;Adaboost 学习算法;图像视觉;机器学习中图分类号:TP391.41文献标志码:A文章编号:1003-7241(2020)01-0117-04Design and Implementation of Face Recognition SystemBased on hog Image FeatureFU Zhi -jun(Department of Applied Design,Chongqing University of Finance and Economics,Chongqing 402160China )Abstract:Face recognition is a typical application of computer vision technology.This paper presents a face recognition systembased on hog feature operator to describe the target.The system extracts the hog feature of the detected image and trains the recognition classifier using the Adaboost learning algorithm to classify and judge the target features.Through experi-ments,it can be found that the method of combining hog features with classifier can get a higher detection rate and has a good application value.Key words:face recognition;hog feature descriptor;Adaboost learning algorithm;image vision;machine learning收稿日期:2019-05-051引言随着计算机应用技术的发展,越来越多的图像视觉与人工智能技术相结合,被广泛应用到多个领域,如车辆检测[1],车牌识别[2],行人检测[3],人脸识别[4]等,为人们的生产生活提供了很大方便。
HOG特征以及提取算法的实现过程
HOG特征以及提取算法的实现过程1、HOG特征:方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。
它通过计算和统计图像局部区域的梯度方向直方图来构成特征。
Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。
需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的,而如今虽然有很多行人检测算法不断提出,但基本都是以HOG+SVM的思路为主。
(1)主要思想:在一副图像中,局部目标的表象和形状(appearance and shape)能够被梯度或边缘的方向密度分布很好地描述。
(本质:梯度的统计信息,而梯度主要存在于边缘的地方)。
(2)具体的实现方法是:首先将图像分成小的连通区域,我们把它叫细胞单元。
然后采集细胞单元中各像素点的梯度的或边缘的方向直方图。
最后把这些直方图组合起来就可以构成特征描述器。
(3)提高性能:把这些局部直方图在图像的更大的范围内(我们把它叫区间或block)进行对比度归一化(contrast-normalized),所采用的方法是:先计算各直方图在这个区间(block)中的密度,然后根据这个密度对区间中的各个细胞单元做归一化。
通过这个归一化后,能对光照变化和阴影获得更好的效果。
(4)优点:与其他的特征描述方法相比,HOG有很多优点。
首先,由于HOG是在图像的局部方格单元上操作,所以它对图像几何的和光学的形变都能保持很好的不变性,这两种形变只会出现在更大的空间领域上。
其次,在粗的空域抽样、精细的方向抽样以及较强的局部光学归一化等条件下,只要行人大体上能够保持直立的姿势,可以容许行人有一些细微的肢体动作,这些细微的动作可以被忽略而不影响检测效果。
因此HOG特征是特别适合于做图像。
一种基于HOG和SVM的人眼开闭状态实时检测方法
一种基于HOG和SVM的人眼开闭状态实时检测方法作者:宋建华袁磊李嘉辰李祜来侯珂党莉彬来源:《牡丹江师范学院学报(自然科学版)》2022年第02期摘要:設计一种基于人眼开闭状态的非接触式疲劳驾驶实时检测方法.利用支持向量机(SVM)方法构造人脸识别分类器,设计一种基于面部坐标点定位的方法,快速定位人眼区域,实现对驾驶员人眼闭合活动的实时检测;利用PERCLOS疲劳判定标准判断驾驶员是否存在疲劳驾驶行为.实验结果表明,该系统可对疲劳驾驶进行有效检测,并及时做出警告提醒.关键词:机器视觉; 疲劳驾驶检测; HOG特征; 支持向量机; 面部坐标[中图分类号]TP391.4 [文献标志码]A随着我国交通运输业和汽车产业的快速发展,驾驶安全成为了一个不可忽视的问题.具不完全统计,大约有20%的交通事故源于司机疲劳驾驶意识不清醒导致的车祸发生.因此,有效避免疲劳驾驶已成为交通安全领域重要研究课题之一,目的是对驾驶员进行实时监测并提前预警,规避危险驾驶行为,保证交通安全.疲劳驾驶检测方案主要可以分为接触式和非接触式两大类.接触式方案主要通过佩戴传感器来检测驾驶员的心电、脑电波等体征信息从而做出判断[1],其弊端是会使驾驶员感到不适和不方便,给驾驶带来额外的隐患.非接触式通过摄像头捕获驾驶员影像并对影像进行实时处理分析,可有效避免接触式检测装置带来的问题.[2]近年来,随着机器学习、计算机视觉技术的快速发展[3],利用视频图像分析手段构建疲劳驾驶检测系统成为研究热点.本文基于机器视觉技术,设计开发了一种非接触式的实时疲劳驾驶检测方法.首先在获取方向梯度直方图(Histogram of Oriented Gradient,HOG)特征并采用支持向量机(Support vector machine,SVM)分类器算法的基础上,对摄像头采集的影像视频流进行人脸特征识别和人眼区域定位,设计衡量眼睛闭合程度的计算方法,利用卡内基梅隆研究所提出的PERCLOS(Percentage of eyelid closure over the pupil,over time)[4]疲劳判定标准判断驾驶员是否存在疲劳驾驶行为.1 技术基础1.1 人脸与人眼的检测与识别人脸的检测和识别是指利用技术手段将人的脸部从给定的复杂图像背景中分离出来,并判定其位置、大小、姿态的过程.人眼识别定位是建立在人脸检测基础上的,本文基于统计理论的人脸检测方法[5],通过统计分析和机器学习来寻找人脸样本与非人脸样本各自的统计特征,再用各自的特征构建分类器,从而实现人脸检测.然后缩小查找区域,基于人脸的面部坐标定位,利用人脸五官特征点坐标从而快速定位到眼睛的区域位置.1.2 HOG特征提取HOG特征是一种在计算机视觉和图像处理中用来进行目标特征检测的描述子.[6]HOG的核心思想是在一幅图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述.它通过计算和统计图像局部区域的梯度方向直方图构成特征.[7]由于HOG是在图像的局部胞元上操作,所以它对图像几何和光学的形变都能保持良好的不变性.设图像中像素点(x,y)灰度值为H(x,y),该像素点的水平方向和垂直方向梯度计算方法为:2 系统软硬件设计与实现2.1 系统模块构成按照系统需求分析,本系统应分为三大模块:视频采集捕获模块、图像处理模块和疲劳检测判断报警模块.各模块功能见表1.2.2 系统硬件构成系统采用Intel酷睿I3处理器和罗技Pro9000摄像头.摄像头负责采集视频;处理器负责对算法进行编译执行,同时为软件提供环境支持.系统总硬件详细构成见表2.2.3 系统软件设计系统发起开启摄像头的线程请求,若摄像头正常开启,便采集视频流.2.3.1 图像预处理图像灰度化由于RGB彩色图像信息量多有冗余,容易受光照影响,需对图像进行灰度化预处理.灰度化图像虽然彩色信息丢失,但HOG特征提取的核心是依赖于梯度计算,对于彩色的依赖性不强,且灰度化之后矩阵维数下降,运算速度大幅度提高,同时可减小一定的噪声点和光照因素干扰.图像亮度校正实际驾驶过程中,由于白天光照强而夜间光照弱,所获取的图像容易受到光照因素的影响.此时,可以通过对图像Gamma值的调整对对比度偏低或亮度过高的图像进行校正.图像的Gamma值大于1时,对图像的灰度分布直方图具有拉伸作用(使灰度向高灰度值延展),Gamma值小于1时,对图像的灰度分布直方图具有收缩作用(使灰度向低灰度值聚拢).[9]因此,结合图像亮度信息来动态调整Gamma值,可有效减小光照因素的影响.2.3.2 构建人脸检测器结合图像HOG特征和SVM,可以构建一个强大的人脸检测分类器.(1)训练过程第一步,挑选1 000张960×720像素的同一人照片作为正样本,规格化并把人脸特征从背景中抠取出来,得到200×250像素大小的样本,计算其HOG特征,提取得到人脸HOG特征描述子.第二步,挑选10 000张与正样本内容无关并且不含检测目标的负样本,确保负样本每张像素大小也为200×250像素,得到负样本的HOG特征描述子.第三步,利用SVM训练正负样本并分类,若SVM分类器出现误检,则将其作为负样本重新加入,再次训练分类器模型.第四步,检验分类器能否正确归类,对每一个测试图像定位提取HOG特征.使用当前的HOG特征评估训练的SVM分类概率,如果超过设置的阈值,则区域中包含目标,否则不包含.(2)面部标记检测基于Dlib库中附带的预先训练完成的检测器,对人脸68个特征点坐标进行标记.成功标记出测试图片人脸的下巴、嘴巴、鼻子、左右眼睛和左右眉毛,如图1所示.2.3.3 人眼定位及闭合程度检测根据图1的特征标记点可以得到两只眼睛的坐标,每只眼睛由p1-p6这6个(x, y)坐标组成,由此直接追踪左右眼的兴趣区域ROI(Region of Interest)点坐标,从而获得对人眼区域的定位.如图2所示.3 系统测试与实验结果启动系统,使摄像头正对被测试者的面部,分别在上午9点时段和傍晚18点时段进行测试.眼睛为张开状态,检测EAR大于0.25,为正常驾驶状态;眼睛为闭合状态,检测EAR小于0.25,由于特定时间内闭合时间过长,超过PERCLOS所设定的阈值T,触发了疲劳驾驶屏幕文字报警提示和蜂鸣提示,实际测试效果如图4所示.为了验证系统检验的准确性,分别在白天和夜间环境下,各做了5组测试,每组测试时长为60秒,采集捕获的视频为每秒25帧图像,一组1 500帧图像,每张图像大小为450×320像素.测试结果如表3所示.从表3可以看出,白天测试时平均相对误差为0.998%,夜间测试的平均相对误差为1.456%,两者相差不大,说明光照因素对系统影响很小,从而体现了系统较好的鲁棒性和准确性.进行不同场景下(清醒驾驶状态和疲劳驾驶状态下)的测试,观察系统能否正确反馈信息.共记录了三组测试数据,记录每组前60秒内得到的PERCLOS值和测试的实际状态作为参照,测试结果见表4.从测试结果可看出,系统对清醒状态和疲劳状态辨别准确,PERCLOS结果和实际状态也完全匹配,95%以上的正确率体现了系统较好的稳定性和准确性.4 结语本文通过提取HOG特征,构建SVM分类器,训练一定数据量的人脸样本检测人脸.借助Dlib人脸特征点检测器进一步获得68个人脸特征点坐标,由面部五官不变的坐标点兴趣区域,得到了一种快速眼睛定位的方法.在眼睛定位的基础上,提出计算人眼閉合程度的EAR方法,设置恰当的EAR阈值,结合PERCLOS的P80标准,判断人眼的闭合状态.实验结果表明,该方法实现了对驾驶员是否疲劳驾驶的检测,有较高的准确率.参考文献[1]Y.Tsai,i,P.Huang,et al.Vision-Based Instant Measurement System for Driver Fatigue Monitoring[J].IEEE Access,2020,8:67342-67353.[2]曹景胜,李刚,石晶,等.非接触式汽车驾驶员心电监测系统设计[J].科学技术与工程,2019,19(03):112-117.[3]王力超,罗建,刘丙友,等.基于机器视觉的智能小车导航系统研究[J].牡丹江师范学院学报;自然科学版,2019(01):29-33.[4]S.Gopi,E.Punarselvam,K.Dhivya,et al.Driver Drowsiness Detection Based on Face Feature and Perclos[J].International Journal of Scientific Research in Science and Technology,2021:108-112.[5]杨旭林,高凯,卢万平,等.一种用于监测城轨车辆司机盹睡系统的设计与实现[J].铁道机车车辆,2021,41(03):132-136.[6]许佳奕,薛鑫营,李建军,等.结合多尺度HOG特征和语义属性的合成素描人脸识别[J].计算机辅助设计与图形学学报,2020,32(2): 297-304.[7]姚立平,潘中良.基于改进的HOG和LBP算法的人脸识别方法研究[J].光电子技术,2020,40(02):114-118+124.[8]王立国,赵亮,刘丹凤.SVM在高光谱图像处理中的应用综述[J].哈尔滨工程大学学报,2018,39(6):973-983.[9]关雪梅.几种图像平滑处理方法比较研究[J].牡丹江师范学院学报:自然科学版,2016(04):31-33.编辑:琳莉。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
m a g的计算公 式 为 :
ma g = d x + 妒
像素 点 的梯度值 及梯 度方 向计算公 式为 :
( 2 )
÷ mi n / 、 /I I I I 2 + B , )
( 5 )
M , 们 : x / - d  ̄7 / 一
哪t n (
1 . 3 构 建梯 度方 向直方 图
)
将 每张 图像分 割成 2 x 2个子 图像 , 算上原 图像本 身。 共 5张子 图像 : 然 后 将 每张 子 图像 划分 成 2 x 2个 小 区块 , 共形 成 2 0个 图像 区块 。 每个 图像 区块 还可 以 再 进 一步 划分 成 2 x 2 个 细 胞单元 ,也就是 计算 H O G 特征 的最低 层次 。 图像 的分 割方式 如 图 4所示 , 其 中 A, B, C, D 即为同属一 个 图像 区块 的 4个 细胞 单元 。
3 6
农 业科 技 与 装 备
2 0 1 3年 1月
1 . 2 梯 度计 算 图像处 理 中的梯度计 算通 常采用 卷积 的方 法 , 有 很 多种 模板 , 如3 x 3 S o b e l 模板 、 对 角线模 板等 。在试 验 中发 现 , 越 是简单 的模 板 , 效 果往往 越好 。
定 细胞 单 元 中靠 近 图像 区块 中心 的像 素对 直 方 图 的
贡献更 大 。选 择二维 高斯 分布作 为梯度 的权 重分 布 :
. .
[ 1 , 0, 一 1 】 梯度算 子 对原 图像 做卷 积运算 , 得 到 Y方 向
( 垂直 方 向 , 以向上为正 方 向) 的梯度 向量 。
d i 2 + d j L
G ( d i , d j ) : e 2 o - 2
( 4 )
f d x = l f x + l
【
一 l
…
一
式中 : o r 默认 为 4 ; d i , 分 别 表示 以 图像 区块 中
, y + 1 ) - lx f , y 一 1 )
ቤተ መጻሕፍቲ ባይዱ
空间 0 — 1 8 0 。 , 平 均地 分成 9份 ; 而对 于有 符号 的梯 度
值 分布 空间 0 ~ 3 6 0 。 . 平均地 分成 1 8份 。这 样 , 每个 图 像 区块 都 可 以用 4 x ( 9 + 1 8 ) = 1 0 8维 特征 向量 表 示 . 于 是 每张 图像可 由 5 x 1 0 8 = 5 4 0维特 征 向量 表示 。 1 . 3 . 1 高斯权重 在 每个 细胞 单元 中 。 所 有像 素对 梯 度 主方 向或者直 方 图的贡献并 不是 等值 的。 高斯权 重规
,
1 . 3 . 2 直方图统计
计 算 每个 细胞 单元 的 特征 向量 时 。
同一 个 图像 区域 内的另 外 3个 细胞 单 元 中 的像 素也
要对 这个 细胞单 元 的特 征 向量 进行 投影 . 投影 的权 重
d y , 比较各 通 道 的 ma g值 , 选 择 最大 值 时 的 ,
图4 图像 的 分 割方 式
Fi g u r e 4 I ma g e s e g me n t a t i o n mo d e
像, 需要 分别处 理 。对于 R G B图像 , 直接 利用 前 面叙
述 的方 法提 取 5 4 0维 H O G特征 向量 。而 对于深 度 图
使用 三线性 插值 的方法 。
1 . 4 标准化 和归 一化
作 为梯 度分 量 , 最 后计 算 当前 像 素点 的梯度 值 ( 梯 度
强度) 以及 梯度 方 向。
对 图像 区块 内特 征 向量 的归 一化 主 要是 为 了使 特征 向量 空间对 光照 、阴影 和边缘 变化具 有鲁 棒性 。 这 里用 到的标准 化 函数 是 :
本 方 案 中使 用 最 简 单 的 一 维 离 散 微 分模 板 , 在
水 平 和 垂直 两 个方 向上对 图像做 卷 积处 理 。首 先用 【 . - 1 , 0 , 1 ] 梯度 算 子对 原 图像做 卷 积运 算 , 得 到 方 向
( 水平方 向, 以 向右 为正方 向) 的梯度 分量 , 然后用
式中: 为标 准化 前 的特 征 向量 ; I l v l l 为 向量 的二 ‘ 3 ) 阶范式 : 为 一个很 小 的标 准化产 量 .以防止 除数 为 O , 可用 来 限 制 向量最 大 值 , 在 这里 取 = 0 . 0 0 1 : 仅为
用 来 限幅 的量 . 这里 取 o L = O . 2 。
心为原 点 的坐标体 系 中 , 各个像 素点 的坐标 。 当前像 素点 的梯度 值与高斯 权重 的乘 积 . 即为该
点在直 方 图上的统 计值 。
式中: 厂 ( , y ) 表 示某 一像素 的灰度 值 。
图像可 能是单 通道 的灰 度 图像 , 也可 能是 三通 道 的彩 色 图像 。对 于灰度 图像 , 可 以直接使 用上 面 的方 法求 出 , ; 而彩色 图像 , 需要 取各通 道 的最大值 。 彩 色 图像 梯度 的算 法是 :分 别 计算 出各 通道 的
统如 图 5所 示 。
网
图5 H OG 识 别 系统 框 架 图
F i g u r e 5 HoG r e c o g n i t i o n s y s t e m f r a me d i a g r a m
子 图像
K i n e c t 相机 能够同时采集 R G B 图像 和 深 度 图
2 基于 R GB和 深 度 图像 的 H OG 识 别 系统
将 HO G算 法应 用于 K i n e c t 的 R G B 和 深 度 图
像. 以此 描述 目标物 体 的特征信 息 , 通过 l i b S VM分 类 器训练 模板 , 并进行 物体 的分类 和识别 。 HO G识 别系