视频图像中的视觉疲劳实时检测方法研究_兰婷_普杰信
司机疲劳驾驶检测系统设计

司机疲劳驾驶检测系统设计摘要:随着社会经济的发展,商用长途运输车越来越多,司机为了追求经济效益,经常罔顾交通法的规定疲劳驾驶,而一些私家车也因为各种各样的原因经常铤而走险疲劳驾驶,酿成很多人间惨剧。
为了减少减轻司机的精神压力并对疲劳及时提示预警,本论文以计算机视觉技术为主体,设计实用操作简单的疲劳驾驶检测系统,辅助驾驶员安全驾驶。
司机疲劳驾驶实时检测系统在实际应用中有很重要的意义。
设计了一个利用图像分析的方法,通过测量PERCLOS指标值来进行疲劳判断的该类系统。
系统首先对图像进行预处理,然后采用基于YCbCr颜色空间肤色模型进行人脸粗定位,根据人脸特征,逐次进行人眼区域缩小;最后通过对边缘信息进行先验知识结合积分投影的方法进行人眼定位和闭合度测量。
考虑到视频图像序列帧与帧之间的相关性,采用线性运动预测的方法对人眼进行跟踪,减少了系统的运算量。
实验结果表明系统能实时、准确地反映司机的疲劳状态。
关键词:疲劳驾驶人脸检测肤色检测交通安全疲劳判断目录摘要Abstract1.疲劳驾驶检测系统研究背景与意义2.疲劳驾驶检测系统研究与实现2.1国内外疲劳驾驶检测系统研究现状2.1.1国外疲劳驾驶检测系统的研究成果2.1.2国内疲劳驾驶检测系统的研究现状2.2疲劳驾驶检测系统浅析2.3驾驶员疲劳检测系统的研究2.3.1人脸检测2.3.2人眼定位2.3.3疲劳程度的综合判定3.基于人脸特征的列车司机疲劳驾驶检测与识别系统研究3.1研究内容及目标3.1.1基于人脸特征的疲劳驾驶检测与识别算法开发3.1.2疲劳驾驶检测与识别算法OSP移植3.2基于Adaboost算法的人脸检测3.2.1人脸检测技术概述3.2.2Adaboost人脸检测算法3.3基于Adaboost算法的人脸检测软件实现3.3.1.样本训练过程3.3.2人脸检测程序3.4人眼检测与人眼状态分析算法3.4.1基于Adaboost的人眼检测算法3.4.2人眼级联分类器效果分析3.4.3人眼状态分析算法4.基于贝叶斯网络的驾驶疲劳程度识别模型4.1基于贝叶斯网络模型的驾驶疲劳程度识别4.2驾驶疲劳程度识别模型4.2.1驾驶疲劳贝叶斯网络结构4.2.2贝叶斯网络条件概率表的确定4.2.3驾驶疲劳程度贝叶斯网络识别模型4.3模型有效性验证5.基于FPGA的疲劳驾驶检测系统设计5.1疲劳驾驶检测系统总体设计方案5.1.1系统红外光源原理5.1.2系统总体设计5.2系统硬件设计与实现5.2.1系统硬件总体架构5.2.2图像采集电路设计5.2.3主控板设计5.2.4辅助电路设计5.2.5系统硬件电路的物理测试6.基于NiosII 多核驾驶疲劳检测系统设计6.1系统介绍6.2系统关键模块设计6.2.1图像采集模块设计6.2.2图像处理算法6.2.3图像处理算法硬件加速的实现6.2.4数据存储模块设计7.疲劳驾驶预警系统的研究进展7.1预警系统的组成及工作原理7.2典型的疲劳驾驶预警系统7.3疲劳驾驶预警系统比较7.4发展趋势8.新型多功能驾驶员状态监测系统设计8.1无线脑电信号采集和分析8.1.1情绪预警8.1.2疲劳监测8.1.3突发疾病监测8.2酒精监测9.多源信息融合在驾驶疲劳检测中的应用9.1驾驶疲劳特征9.1.1PERCLOS值的计算9.1.2行驶方向改变与驾驶员反应不一致情况9.1.3方向盘动作状态9.1.4连续驾驶时间9.1.5实际时间参数9.2模糊神经网络疲劳识别9.2.1疲劳度量化9.3智能控制技术在汽车疲劳驾驶监控中的应用研究9.3.1硬件描述结束语参考文献1.研究背景与意义驾驶疲劳川是指驾驶员由于睡眠不足或长时间持续驾驶造成的反应能力下降,这种下降表现在驾驶员困倦、打磕睡、驾驶操作失误或完全丧失驾驶能力。
视频流中目标的长时间跟踪问题研究——基于计算机视觉技术视角

视频流中目标的长时间跟踪问题研究——基于计算机视觉技术视角作者:李希来源:《科学与技术》 2019年第2期李希湖南师范大学信息科学与工程学院湖南长沙 410082摘要:视频流中目标的长时间跟踪问题是计算机视觉领域中极具挑战性的课题。
在视频帧中,目标可由其位置及自身特征等信息进行描述。
目前大多数跟踪算法利用滑动窗口机制,对每个窗口进行简单的特征提取,以实现目标的检测与跟踪。
出于降低算法计算复杂度的考虑,很多跟踪算法均使用弱特征描述目标,因而导致无法解决目标旋转、尺度变换和光照变化等问题。
在最近出现的目标检测与识别算法中,颜色特征已展示出其优异的性能,它们能很好地解决光照变化等问题。
但是在滑动窗口机制下,窗口数量非常大,导致基于颜色特征的计算复杂度过高,直接影响跟踪算法的实时性能。
本论文基于TLD算法的框架体系,提出利用BIN-NST算法对窗口进行筛选,大幅度减少候选窗口数量,在此基础上能够高效地利用颜色特征对目标进行检测与跟踪,解决了在光线骤变的情况下出现的跟踪失败的问题。
关键词:视频流;跟踪;TLD算法1. 引言视频中目标物体的长时间跟踪是计算机视觉领域一个非常具有挑战的问题。
视频跟踪在许多应用中,特别是人机交互,视频监控,以及机器人中都扮演了重要的角色。
但是由于光照变化,局部遮挡,杂乱的背景,形状变化等因素,使跟踪问题更加复杂化。
近期出现的视频跟踪算法,主要分为三类:基于特征、基于外表模型和基于结构信息。
基于特征的跟踪算法中,所使用的特征包括多种不同的图象属性特征,如像素值[1]、颜色信息[2,3,4,5]、纹理描述[6,7]等。
外表模型主要有颜色分布特征[3,4]、子空间描述[1,8]、支持向量机(SVM)[9]、Boosting[6,7,10]、特征稀疏描述[11,12,13]等。
逐渐地越来越多的跟踪算法开始使用目标结构信息[2,14,15,16,17,18]。
融入目标结构信息的跟踪算法对目标变形、遮挡有较强的鲁棒性。
基于OpenCV的疲劳驾驶检测系统的设计与实现

Huazhong University of Science and Technology Wuhan 430074, P. R. China May, 2012
独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他 个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集 体, 均已在文中以明确方式标明。 本人完全意识到本声明的法律结果由本人承担。
II
华 中 科 技 大 学 硕 士 学 位 论 文
目
录
摘 要............................................................................................................... I Abstract ........................................................................................................... II 1 绪论 1.1 研究背景和意义 .................................................................................. (1) 1.2 国内外研究现状 .................................................................................. (2) 1.3 主要研究工作 ...................................................................................... (3) 1.4 组织结构............................................................................................... (4) 2 相关技术背景 2.1 疲劳检测的评价标准 .......................................................................... (5) 2.2 人脸检测技术概述 .............................................................................. (8) 2.3 人眼定位技术概述 .............................................................................. (9) 2.4 OpenCV 简介 ..................................................................................... (10) 2.5 本章小结............................................................................................. (16) 3 疲劳驾驶检测系统需求分析与概要设计 3.1 疲劳驾驶检测系统需求分析 ............................................................ (17) 3.2 疲劳驾驶检测系统概要设计 ............................................................ (18) 3.3 本章小结............................................................................................. (20) 4 疲劳驾驶检测系统详细设计与实现 4.1 视频采集模块 .................................................................................... (22) 4.2 人脸检测............................................................................................. (23) 4.3 图像预处理......................................................................................... (26) 4.4 二值化................................................................................................. (30)
视频图像的质量评价算法研究

Science and Technology &Innovation ┃科技与创新2023年第19期·11·文章编号:2095-6835(2023)19-0011-02视频图像的质量评价算法研究陈欣平,杨翠云,周朝阳,吕剑樱(横店集团得邦照明股份有限公司,浙江金华322118)摘要:研究了传统的PSNR (Peak Signal-to-Noise Ratio ,峰值信噪比)算法、SSIM (Structural Similarity ,结构相似性)算法以及较新的基于机器学习算法BRISQUE (Blind/Referenceless Image Spatial Quality Evaluator ,一种无参考的空间域图像质量评估算法),利用Python 语言和OpenCV 视觉库设计实现3种视频图像的质量评价器。
实验表明,PSNR 视频评价器在运行速度方面是最快的,而在信息准确度上表现一般,BRISQUE 和SSIM 在准确度上表现良好,但是两者在没有加入OpenCV 的算法优化时,运行速度比较慢,尤其是SSIM 运行速度是3种算法中最慢的。
总体来说,BRISQUE 算法在性能与效果上取得了较好的平衡,而PSNR 则更注重运行速度。
关键词:视频质量评价;PSNR ;SSIM ;BRISQUE 中图分类号:TP391.41文献标志码:ADOI :10.15913/ki.kjycx.2023.19.003在过去的几十年里,质量评估被广泛地应用在视频直播、视频监控等领域,人们对一个可靠、高效、准确的质量评估算法的需求逐渐增加,于是质量评估逐渐成为一个重点研究方向[1-3]。
面对目前繁多的质量评估算法,人们需要选择一些客观准确、运行快速的视频质量评估算法。
为了探求现有的多种质量评价算法中哪种算法在视频质量评价领域中会有不错的效果,本文选取了3种算法进行实践探索。
1算法原理1.1PSNR 原理PSNR 因其简单易用速度快的特点,被广泛应用于的H.264/AVC 和H.265/HEVC 这类视频编码标准当中。
基于视觉感知的网络视频质量评价方法研究

然后介绍了主客观质量评价方法的优缺点及适 评价方法未考虑到人眼视觉特性。文章首先描述了人类视觉系统的基本特性, 用环境, 最后采用 LIVE 视频数据库, 对比几种质量评价方法, 结果表明, 融入视觉感知的评价方法更接近于人眼效果。 关键词: 视觉感知; 网络视频; 全参考质量评价; 均方误差; 峰值信噪比 中图分类号: TP919 文献标识码: A DOI: 10. 19358 / j. issn. 1674-7720. 2017. 11. 011 J] . 微型机与应用, 2017 , 36 ( 11 ) : 3739 , 43. 引用格式: 周传兴, 涂巧玲, 张杰, 等. 基于视觉感知的网络视频质量评价方法研究[
Research on network video quality evaluation method based on visual perception
Zhou Chuanxing,Tu Qiaoling,Zhang Jie,Zhang Han
( School of Electrical and Electronic Engineering,Chongqing University of Technology,Chongqing 400054 ,China) Abstract: Network video in the process of transmission,because of the coding distortion or distortion of packet loss,bring obvious visual impact to the user. The mean square error and peak signal to noise ratio of the traditional quality evaluation methods do not consider the human visual characteristics. This article describes the basic characteristics of human visual system,then introduces the advantages and disadvantages of subjective and objective quality evaluation methods and the suitable environment,using the LIVE video database,based on comparing several evaluation methods,the results show that the evaluation method of integrating visual perception is closer to the human eye effect. Key words: visual perception; network video; full reference quality assessment; mean square error; peak signal noise ratio
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Computer Engineering and Applications 计算机工程与应用 _______________________________________ 基金项目:河南省科技攻关计划(092102210293);河南省基础与前沿计划(102300410113)。 作者简介:兰婷(1983-),女,硕士,主研方向:人工智能与模式识别;普杰信,教授、博士生导师
视频图像中的视觉疲劳实时检测方法研究 兰婷,普杰信 LAN Ting,PU Jie-xin 河南科技大学 电子信息工程学院,洛阳 471003 College of electronic and Information Engineering,Henan University of Science and Technology,Luoyang 471003,China
LAN Ting,PU Jie-xin.Visual fatigue in video image in real time detection method Abstract:Put forward a new visual fatigue analysis algorithm which is applicable to detect face location and eyes state in driving at real time. Firstly, the differential method is quickly used to find the target area of video. Face is positioned by skin color segmentation combining YCbCrcolor space. Then the eyelid is detected using the gray
integral projection and Hough transform in the area of face. The detected data of eyelid is analysed, and the condition of eyes is got. Value of EOD is to judge whether the driver is fatigue combined with blink analysis. The experimental result shows that the method can locate face quickly in complex background. The value of EOD is detected when the eyes open, and real-time test of visual fatigue is improved. Key words:driving fatigue; Video; Skin color segmentation; Hough transform; Blink cycle
摘 要:提出一种新的适用于驾驶中视觉疲劳实时检测的人脸定位及眼睛状态分析算法。首先采用差分法快速找到视频图像中的目标运动区域,结合YCbCr色彩空间进行肤色分割定位人脸。然后对脸部区域进行灰度积分投影并结合Hough变换检测眼睑。对检测到的眼睑进行数据分析,得到眼睛开闭情况,结合眨眼分析,获得EOD值来判断驾驶员是否疲劳。实验结果显示本方法能在复杂背景下快速定位人脸,检测到眼睛睁开时的EOD值,满足视觉疲劳检测的实时需要。 关键词:疲劳驾驶;视频;肤色分割;Hough变换;眨眼周期
1 引言 近年来,随着机动车保有量的猛增,恶性交通事故呈逐年上升趋势,采用一种非接触的、实时的疲劳检测方法及时发现并有效遏制由疲劳驾驶引发的交通事故刻不容缓。在驾驶过程中,驾驶员是否疲劳可以通过眼睛的状态反映出来,因此利用驾驶员的视觉信息来判断驾驶员的疲劳状况是一种行之有效的方法[1-2]。
视觉疲劳的检测首先要定位眼睛。目前,最具代表性的人眼状态检测方法包括模板匹配、Hough变换圆检测、瞳孔检测等。这些方法各有优势,但也存在一些不足。模板匹配法需要预存多个模板,存储信息量大,不易推广;Hough变换圆检测方法定位准确但计算量较大;瞳孔检测则只能确定睁眼的情况[3]。针对以上问题,本文根据驾驶员疲劳检
测系统实时性要求高的特点,提出一种结合肤色信息的快速识别眼睛张开和闭合状态的方法,主要分为四步:人脸的检测、眼睛的定位、眼睛状态的识
别和疲劳状态的分析。 2 视频图像中的人脸检测 人脸检测问题最初来源于人脸识别(face recognition),是自动人脸识别系统中的一个关键环节[4]。人脸检测的定义是采用一定的策略对给定图片或视频进行搜索,从而判断其中是否存在人脸,如果存在则定位出每个人脸的位置、大小以及姿态。 常用的人脸检测方法有:不变特征法、变形模板法和特征脸法。分别针对不同的检测对象,但普遍存在算法复杂、收敛速度慢、计算时间偏长的缺陷。本文采取先定位目标运动区域,忽略视频图像中固定背景,再用肤色模型快速定位人脸,大大节省了运算时间,提高了疲劳监控中人脸检测与定位的准确率,为驾驶员疲劳检测系统的实时性提供可靠保障。 为了提高基于图像的疲劳检测系统的准确性
网络出版时间:2012-06-15 17:27网络出版地址:http://www.cnki.net/kcms/detail/11.2127.TP.20120615.1727.045.html和实时性,要在视频流提取出的图像中检测和定位人脸,为进一步获取面部特征提供图像数据。与静止图像中人脸检测不同的是,本文处理的是视频序列。前后各帧之间有非常大的相关性,除了静止图像中可利用的特征外,还有运动方向估计、前帧参考等更加丰富的信息。综合利用这些信息,简化算法的复杂度,提高性能。 帧间差分法[5-7]是指用连续的图像序列中两个相邻帧直接相减进行目标检测的方法,来提取图像中较小的时间间隔内的图像变化部分,即运动区域。 运动信息是视频或图像序列中一个不可忽略的信息。针对本文摄像机与背景的位置相对固定,图像中只有一个人在运动这一特殊的应用背景,可以用差分图像的方法检测出图像中的目标运动区域。该区域中即包含有人脸,再在此区域中,运用肤色模型定位出图像中的人脸。使用差分法后,图像中静止的背景被排除在主要研究区域的范围之外,背景中的一些类肤色区域将不会干扰人脸检测,从而降低了运算量,以保证检测的速度。 160.2570.5040.0981280.1480.2910.4391280.4390.3680.071YRCbGCrB⎡⎤⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=+−−×⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥−−⎣⎦⎣⎦⎣⎦⎣⎦ (1)(,)mCrCb= (2) 11NiCrCrN==∑ (3) 11NiCbCbN==∑ (4) ,,,,CrCrCrCbCbCrCbCbVσσσσ⎡⎤=⎢⎥⎣⎦ (5)其中,Cr、Cb 为Cr、Cb 相应的平均值,V为协方差矩阵。通过建立的肤色模型,将一幅彩色图像转变为灰度图像,灰度值对应于该点属于皮肤区域的可能性,然后通过选取合适的阈值,可以将灰度图像进一步转变为二值图像,其中0表示非皮肤区域,1为皮肤区域。 3 虹膜检测及可变模板定位眼睛 为了减小搜索计算量,采用分级检索的方法,先粗定区域,对不能通过粗定的区域不再继续检测工作,然后精确定位,可将运算量减小4至6倍[8],并且检测效果更好。 3.1人眼粗定位 由于虹膜区域的灰度值和眼部其他区域的灰度值相差较大,因此,可以对人脸图像的灰度积分投影曲线进行分析,以找出虹膜区域的轮廓,即对人眼图像分别进行水平灰度积分投影和垂直积分投影,根据波峰波谷的分部信息确定出虹膜区域的轮廓线,再在所确定的虹膜区域使用Hough变换来检测眼睛。 3.2人眼精确定位算法 在上述过程中,已经找到了真实的人脸区域,并找到了双眼所在的大致位置。以下将使用一种Hough 变换椭圆检测算法精确动态生成整个眼部曲线形状。 Hough变换在检测圆曲线方面能力很强,但用Hough变换检测曲线时,它的计算量会随着曲线参数个数的增加呈指数增长, 因此在实际应用中,要尽量减少曲线参数的个数。 对于任意一个椭圆,给定中心点为P0(x0,y0),
长半轴长a,短半轴长b,长轴所在直线与x轴的夹角为α,这个椭圆将被唯一确定(x0,y0,a,b,α)。
()000
Y,
XP
)(111Y,XP
)(222Y,XP
图1 一般椭圆的参数关系 如果能确定该椭圆的两个长轴端点P1(x1,y1)和
P2(x2,y2),上述五个参数中的四个x0,y0,a,α即可确
定:
120
120
2
2
xxxyyy+⎧=⎪⎪
⎨+⎪=
⎪⎩
(6)
222121()()
2xxyya−+−
= (7)
2121arctan()
yy
xxα−
=− (8)
这样,需要通过Hough变换累积确定的参数仅剩下b一个。 因长度和角度属于平移和旋转变换的不变量,可将图1的一般椭圆通过平移和旋转变换到图2所示的标准形式,再利用椭圆标准方程来分析长度和角度之间的关系。考虑到人眼睑的生理形状,直接