眼动跟踪研究
眼动追踪技术在认知心理研究中的应用

眼动追踪技术在认知心理研究中的应用【引言】眼动追踪技术是一种在认知心理学中应用广泛的研究工具,它可以帮助研究人员了解人类认知如何处理视觉信息、探测认知过程中的思考和注意力集中以及对情境的理解。
本文将对眼动追踪技术在认知心理学中的应用进行系统的梳理和分析。
【眼动追踪技术的基本原理】眼动追踪技术是通过监测和记录被试眼睛在视觉作业中的运动路径和停留位置来研究视觉注意、视觉搜索、决策制定和记忆等认知过程的过程。
在实验室的眼动实验中,被试的眼睛与一台高速记录仪相连,该设备可用于追踪和记录眼球运动和视线(即视线移动的位置)。
该设备记录眼球或视线位置、速度和加速度的变化。
这些数据可帮助研究人员事后收集、分析和孤立眼动行为的事件和时间间隔。
【眼动追踪技术在认知心理学中的应用】1.注意力探测眼动追踪技术可用于研究注意力问题,比如关注轨迹和固定视线时间,可以更好地理解被试对视觉作业中存储和索引信息的处理。
通过眼动跟踪技术研究注意力问题,可能研究出什么影响注意力、注意如何向竞争性信息分配、培养注意力等问题。
2.视觉搜索眼动追踪技术广泛用于视觉搜索任务中,即被试需要在一系列图像中查找特定物体的位置。
通过记录被试者的眼球运动,在任务完成后,可以对其眼睛的具体运动模式进行分析,推断其调整视觉搜索策略的时间和位置。
3.阅读理解眼动追踪技术可用于研究阅读理解能力的心理过程。
通过记录被试的左右眼联动,可以更好地了解其在阅读时对信息的处理是否连贯,例如,是否跳过某些信息或者重读某部分信息。
4. 决策制定眼动追踪技术可用于研究决策制定过程。
记录被试眼睛的运动路径,可以帮助研究人员研究决策制定的各个阶段,以及被试在决策制定过程中哪些方面受到了影响和调整。
5. 记忆研究眼动追踪技术可用于研究记忆的心理过程。
通过记下被试视线停留的位置和店内时间,可以更好地研究被试在记忆任务中因视觉或其他感官干扰而失忆的情况。
6. 眼动追踪技术的应用范围和不足眼动追踪技术被广泛应用于心理学及其他领域的研究。
眼动追踪技术的研究进展和应用

眼动追踪技术的研究进展和应用一、引言眼动追踪技术是一种通过对人眼视线变化的分析,来推断受试者的注意点和视觉任务的技术。
它是人工智能和人机交互的基础技术之一,不仅在传统的人机交互和心理学领域有广泛应用,而且在虚拟现实、医学、广告和安全等领域也大有用武之地。
本文将对眼动追踪技术的研究进展和应用进行探讨。
二、眼动特征参数提取眼动追踪技术需要通过提取受试者的眼动特征来推断受试者的注意点和视觉任务。
主要表现为眼球位置、眼球运动轨迹、瞳孔大小和瞳孔变化速度等方面。
其中,眼球位置和眼球运动轨迹是最基本的特征,它们可以通过眼动仪来进行测量和记录,而瞳孔大小和瞳孔变化速度则需要用到高速摄像系统和光源等设备来进行测量和记录。
三、眼动追踪技术的应用1.人机交互领域眼动追踪技术在人机交互领域中得到了广泛应用,尤其是在用户界面的设计和优化、广告优化、虚拟现实和游戏开发等方面。
比如,通过对受试者的眼动数据进行分析,可以得到受试者在使用特定应用程序或网页时的主要“热点”,并据此对用户界面进行改进和优化,以提高用户的易用性和满意度。
2.心理学领域眼动追踪技术作为对受试者视觉任务行为的研究手段,应用在心理学领域的研究中,例如对注意力、记忆、情绪等方面的研究,并通过对眼动数据的分析,揭示了人类视觉信息加工的机制和规律。
3.医学领域眼动追踪技术在医学领域的应用也有所发展。
例如,通过对眼动数据的基于模型的分析,可以诊断某些神经病变的早期症状,预测一些心理疾病的发生概率,并为医生提供治疗方案。
4.广告推广领域在广告推广领域,通过对消费者的视觉注意点和时间的分析,可以对广告设计进行优化。
比如,在某一广告宣传中,可以通过对受试者的眼动特征进行分析,了解消费者最关注的特征和宣传点,再根据这些关键点来改进和优化广告宣传方案。
5.安全领域眼动追踪技术在安全领域的应用主要是基于生物识别技术,它可以通过分析受试者眼动的瞬时变化,来确定受试者的身份信息。
神经科学研究中的眼动追踪技术应用及意义

神经科学研究中的眼动追踪技术应用及意义Introduction随着神经科学和认知心理学的发展,眼动追踪技术正在成为一种重要的研究方法。
眼动追踪技术通过追踪被试者的眼球运动,可以探究人类视觉系统的神经机制,从而更深入地了解人类的认知、情绪和决策行为。
本文将介绍眼动追踪技术的原理、应用以及在神经科学研究中的意义。
Principle of Eye-tracking Technology眼球运动追踪技术是通过在被试者眼部贴上特殊的红外光反射标志点,使用摄像头追踪标志点的运动来分析被试者的眼球运动。
在此基础上,可采集被试者在观察屏幕内容时的注视时长和注视位置等相关数据,并通过计算机软件转换为图像以便进行进一步分析研究。
了解了这个技术的原理,我们就可以看到,受试者的视觉行为被追踪,其数据从眼睛中获得,不影响受试者的正常视觉体验,这样,受试者真实的视觉行为可以被记录下来。
而且,这种技术非常适合研究人们的视觉加工,因为这种加工在许多认知任务中都是重要的。
Application of Eye-tracking Technology眼动追踪技术在很多领域有着广泛的应用,其中最常见的是用户体验设计、人机界面设计和市场调研等领域。
同时,眼动追踪技术还被用来研究人类的视觉、注意和许多认知过程,比如阅读、语言理解、学习、记忆、智力测试等方面。
在演讲、表情和社交场合中,人的眼睛总是最先引起人们的注意,也因此,通过研究眼动追踪技术,还可以探究人的情感、社交行为和判断过程等心理学内容。
此外,医学领域也有很大用处,医学专家可以通过眼动追踪技术,可监测病人的眼部运动,及时发现眼部疾病。
Significance of Eye-tracking Technology in the Study of Neuroscience相对于其他类型的方法,不同的神经科学方法获得的信息存在差异,眼动追踪技术可以对人的视觉和认知行为进行非常精细和全面的测量。
基于图像处理的眼动跟踪技术研究与应用

基于图像处理的眼动跟踪技术研究与应用基于图像处理的眼动跟踪技术研究与应用摘要:眼动跟踪技术是一种通过追踪受试者眼睛运动轨迹来分析视觉信息获取和处理过程的方法。
随着计算机技术的发展和应用领域的拓展,眼动跟踪技术已经成为一种重要的研究工具和应用手段。
本文首先介绍了眼动跟踪技术的原理,然后详细分析了基于图像处理的眼动跟踪技术的研究现状和应用领域。
最后,本文总结了眼动跟踪技术的挑战和未来发展方向。
关键词:眼动跟踪技术,图像处理,视觉信息获取,应用领域,挑战,发展方向1. 引言眼动跟踪技术是一种通过追踪受试者眼睛运动轨迹来分析视觉信息获取和处理过程的方法。
它可以提供关于受试者目光焦点位置、注视持续时间、扫视路径等重要信息,从而帮助研究者了解人类视觉系统的运作机制。
随着计算机技术的发展和应用领域的拓展,眼动跟踪技术已经成为一种重要的研究工具和应用手段。
本文将重点介绍基于图像处理的眼动跟踪技术的研究现状和应用领域。
2. 眼动跟踪技术的原理眼动跟踪技术基于人眼的生理特征和视觉系统的工作原理,通过追踪眼睛运动轨迹来获取受试者的视觉信息。
眼动跟踪系统通常由眼动仪、计算机和相关软件组成。
眼动仪是一种装置,通过摄像头或红外线传感器等技术来记录眼睛的运动轨迹。
计算机用于处理和分析眼动数据,并将其可视化展示。
相关软件使得研究者能够进行数据录制、分析和存储等操作。
眼动仪通常采用摄像头或红外线传感器进行眼部图像的采集。
通过图像处理技术,可以对眼部图像进行检测、跟踪和分析。
眼动跟踪技术可以分为两类:直接跟踪和间接跟踪。
直接跟踪方法通过检测眼球或瞳孔的位置来追踪眼睛的运动轨迹。
间接跟踪方法则通过分析眼部图像中的特征点来估计眼睛的运动轨迹。
无论是直接跟踪还是间接跟踪,都需要进行图像处理和分析来提取关键信息。
3. 基于图像处理的眼动跟踪技术的研究现状基于图像处理的眼动跟踪技术已经取得了一系列重要突破,主要体现在以下几个方面:3.1 眼球与瞳孔检测眼动跟踪的第一步是检测眼球或瞳孔的位置。
眼动跟踪技术研究进展

眼动跟踪技术研究进展眼动跟踪技术是指利用电子设备记录和分析眼球在观看过程中的运动轨迹和注视点,以便对观看者的注意力和兴趣进行研究。
眼动跟踪技术广泛应用于人类认知行为研究、广告效果评估、用户体验设计等领域,成为近年来学术界和产业界研究的热点。
本文将介绍眼动跟踪技术的基本原理、研究进展以及未来发展趋势。
一、眼动跟踪技术的基本原理眼动跟踪技术主要依靠眼动仪来实现,眼动仪是一种可以实时记录眼球运动情况的设备。
在眼动跟踪实验中,被试者佩戴眼动仪,当被试者观看屏幕上的图像或视频时,眼动仪会记录并输出眼球的运动轨迹、注视点等数据。
通过这些数据,研究者可以分析被试者的注意力分布、注视持续时间等信息,从而了解被试者的认知行为状态。
眼动跟踪技术的基本原理主要包括两个方面:一是眼球运动的生理机制,二是眼动仪的工作原理。
眼球在观看过程中会出现注视和扫视两种运动状态。
注视是指眼球停留在某个区域时的运动状态,而扫视是指眼球快速在屏幕上移动以获取信息的运动状态。
眼动仪通过记录这些眼球的注视和扫视运动来获得被试者在观看过程中的注意力分布情况。
眼动仪的工作原理主要涉及到眼动信号的记录和分析。
眼动仪通过红外摄像头或其他传感器记录眼球的运动轨迹,并将数据传输至计算机进行处理和分析。
在计算机软件的支持下,研究者可以对眼动数据进行可视化、统计分析等操作,从而获得相关的研究结论。
随着科技的发展,眼动跟踪技术在学术界和产业界得到了广泛的应用,并取得了一系列的研究进展。
以下将介绍眼动跟踪技术在不同领域的研究进展。
1. 人类认知行为研究眼动跟踪技术被广泛应用于人类认知行为研究领域。
通过观察被试者在观看过程中的眼动数据,研究者可以了解被试者在面对不同刺激时的注意力分布情况,推测被试者的认知策略、兴趣偏好等心理状态。
在阅读行为研究中,眼动跟踪技术可以用于分析被试者在阅读过程中的注视持续时间、注视位置等信息,从而了解被试者的阅读策略和理解程度。
2. 广告效果评估眼动跟踪技术在广告效果评估中得到了广泛的应用。
眼动跟踪技术研究进展

眼动跟踪技术研究进展眼动跟踪技术是一种通过追踪眼球运动轨迹来了解人类视觉认知过程的技术。
随着科技的不断发展,眼动跟踪技术在眼动仪、眼动追踪设备、数据分析等方面有了长足的进步。
本文将就眼动跟踪技术的研究进展进行探讨,以期了解其在科学研究和实际应用中的潜在价值和未来发展方向。
一、眼动跟踪技术的原理眼动跟踪技术的原理是利用眼动仪采集被试者眼球运动的数据,通过分析这些数据来了解人的视觉认知过程。
眼动跟踪技术的主要原理包括瞳孔位置检测、视线跟踪、眼球运动模式研究和眼动数据分析等。
瞳孔位置检测是眼动跟踪技术的基础,通过追踪瞳孔的位置来确定被试者的注视点。
视线跟踪是指监测被试者的注视点,可以用来研究人的视觉注意力分布和目光移动的轨迹。
眼球运动模式研究是指分析被试者在不同认知任务中的眼球运动模式,可以了解认知过程中的注意偏向和信息加工策略。
眼动数据分析是根据被试者的眼动数据进行统计分析和模式识别,以揭示认知过程中的规律和特征。
1. 眼动仪的发展眼动仪是眼动跟踪技术的核心设备,其发展对眼动跟踪技术的进步起着关键作用。
随着科技的不断发展,眼动仪在分辨率、采样率、精度和舒适度等方面有了长足的进步,使得眼动数据的采集更加精准和可靠。
目前市面上已经推出了许多高分辨率、高采样率、非接触式和无线传输的眼动仪设备,为眼动跟踪技术的研究提供了便利条件。
2. 眼动追踪设备的应用眼动跟踪技术不仅在实验室中得到了广泛应用,在实际生活中也逐渐发挥了重要作用。
眼动追踪设备已经被广泛应用于广告设计、产品包装、网页布局、驾驶模拟、用户界面设计和医学诊断等领域。
通过眼动追踪设备,可以了解用户的视觉偏好、注意力分布和信息获取速度,从而优化设计和改善用户体验。
3. 眼动数据分析的方法随着眼动数据采集的精度和规模不断提高,眼动数据分析的方法也在不断深化和完善。
目前常用的眼动数据分析方法包括热图分析、注视时长分析、扫视路径分析、眨眼频率分析和眼球运动模式识别等。
眼动追踪技术在视觉感知中的应用研究

眼动追踪技术在视觉感知中的应用研究随着科技的不断发展,人们对于视觉感知的研究也越来越深入。
眼动追踪技术作为视觉感知的一项重要研究方法,近年来得到了广泛应用。
本文旨在对眼动追踪技术在视觉感知中的应用研究进行探讨。
一、眼动追踪技术概述眼动追踪技术是通过记录人眼的运动轨迹来了解人眼对视觉信息的处理过程。
基本原理是通过感知眼动信号中的像差,并据此估计眼球的运动量和方向。
这一技术可以被广泛地应用于人类和动物的行为研究、眼科医学、人机交互等许多领域。
眼动追踪技术的应用领域非常广泛,经过多年的研究和改进,现在已经发展出了多种不同的眼动追踪系统。
最为常见的是外部型眼动仪,通过摄像机记录眼球的位置并据此推测眼动的方向。
还有一种内部型眼动仪,是将仪器安装在眼部以直接记录眼球的运动信息。
这也为生理学和行为学等领域提供了极大的便利。
目前,眼动追踪技术的研究重点主要在于:1.探究人眼对信息的感知和处理方式,挖掘出人类视觉系统的优势。
2.寻找及开发一种合理的人机交互方式,提高人机交互的效率。
3.基于眼动信号的行为研究,为心理学的研究提供精准的数据分析。
二、眼动追踪技术在行为研究中的应用人眼的移动轨迹记录为眼动轨迹,通过分析眼动轨迹来了解人类的行为、认知及决策过程。
对于研究人类行为和认知,眼动追踪技术的应用非常重要。
1.语言学领域语言学领域也常常采用眼动追踪技术研究相关问题。
通过记录眼动轨迹,可以了解听者的注意力和认知过程。
例如,同样的语句可能会被不同的听众放在不同的位置上。
因此,眼动追踪技术可以帮助研究者准确地分析受试者的认知过程,从而为语言学研究提供有力的支持。
2.认知心理学领域在认知心理学领域,眼动追踪技术被广泛地应用于视觉搜索过程、视觉注意力、工作记忆等方面的研究中。
例如,研究者可以用眼动追踪技术来检测受试者在视觉搜索和决策任务中的注意力转向、视角撤回以及其他行为。
同时,这些数据也可以用于查看参与者对于不同信息的反应时间。
眼动追踪技术的应用研究

眼动追踪技术的应用研究第一章眼动追踪技术简介眼动追踪技术(Eye-tracking technology)是一种通过测量人眼运动轨迹来分析视觉注意力和认知过程的技术。
它可以追踪眼球在屏幕上的位置、注视点的位置和注视点的时间,进而揭示被测试者的认知过程。
眼动追踪技术可以分为两种类型:接触式和非接触式。
接触式眼动追踪技术需要被测试者佩戴眼镜或者神经元穿刺器,这样可以测量眼球的运动轨迹。
而非接触式眼动追踪技术则可以通过基于红外线的技术来捕捉眼球的位置和移动。
眼动追踪技术广泛应用于人机交互、眼科学、广告营销等领域,尤其是在人机交互方面的应用,为我们创造了更加人性化的交互环境,提升了产品用户体验。
第二章眼动追踪技术在人机交互领域的应用研究在人机交互领域,眼动追踪技术可以用于研究用户对产品界面的注意力分布、理解界面交互过程等方面。
下面将从交互设计和用户研究两个方面介绍其应用。
1. 交互设计在交互设计中,眼动追踪技术可以帮助设计师优化产品界面。
通过追踪用户对不同设计元素的注视时间和注视位置来确定用户感兴趣的内容,从而改善界面设计,提高用户体验。
例如,设计师可以通过眼动追踪技术收集用户在浏览商品详情页时的注视点分布情况,针对用户的行为模式和认知过程进行界面设计的优化。
另外,眼动追踪技术还可以用于测试产品新功能的可用性、用户界面布局的合理性等。
2. 用户研究在用户研究中,眼动追踪技术可以帮助研究人员更深入地了解用户认知和行为过程,发现用户的需求和问题。
例如,研究人员可以利用眼动追踪技术,通过追踪用户在网页浏览过程中的目光流动轨迹,来研究用户对于不同信息的关注程度和优先级,从而更好地了解用户需求和行为模式。
同时,此技术还可以用于测试用户对于不同信息的理解程度和效率,并且辅助研究人员对于设计的确定。
第三章眼动追踪技术在眼科学领域的应用研究在眼科学领域,眼动追踪技术可以用于研究眼部运动障碍、眼震和眼动失调等疾病。
下面将从这些方面介绍其应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用来研究眼动活动的结合基于特征和基于模型思想的算法Dongheng Li, David Winfield, Derrick J. Parkhurst摘要:由于用户的注视点能极大的改善人机接口,则可以把眼动活动当作用户注意力状态的标志。
将眼动活动整合成现在这种接口的障碍就是没有一种可用的,可靠的,低成本的,开源的眼动跟踪系统。
为了给那些接口设计者提供这样一个系统,我们研发了一种基于特征和模型思想的混合算法并且提供了一个开源的软件包。
我们将这种算法命名为Starburst。
这种算法比单纯基于特征跟踪的算法更准确而且比单纯基于模型跟踪的算法更省时。
当前能够将红外视频剪辑来跟踪眼动活动。
这种视频可以用一个廉价的头盔式眼动仪来获取。
这是一个可靠的研究并且指出该电子技术能够估计眼睛的位置,误差不超过一度。
关键词:眼动跟踪;头盔式眼动仪;算法;基于特征;1 简介眼动活动的使用能极大的改善人机接口的质量。
应用眼动活动的人机接口有两种:在线接口和离线接口。
在线接口允许用户利用眼动活动详细的控制接口[8]。
比如,用户可以通过注视虚拟键盘上的按键来进行打字而不用使用传统的敲击键盘的方法[9]。
这种技术也可以用在常用的接口中,比如用户可以在图形用户接口中注视一个图标来选择它,这样大大提高了速度[16]。
另一方面,离线的接口能监视用户眼动活动并且自动调整。
例如,在视频传输和虚拟现实应用,可变分辨率显示技术能主动跟踪用户的眼睛并且提供一个关于凝视点的详细信息,同时省略了外围设备的细节[13,14]。
尽管眼动跟踪已经应用到一些研究系统和小型的产品中,但是眼动跟踪技术还没充分发挥它的潜力。
尤为重要的是,眼动跟踪技术的许多方法已经应用了很多年。
将这种技术整合成人机接口的首要障碍是这种系统要么容易被入侵,要么就是成本太高。
最近,由于头盔式视频眼动仪逐渐缩小,眼动跟踪的被入侵性显著下降[15,1]。
视频眼动跟踪移动技术也减少了入侵性[6,10],但是降低了系统的准确性。
随着技术的不断发展,剩下的障碍就是成本。
目前,有一些眼动跟踪系统已经投入市场,它们的价格大约5000到40000美元。
值得注意的是,这些开销并不是由于硬件,因为在过去10年中高清数码镜头的价钱已经下降了很多。
然而,开销主要和软件相关,有时候也需要整合特殊的数码处理器来获得高速性能。
这种分析清楚的指明了,为了将眼动活动结合到平常的人机接口中,需要广泛的可用性,可靠性和高速眼动跟踪算法,而这种算法需要在普通电脑硬件的支持下完成。
为了达到这个目的,我们发明了这个结合基于特征和模型思想的算法并且在一个开源包中使分布式系统得以实现。
通过结合低成本的头盔式眼动仪[18],眼动跟踪技术很可能成为下一代人机接口。
2 问题描述如上所述,眼动跟踪系统可以分为远程系统和头盔式系统。
每一种系统都有其特有的优势。
比如远程系统比头盔式系统不容易被入侵,但是却减少了准确性和灵活性。
另一方面,我们开发了一种低成本的头盔式眼动仪[18]。
这个眼动仪由两个CCD摄像头组成,它们绑定在一对安全眼镜上(如图1)。
其中一个摄像头捕捉眼镜的图像,另一个捕捉场景的图像。
两个摄像头是同步的并且以30赫兹的频率捕捉640×480像素。
在本文中,我们的眼动跟踪算法处理的图像就是利用这种头盔式眼动仪所获得的。
然而,这种算法也可以被应用到远程的视频捕捉系统。
眼动跟踪技术中主要使用两种图像处理方法,可见光谱成像和红外光谱成像[5]。
可见光谱成像是一种被动的方式,通过捕捉眼睛的反射光。
在这些图像中,通常情况下跟踪可见光谱图像最好的特征就是虹膜和巩膜之间的轮廓也叫角膜缘。
眼球的三种最相关的特征是瞳孔——让光进入眼球的光圈,虹膜——控制瞳孔直径的有色肌肉群,眼白保护覆盖在眼球其他部分的纤维。
可见光谱成像是很复杂的,因为环境中的光源是无法控制的,它包含许多镜面反射和漫反射成分。
红外光谱成像通过使用一个用户无法感知的红外光控制来主动消除镜面反射。
红外光谱成像的好处就是,瞳孔作为图像中最强的特征轮廓而不是角膜缘(如图1d)。
巩膜和虹膜都能够反射红外光,而只有巩膜能反射可见光。
跟踪瞳孔轮廓更具优势,因为瞳孔轮廓比角膜缘更小更尖锐。
还有,由于它的大小,瞳孔更不容易被眼皮遮住。
红外光谱成像也有缺点,那就是在白天不能用在户外,由于外界环境能清除红外线。
在本文中,我们的算法主要使用红外光谱成像技术同时也拓展到可见光谱成像技术。
红外眼球跟踪通常使用亮瞳或暗瞳技术(如参考文献[10]中结合了亮瞳和暗瞳技术)。
亮瞳技术通过在离摄像头光轴非常近的地方使用一个光源来照射眼球。
由于眼球后部的照片反光特性而形成了一个瞳孔分明的明亮区域。
暗瞳技术通过在远离光轴的地方使用一个光源,这样瞳孔在图像中就是黑暗的区域,同时巩膜、虹膜和眼皮反射比较多的光。
两种方法都是使用对照明光源的表面反射而使角膜(眼球最具光学特性的结构)可见。
使用瞳孔中心到角膜反射点的向量比单独使用瞳孔中心的方法要可靠的多。
这是由于向量对于头盔摄像头和光源的同时移动所造成的误差不敏感(参考下面的实用性研究)。
本文中我们的算法主要以暗瞳技术为核心,同时也可以应用到亮瞳技术中。
图1 (a)和(b)头盔式眼动仪(c)眼动仪获得的图像(d)用户右眼的图像3 相关工作眼动跟踪算法可以分为两种方法:基于特征和基于模型。
基于特征的方法根据眼球的位置探测和定位图像特征。
基于特征的方法有一个共性,那就是需要一个标准(比如一个阈值)来确定特征的存在。
这个阈值应该是一个由用户自行确定的参数。
跟踪特性在整个算法中有很大变化但是主要依靠亮度水平和亮度梯度。
比如,应用暗瞳技术的红外成像,可以设置适当的亮度阈值来提取对应该区域的瞳孔。
将瞳孔中心当做该区域的几何中心。
在可见光谱成像中,亮度梯度可以用来检测角膜缘[21]。
在红外光谱成像中,亮度梯度可以用来检测瞳孔中心[12]。
这些特征点最后可以拟合成一个椭圆。
另一方面,基于模型的方法不能发掘详细的特征但是可以找到连续图像的最佳模型。
例如,可以利用积分微分运算来寻找角膜缘和瞳孔边缘点的最佳拟合圆[3]或者椭圆[11]。
这种方法需要对模型的参数空间进行反复的搜索来寻找最大的圆边界或者椭圆的边界导数。
基于特征的方法定义的特征标准不能应用到图像数据中,所以基于模型的方法能更准确的估计瞳孔中心的位置。
但是这种方法需要搜索一个复杂的参数空间,这里面可能充满了位置的最小值。
因此,没有对模型参数的一个初始估计,梯度技术就不能实现。
由此可见,这种方法的准确性是以综合速度和灵活性为代价的。
然而,在多重标准的图像处理方法[2]中结合基于模型的方法对于实时操作有很好的前景[5]。
4 Starburst算法这部分阐述的是结合基于特征和基于模型思想的眼动跟踪算法,用这种算法来权衡在红外照射下的暗瞳技术的运行时间和准确性。
该算法的目的是提取瞳孔中心和角膜反射点的位置来完成对视场图像的坐标转换。
该算法从定位和去除图像中角膜反射点开始。
然后反复使用基于特征技术来定位瞳孔边缘点。
使用随机样本一致性范式来找到这些点的最佳拟合椭圆[4]。
从基于特征的方法中提取的最佳适应参数来初始化对模型参数的搜索,以便计算椭圆参数。
4.1 去噪根据第二章描述的低成本的头盔式眼动仪,我们需要先对图像进行去噪。
我们通过应用标准偏差2个像素的5×5的高斯滤波器来实现去噪。
利用标准化因子能够将直线一条条转化成前一帧图像的连续均值。
在第i帧中的每一条直线l的这个因子C如下:式中,I(i,l)是直线强度,β=0.2。
注意,去噪技术是选择性的,当算法用来处理噪声小的图像时,可以省略去噪环节。
4.2 角膜反射的发掘,定位和移动角膜反射点也就是眼球图像中最明亮的区域。
通过二值法能够获取角膜反射点。
但是每个观察者的阈值常量都不是最佳的。
所以我们使用自适应的二值法在每一帧中定位角膜反射点。
因为角膜延伸到大约角膜缘的位置,我们就将角膜反射点的搜索限制在宽度为h=150像素的正方形区域内(见讨论部分的参数值)。
最大门限值是用来产生一个二值图像,仅取像素大于这个阈值的点作为角膜反射点。
基本上最大的候选区域就是角膜反射区域,至于其他的反射区域都是很小的或者脱离了角膜范围,也有在图像边缘眼皮位置的。
最大候选区和其它区域的均值之间的比例随着阈值的降低能够被计算出来。
首先,由于角膜反射区域比其它区域增长的快,所以这个比例会增大。
角膜反射区域的强度沿着径向递减。
一个较小的阈值一般会产生错误的候选区域。
当错误候选区域更加显著并且角膜反射区域扩大的时候,比例就会下降。
我们就认为这个时候产生最大比例的阈值为最佳的。
角膜反射区域的位置就用自适应门限法,由最大区域的几何中心(x c,y c)确定。
角膜反射区域在图像中大致成圆形。
角膜反射区域的大致大小可以由定位步骤中应用阈值的区域导出,这个区域不一定能完全包含角膜反射区域的整个轮廓。
我们假设角膜反射的强度分布遵循一个二元高斯分布,这样来确定角膜的全反射。
如果我们发现半径r在亮度衰减最大的地方是最大高斯衰减,那么我们就可以取2.5r的最大角膜反射来捕捉99%的角膜反射剖面。
我们通过梯度来搜索合适的最小值从而确定r。
式中δ=1,I(r,x,y,θ)是由x,y,r确定的圆,圆心角为θ处的像素强度。
r 使用下式来初始化,面积就是二值区域中像素的数目。
该搜索快速收敛。
使用径向的内插法来移动角膜反射区域。
首先,将角膜反射区域的中心像素设定成该区域边缘强度的均值。
从中心到边缘中间的每个像素值都是由线性内插法来确定。
该过程的流程如图5(比较a和b)。
4.3 瞳孔边缘检测我们已经开发了一个新颖的基于特征的方法来检测瞳孔边缘。
伪代码如图2所示。
如果把其它的基于特征的方法应用到边缘检测或者整个眼球图像中,由于瞳孔边缘通常只占图像的一小部分,这些计算方法就显得有些浪费。
与之相反,我们从一个最佳猜测的瞳孔中心射出的有限数量的光线中来检测边缘。
这些光线从图3a中能看出来。
利用暗瞳技术从红外照射成像中提取瞳孔轮廓,该方法充分利用了瞳孔轮廓的高对比度椭圆剖面。
图2 特征点检测方法每一帧都有一个对瞳孔中心的最佳猜测位置。
对于第一帧,通常将图像的中心作为猜测的瞳孔中心。
后面的每一帧都来源于前一帧。
在N=18时,从出发点呈放射状延伸的每一个Δ都是逐个像素独立估计的直到阈值超过φ=20。
由于我们使用的暗瞳技术,只取正值(因为亮度沿着光线方向递增)。
当超过阈值时,就不在沿着光线放下进行处理,特征点就定为该点。
如果光线延伸到图像边缘,那么就不再定义特征点。
图3a中是一系列候选特征点的选取。
对于每个候选特征点,上述的方法是循环进行的。
但是光线的角度限定为初始点的正负50度。
用这种方式限制返回光线的动机就是如果候选特征点正好是瞳孔中心(如图3b所示),返回光线会在瞳孔反方向产生额外的特征点,也在同一个椭圆上(也就是瞳孔轮廓)。