综述:双目立体视觉与BP神经网络
bp神经网络的应用综述

bp神经网络的应用综述近年来,人工神经网络(ANN)作为一种神经网络形式在不断发展,因其计算能力强,对现实世界较好地识别和适应能力,已得到越来越广泛的应用,其中,BP神经网络是最典型的人工神经网络之一。
BP神经网络是指以马尔可夫随机过程为基础的反向传播算法,具有自组织学习、泛化、模糊推理的特点,具有非常广泛的应用场景。
它可以用来解决实际问题。
首先,BP神经网络可以用来解决分类问题。
它可以根据给定的输入向量和输出向量,训练模型以分类相关的输入特征。
这种模型可以用来解决工业控制问题、专家系统任务等。
例如,BP神经网络可以用来识别照片中的面孔,帮助改进自动门的判断等。
此外,BP神经网络还可以用于计算机视觉,即以计算机图像识别的形式进行图像处理。
通常,计算机视觉技术需要两个步骤,即识别和分析。
在识别步骤中,BP神经网络可以被用来识别图片中的特征,例如物体的形状、大小、颜色等;在分析步骤中,BP神经网络可以用来分析和判断图片中的特征是否满足要求。
此外,BP神经网络还可以用于机器人技术。
它可以用来识别机器人环境中的物体,从而帮助机器人做出正确的动作。
例如,利用BP神经网络,机器人可以识别障碍物并做出正确的行动。
最后,BP神经网络还可以用于未来的驾驶辅助系统中。
这种系统可以利用各种传感器和摄像机,搜集周围环境的信息,经过BP神经网络分析,判断当前环境的安全程度,及时采取措施,以达到更好的安全驾驶作用。
综上所述,BP神经网络具有自组织学习、泛化、模糊推理的特点,拥有非常广泛的应用场景,可以用于分类问题、计算机视觉、机器人技术和驾驶辅助系统等。
然而,BP神经网络也存在一些问题,例如训练时间长,需要大量的训练数据,容易受到噪声攻击等。
因此,研究人员正在积极改进BP神经网络,使其能够更好地解决各种问题。
《2024年度基于双目立体视觉定位和识别技术的研究》范文

《基于双目立体视觉定位和识别技术的研究》篇一一、引言随着科技的飞速发展,计算机视觉技术在许多领域中得到了广泛的应用。
其中,双目立体视觉定位和识别技术以其高精度、高效率的特点,在机器人导航、工业检测、无人驾驶等领域展现出巨大的应用潜力。
本文将围绕双目立体视觉定位和识别技术进行深入的研究和探讨。
二、双目立体视觉技术概述双目立体视觉技术是一种模拟人类双眼视觉的计算机视觉技术。
通过模拟人眼的视差感知原理,双目立体视觉技术利用两个相机从不同角度获取场景的图像信息,然后通过图像处理和算法分析,得到场景中物体的三维信息。
双目立体视觉技术主要包括相机标定、图像获取、图像预处理、特征提取、立体匹配、三维重建等步骤。
三、双目立体视觉定位技术双目立体视觉定位技术是双目立体视觉技术的核心部分,它通过计算左右相机获取的图像间的视差信息,实现场景中物体的三维定位。
具体而言,双目立体视觉定位技术首先需要对相机进行精确的标定,以获取相机的内外参数。
然后通过图像预处理和特征提取,获取场景中的特征点或特征线。
接着,利用立体匹配算法,将左右相机获取的图像进行匹配,得到视差图。
最后,根据视差信息和相机的内外参数,计算得到场景中物体的三维坐标信息。
四、双目立体视觉识别技术双目立体视觉识别技术是在定位技术的基础上,进一步对场景中的物体进行分类和识别。
通过分析物体的形状、大小、纹理等特征信息,结合机器学习、深度学习等算法,实现对物体的识别和分类。
双目立体视觉识别技术可以广泛应用于无人驾驶、机器人导航、工业检测等领域。
五、双目立体视觉技术的应用双目立体视觉技术在许多领域都得到了广泛的应用。
在无人驾驶领域,双目立体视觉技术可以实现车辆的定位和障碍物识别,提高车辆的行驶安全性和自动驾驶的准确性。
在机器人导航领域,双目立体视觉技术可以帮助机器人实现精准的路径规划和导航。
在工业检测领域,双目立体视觉技术可以实现对产品的快速检测和质量控制。
六、研究展望随着计算机视觉技术的不断发展,双目立体视觉定位和识别技术将会有更广泛的应用前景。
双目立体视觉匹配技术综述

2 0 1 5年 2 月
F e b . 2 01 5
d o i : 1 0 . 3 9 6 9 / j . i s s n . 1 6 7 4 - 8 4 2 5 ( z ) . 2 0 1 5 . 0 2 . 0 1 4
双 目立 体 视 觉 匹 配 技 术 综 述
曹之 乐 , 严 中红 , 王 洪
Su mm a r y o f Bi n o c ul a r St e r e o Vi s i o n Ma t c h i ng Te c hno l o g y
CAO Z h i — L e,YAN Z h o n g — Ho n g,W ANG Ho n g
( C o l l e g e o f P h a r ma c y a n d B i o m e d i c a l E n g i n e e i r n g ,
C h o n g q i n g U n i v e r s i t y o f T e c h n o l o g y , C h o n g q i n g 4 0 0 0 5 4, C h i n a )
( 重庆 理工 大学 药学 与 生物工 程学 院 , 重庆
摘
4 0 0 0 5 4 )
要: 立体视 觉 匹配技 术是 立体视 觉研 究 的核 心 问题 。立 体 匹配方 法在 不 同的 应 用领域
有 着不 同的应 对策略 。介 绍 了双 目视 觉 立体 匹配技 术 的 原理 和 一 些研 究 关键 点。 通过 总结现 有各 种算 法 的优 缺 点 , 对基 于 区域 的立体 匹配算 法和基 于全局 的立体 匹配 算法进 行 了深入 论述
.
Abs t r a c t :Th e c o r e p a r t o f t h e s t e r e o v i s i o n i s s t e r e o ma t c h i ng .F o r d i f f e r e n t a p p l i c a t i o n i f e l d s,t he r e a r e d i f f e r e n t s t e r e o ma t c h i n g me t h o ds t o d e a l wi t h.Fi r s t ,t h e p a p e r b r i e ly f i n t r o d u c e d t h e p in r c i p l e o f b i n o c ul a r v i s i o n s t e r e o ma t c h i n g t e c h n o l o y g a n d s o me ke y p o i n t s .S e c o n d l y,we s u mme d u p t h e a d— v a n t a g e s a nd d i s a d v a n t a g e s o f v a r i o u s a l g o r i t h ms a n d h a d d e e p l y d i s c u s s e d a n d s t u d i e d t h e s t e r e o ma t c h i n g a l g o r i t h m b a s e d o n d i s t ic r t a n d s t e r e o ma t c h i n g a l g o r i t hm b a s e d o n o v e r a l l s i t ua t i o n.Fi na l l y, t he s t e r e o ma t c h i n g lg a o r i t h m o f t h e f u t u r e wa s p r o s p e c t e d,wh i c h p r o v i d e s s o me v a l u a b l e i d e a s f o r t ho s e wh o s t u d y i n t h i s ie f l d. Ke y wor ds:b i n o c u l a r s t e r e o v i s i o n;s t e r e o ma t c h i n g;d y n a mi c pr o g r a mmi n g;i ma g e s e g me n t a t i o n; b e l i e f p r o pa g a t i o n
双目立体视觉匹配

双目立体视觉匹配双目立体视觉匹配是指利用人类双眼在空间中略微不同的视角,联合大脑进行视觉信息的处理和匹配,从而获得空间的深度和立体感。
在现代科技中,利用双目立体视觉匹配可以实现很多实用的应用,比如立体影像、立体游戏、机器人视觉导航等。
双目立体视觉匹配技术是计算机视觉和人工智能领域的一个重要研究方向,具有广泛的应用前景。
一、双目立体视觉原理人类通过双眼获取的两幅视觉图像,实际上是同一个物体在不同视角下的投影。
这两幅图像之间存在视差,也就是物体在不同视角下的位置差异。
大脑通过对这些视差的处理,得出了深度信息,使我们能够感知到物体的三维空间位置。
双目立体视觉匹配主要涉及视差的计算和匹配。
在数字图像处理中,利用计算机对双眼获取的两幅图像进行处理和匹配,从而获取深度信息。
通常采用的方法包括视差计算、视差匹配和深度图生成等步骤。
1. 视差计算:通过一系列像素级的图像处理方法,计算出两幅图像之间的视差。
常见的计算方法包括半全局匹配(Semi-Global Matching, SGM)、立体匹配算法(Stereo Matching)、视差图像传感器(Depth Sensing Image Sensor)等。
2. 视差匹配:将两幅图像中对应的像素进行匹配,找到它们之间的视差值。
通常采用的方法包括基于特征点的匹配、基于像素级的匹配等。
3. 深度图生成:根据计算得出的视差信息,生成目标物体的深度图,从而实现三维空间中物体位置的感知。
双目立体视觉匹配的原理是基于人类视觉的工作原理,通过模拟人类双眼的工作方式,从而实现数字图像的深度感知和立体视觉效果。
二、双目立体视觉应用双目立体视觉匹配技术在现代科技中应用广泛,涉及到多个领域,包括计算机视觉、人工智能、机器人技术等。
以下将介绍一些典型的双目立体视觉应用。
1. 立体影像:利用双目立体视觉匹配技术,可以实现立体影像的拍摄和显示。
通过双目相机拍摄的图像以及虚拟现实(Virtual Reality, VR)或增强现实(Augmented Reality, AR)技术,可以实现逼真的立体影像体验。
BP神经网络概述

BP神经网络概述BP神经网络由输入层、隐藏层和输出层组成。
输入层接收外界输入的数据,隐藏层对输入层的信息进行处理和转化,输出层输出最终的结果。
网络的每一个节点称为神经元,神经元之间的连接具有不同的权值,通过权值的调整和激活函数的作用,网络可以学习到输入和输出之间的关系。
BP神经网络的学习过程主要包括前向传播和反向传播两个阶段。
前向传播时,输入数据通过输入层向前传递到隐藏层和输出层,计算出网络的输出结果;然后通过与实际结果比较,计算误差函数。
反向传播时,根据误差函数,从输出层开始逆向调整权值和偏置,通过梯度下降算法更新权值,使得误差最小化,从而实现网络的学习和调整。
BP神经网络通过多次迭代学习,不断调整权值和偏置,逐渐提高网络的性能。
学习率是调整权值和偏置的重要参数,过大或过小的学习率都会导致学习过程不稳定。
此外,网络的结构、激活函数的选择、错误函数的定义等也会影响网络的学习效果。
BP神经网络在各个领域都有广泛的应用。
在模式识别中,BP神经网络可以从大量的样本中学习特征,实现目标检测、人脸识别、手写识别等任务。
在数据挖掘中,BP神经网络可以通过对历史数据的学习,预测未来的趋势和模式,用于市场预测、股票分析等。
在预测分析中,BP神经网络可以根据历史数据,预测未来的房价、气温、销售额等。
综上所述,BP神经网络是一种强大的人工神经网络模型,具有非线性逼近能力和学习能力,广泛应用于模式识别、数据挖掘、预测分析等领域。
尽管有一些缺点,但随着技术的发展,BP神经网络仍然是一种非常有潜力和应用价值的模型。
BP神经网络ppt

人工神经网络 是生物神经网络的某种模型(数学模型) 是对生物神经网络的模仿 基本处理单元为人工神经元
1. 生物神经系统与生物神经元
大量生物神经元的广泛、复杂连接,形成生
物神经网络 (Biological Neural Network, BNN)。
实现各种智能活动
生物神经元(neuron)是基本的信息处理单元
(1)生物神经系统
生物神经元(neuron)是基本的信息处理单元, 其组成:
➢ 树突(dendrites), 接收来自外接的信息 ➢ 细胞体(cell body), 神经细胞主体,信息加工 ➢ 轴突(axon), 细胞的输出装置,将信号向外传递,
与多个神经元连接 ➢突触 (synapsse), 神经元经突触向其它神经元(胞体 或树突)传递信号
2 1m =
2 j1
dj f
net
L1 j
2
样本集内所有样本关于该网络的总输出误差
Etotal E
输出层l L 1节点j的净输入
实际输出
nL2
net
L1 j
O L1 L2
ij i
i 1
O L1 j
1
1+e-
net
L1 j
II
输出层的权值iLj 1调整
隐含层 L 2 输出层 L 1
nL2
net
L1 j
=
O L1 L2 ij i
i 1
权值iLj 1对误差E的影响
E
iLj 1
E
net
L1 j
net
L1 j
iLj 1
O L1 L2
j
i
输出层的权值iLj 1调整 iLj 1修正应使误差E最快减小
BP神经网络的简要介绍及应用

BP神经网络的简要介绍及应用BP神经网络(Backpropagation Neural Network,简称BP网络)是一种基于误差反向传播算法进行训练的多层前馈神经网络模型。
它由输入层、隐藏层和输出层组成,每层都由多个神经元(节点)组成,并且每个神经元都与下一层的神经元相连。
BP网络的训练过程可以分为两个阶段:前向传播和反向传播。
前向传播时,输入数据从输入层向隐藏层和输出层依次传递,每个神经元计算其输入信号的加权和,再通过一个激活函数得到输出值。
反向传播时,根据输出结果与期望结果的误差,通过链式法则将误差逐层反向传播至隐藏层和输入层,并通过调整权值和偏置来减小误差,以提高网络的性能。
BP网络的应用非常广泛,以下是一些典型的应用领域:1.模式识别:BP网络可以用于手写字符识别、人脸识别、语音识别等模式识别任务。
通过训练网络,将输入样本与正确的输出进行匹配,从而实现对未知样本的识别。
2.数据挖掘:BP网络可以用于分类、聚类和回归分析等数据挖掘任务。
例如,可以用于对大量的文本数据进行情感分类、对客户数据进行聚类分析等。
3.金融领域:BP网络可以用于预测股票价格、外汇汇率等金融市场的变动趋势。
通过训练网络,提取出对市场变动有影响的因素,从而预测未来的市场走势。
4.医学诊断:BP网络可以用于医学图像分析、疾病预测和诊断等医学领域的任务。
例如,可以通过训练网络,从医学图像中提取特征,帮助医生进行疾病的诊断。
5.机器人控制:BP网络可以用于机器人的自主导航、路径规划等控制任务。
通过训练网络,机器人可以通过感知环境的数据,进行决策和规划,从而实现特定任务的执行。
总之,BP神经网络是一种强大的人工神经网络模型,具有较强的非线性建模能力和适应能力。
它在模式识别、数据挖掘、金融预测、医学诊断和机器人控制等领域有广泛的应用,为解决复杂问题提供了一种有效的方法。
然而,BP网络也存在一些问题,如容易陷入局部最优解、训练时间较长等,因此在实际应用中需要结合具体问题选择适当的神经网络模型和训练算法。
《基于双目立体视觉定位和识别技术的研究》范文

《基于双目立体视觉定位和识别技术的研究》篇一一、引言随着科技的飞速发展,计算机视觉技术在众多领域中得到了广泛的应用。
其中,双目立体视觉定位和识别技术以其高精度、高效率的特点,在机器人导航、无人驾驶、三维重建等领域中发挥着越来越重要的作用。
本文旨在研究基于双目立体视觉的定位和识别技术,分析其原理、方法及在各领域的应用,以期为相关研究提供参考。
二、双目立体视觉原理双目立体视觉技术基于人类双眼的视觉原理,通过两个相机从不同角度获取物体的图像信息,然后利用图像处理技术对两幅图像进行匹配、计算,从而得到物体的三维空间信息。
该技术主要包括相机标定、图像预处理、特征提取与匹配、三维重建等步骤。
三、双目立体视觉定位技术双目立体视觉定位技术是利用双目相机获取的图像信息,通过图像处理算法对物体进行定位。
该技术主要包括以下步骤:1. 相机标定:确定相机内参和外参,包括相机的焦距、光心位置、畸变系数等。
2. 图像预处理:对两幅图像进行去噪、平滑等处理,以便更好地提取特征。
3. 特征提取与匹配:利用特征提取算法(如SIFT、SURF等)提取两幅图像中的特征点,并通过匹配算法(如暴力匹配、FLANN匹配等)找到对应的特征点。
4. 三维定位:根据匹配的特征点,利用三角测量法等算法计算物体的三维空间坐标。
四、双目立体视觉识别技术双目立体视觉识别技术是在定位技术的基础上,进一步对物体进行分类、识别。
该技术主要包括以下步骤:1. 特征描述与分类:根据提取的特征点,建立物体的特征描述符,并通过分类器(如支持向量机、神经网络等)进行分类。
2. 模式识别:利用机器学习等技术对物体进行识别,包括目标检测、语义分割等。
3. 深度学习应用:利用深度学习算法(如卷积神经网络等)对物体进行更精确的识别和分类。
五、应用领域双目立体视觉定位和识别技术在众多领域中得到了广泛的应用,主要包括以下几个方面:1. 机器人导航与无人驾驶:通过双目相机获取周围环境的信息,实现机器人的自主导航和无人驾驶。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 引言 22 传统的立体视觉算法及视觉系统标定 22.1传统的立体视觉算法 22.2 传统的摄像机标定 33 基于BP 神经网络的摄像机标定 43.1 BP神经网络 43.2 改进的BP算法 53.3 基于BP网络的摄像机标定过程 64 仿真实验设计 75 实验结果与分析 71 引言随着现代计算机技术的快速发展,计算机在工程领域得到了广泛的应用。
计算机视觉作为其中的一个分支,在车身检测、机器人视觉导航、三维重建等领域得到广泛的应用。
计算机视觉的中心任务就是利用人工视觉系统对三维场景进行描述和识别。
所谓的描述是指丢弃深度信息,将三维场景生成二维图像;而所谓的识别则是指由若干幅二维图像恢复深度轮廓等三维信息。
在此之前,所要解决的关键问题就是确定真实场景中的三维点与所描述对应的二维点之间的对应关系。
这种关系是由摄像机成像几何模型决定的,而确定这种对应关系的过程就是所谓的摄像机标定。
传统的摄像机标定方法主要是通过预先建立或假设一定的摄像机模型,然后标定出摄像机的内外参数。
从计算的角度考虑,传统的摄像机标定可分为线性法、非线性优化法、两步法以及自标定法。
这些方法大都建立在一定的几何模型之上,一种方法只针对某一种CCD 模型,因而缺乏一定通用性。
并且大都需要建立复杂的数学模型,增加了系统的复杂性。
而且在许多场合,求解摄像机的内外参数并不是标定的最终目的,而是用这些参数来描述二维图像点和三维空间点之间的非线性的关系。
针对这些问题,提出了一种基于BP 神经网络的视觉系统标定方法,利用人工神经网络潜在的非线性映射能力来隐性的标定摄像机内外参数。
通过学习二维图像点和三维空间点之间的非线性的关系,使系统不通过建立复杂的摄像机数学模型,即可完成摄像机标定,为视觉系统的后续任务奠定基础。
2 传统的立体视觉算法及视觉系统标定2.1传统的立体视觉算法设在立体视觉中,左右两个相机的C矩阵分别为:Cl , Cr,空间一点Pi在世界坐标系中的坐标为(xi ,yi ,zi),在左右图像上的坐标分别为:(uil ,vil)和(uir ,vir),则有:(1)(2)(3)式子中:在(1)和(2)中,可,得到以分别消去tl和tr,得到4个关于(uil ,vil ,uir ,vir)和Cl , Cr,时,即可通过(3)式求的Pi点的空间坐标(xi ,yi ,zi),这就是立体视觉求解三维坐标的传统方法。
2.2 传统的摄像机标定摄像机标定过程就是确定摄像机的内部几何与光学参数和摄像机坐标系与世界坐标系之间的相对位置和方向的过程。
在双目立体视觉中,还要确定两个摄像机之间的相对位置和方向。
以典型摄像机针孔模型为例,参考系F中的点P(x,y,z)与对应图像点(u,v)间坐标关系为。
其展开式为:(4)根据式(1),给定足够的点P和对应的图像点P’,就可以唯一确定关系矩阵C。
当两个摄像机与同一指定坐标系F之间建立了这种关系,则任何一可观测点P在F下的三维坐标可根据其在两个图像上的投影坐标(u,v),通过对C矩阵的数学处理计算出来。
但是摄像机并不是一个理想的针孔透视模型,在很多情况下这种线性模型并不能准确描述摄像机成像的几何关系。
基于几何模型的传统的双目视觉标定方法,因存在光电响应、电子噪声与镜头畸变等非线性干扰因素,难以建立精确的标定模型。
只有考虑非线性畸变补偿后的非线性模型才能较为准确的描述透视模型。
在具体应用中,需根据使用场合和要求达到的精度,建立不同的摄像机模型。
而且所建模型越接近摄像机的实际,模型就越复杂,求解的难度也越大。
摄像机非线性模型的求解方法可以分为非线性搜索法、线性与非线性相结合的方法。
这些模型的计算量都非常大,速度较慢,并且很可能造成算法不收敛。
因此,有必要寻找一种新的途径来表达透视模型的复杂非线性映射关系,即人工神经元网络的方法来解决这一问题。
由于网络有相连的非线性单元组成,因此具有学习非线性成像过程的潜在能力。
3 基于BP 神经网络的摄像机标定神经网络是利用神经元等效模型对人脑神经系统进行数学模拟,其目的是学习和模仿人脑的信息处理能力。
其相关研究可以追溯到20 世纪中期。
到20 世纪80 年代初,D.Werbos,D.Rumelhart,和D.Parker三人各自独立发明了反向传播算法(Back-Propagation,BP)使得多层前馈神经网络的实现成为可能,并导致80 年代末90 年代初人们对神经网络的深入研究和广泛应用。
目前,人们在应用神经网络来解决实际问题时,90%左右均采用BP 网络及其变化形式,这体现了BP 网络是前向网络的核心部分,代表着人工神经网络的精华。
3.1 BP神经网络一个典型的三层BP神经网络结构,如图1所示。
自左至右分别为输入层、隐含层和输出层。
网络中相邻层采用全互联方式连接,同层神经元之间没有任何连接,输出和输入层之间也没有任何连接。
此处假设输入层、隐含层,输出层的神经元个数分别为L、M、N。
令从第层神经元到层神经元的连接权值为,P 为当前学习样本,为P 样本下第层第个神经元的输出,则对样本P,网络的输入误差为:(5)其中为输入第P个样本时第个神经元的期望输出,为它的实际输出。
为了不使误差降低,常根据梯度算法进行调整,即:(6)其中,假设层有个神经元,层有个神经元。
为学习速率,也称为步幅。
一般开始时值相对较大,随着学习的深入,逐步减小。
当时,为输出层误差系数,此时:(7)当时,为隐含层的输出误差系数,此时:(8)在求解过程中,是先求出,在通过求出,所以该过程称为误差反向传播过程。
在权值修改公式(6)中,引入惯性量,进一步提高网络的非线性逼近能力,即:(9)BP算法的学习过程是不断的改变连接权值,使误差趋于全局最小在实际操作过程中只要出现局部最优即可,一般按下式判定:(10)式子:为权值收敛因子,且,为误差收敛因子,一般取一个小数。
3.2 改进的BP算法BP算法具有理论依据可靠、推导过程严谨、精度较高、通用性较好等优点,但是BP模型存在以下缺点:(1)收敛速度缓慢;(2)容易陷入局部极小值;(3)难以确定隐层节点的数目.针对所存在的缺点出现了许多改进算法。
如动量一自适应学习率BP算法就是一种。
动量—自适应学习率BP算法采用了动量和学习率自适应调整的策略,从而提高了学习速度并增加了算法的可靠性。
动量法降低了网络对于误差曲面局部细节的敏感性,有效地抑制网络陷入局部极小。
动量法的权值调整算法为:(11)(12)(13)自适应调整学习率的权值调整算法为:(15)结合两种方案得到动量—自适应学习率BP神经网络的权值修正算法:(16)3.3 基于BP网络的摄像机标定过程双目立体视觉中网络的输入样本为三维空间物点在两个图像坐标系上的坐标,输出样本为该物点在世界坐标系中的坐标。
BP神经网络不需预先建立精确的成像和标定模型,也不需要预估初始值,而是将与三维空间物点对应的两个图像坐标作为神经网络的输入,物点的世界坐标作为BP神经网络的输出。
利用BP网络多次学习、训练,直到得到满意的输入与输出的映射关系。
其具体的标定过程如下:(1)用左右两只摄像头采集标定图像。
(2)用边缘检测等算子提取特征点。
并将其分为两组,一组用于训练,另一组用于检验。
并将数据归一化后作为网络的输入向量。
(3)将特征点的实际坐标作为输出,建立网络结构,并用输入和输出训练网络,直至网络达到要求。
(4)将用于检验的数据代入网络,检验网络的实用性。
其网络训练过程,如下图所示。
可以证明:在隐含层神经元可以根据需要自由设置的情况下,用三层神经网络可以任意精度逼近连续函数4 仿真实验设计实验采用双目视觉系统用黑白相间的方格图案作为标定板,将标定板置于一垂直于地面的平板(或墙壁)上,以标定板的两条互相垂直的边作为世界坐标系的X 轴,Y轴,Z轴垂直标定板。
该实验中,以标定板所在的平面作为xy面(z=0 )。
即,所有标定点的Z坐标为0。
用两只摄像头同时采集一幅图像,将特征点在左右两幅图像的图像坐标作为输入,在世界空间坐标系的坐标作为输出。
实验过程:(1)系统标定:在W中移动目标P,采集36组样本数据对(目标点在两像机中的投影u,v在世界坐标系W中的三维坐标),对网络进行权值训练。
并把结果存入计算机(2)定位计算:在图像数据中加入:0均值标准差的白噪声,得到两个摄像机的投影作为网络的输入,利用上述标定好的立体视觉系统采用本文所介绍的位姿计算方法利用公式对目标点空间位置进行计算。
对训练好的网络性能进行测试。
结果如下图所示,可以看出神经网络模型具有比较强的抗噪声能力。
5 实验结果与分析由实验可知,神经网络标定可以得到较好的标定精度。
通过改进学习算法,选择适当的参数,可以使网络更快的收敛,提高网络的在线标定能力结论神经网络具有很强的非线性逼近能力和学习能力,可以不通过建立复杂的数学模型,通过直接学习系统的输入输出数据,即可建立三维空间中的物点与其对应的二维图像点之间的复杂的非线性映射关系,且具有较好的精度。
这为视觉系统的建模提供了一种可选的有效方法。