最小化重投影误差的PFR三维射影重建
colmap重建指标

COLMAP(Structure-from-Motion and Multi-View Stereo)是一个用于计算机视觉和三维重建的开源软件,它用于从多个图像中重建三维场景和物体的几何结构。
在COLMAP 中,有一些重要的重建指标和评估方法,用于评估三维重建的质量和准确性。
以下是一些常见的COLMAP重建指标:1. **重建精度(Reconstruction Accuracy)**:- 重建精度是评估重建模型与实际场景之间的准确性的重要指标。
- 可以使用不同的度量标准来计算重建精度,例如平均重投影误差(Mean Reprojection Error)或根据地面真值的准确性来评估。
2. **稀疏度(Sparsity)**:- 稀疏度指标表示在三维重建中使用的特征点或关键点的数量。
- 更高的稀疏度通常意味着模型具有更多的几何信息,但也可能增加计算复杂性。
3. **稳健性(Robustness)**:- 稳健性指标评估COLMAP在处理不完整或有噪声的输入数据时的性能。
- 这可以通过引入噪声或缺失数据来测试COLMAP的鲁棒性。
4. **内外参数精度(Intrinsic and Extrinsic Parameter Accuracy)**:- 内外参数精度指标评估COLMAP对相机内部参数(如焦距、主点)和相机外部参数(如相机姿态和位置)的估计准确性。
- 通常使用标定数据集来评估这些参数的精度。
5. **三维点云质量(3D Point Cloud Quality)**:- 这个指标评估COLMAP生成的三维点云的质量,包括点云的密度、均匀性和准确性。
- 可以使用采样方法和点云重建算法来评估质量。
6. **姿态估计准确性(Pose Estimation Accuracy)**:- 姿态估计准确性评估COLMAP对相机姿态的估计准确性。
- 这可以通过与真实姿态或标定数据进行比较来测量。
7. **运行时间(Runtime)**:- 运行时间指标表示COLMAP重建过程所需的时间。
CT图像后处理技术

维空间中其它平面的图像,常用的有冠状 面和矢状面图像,高档螺旋CT机还可以做 任意斜面或曲面的图像重建。重建出来的 图像仍为二维的断面图像。
• 应用:适用全身各个系统组织器官的形态学改变,
尤其对判断颅底.颈部.肺门.纵隔.腹部.血管等解剖 结构复杂部位的病变性质.侵及范围.彼邻关系和小 的骨折碎片和动脉夹层破口及胆道.输尿管结石的 定位诊断具有明显优势。
VRT图像显示左冠动脉严重狭窄但搭桥血 管光滑VRT图像显示右冠动脉严重狭窄但 搭桥血管无狭窄
支架
VRT图像显示冠状 动脉左旋支及支架 形态
CPR图像显示支架内血管通畅
Video-001.avi
MSCT后处理技术在颅脑、 五官疾病检查中的应 用
优势
• 显示颅骨、颜面骨骨质微细结构,如听小
优势
• 多时相的动态扫描,如肝脏三期扫描,胰
腺双期扫描等;
• 大范围扫描,一次屏气连续在短时间内完
成一个检查部位,以轴位数据重建出冠状、 矢状、曲面、斜面任意角度的图像;
• 图像三维后处理
MSCT后处理在腹部检查中的适应症
• 肿瘤 • 其它
临床意义:
• 发现病灶,了解病灶的解剖关系; • 明确性质; • 肿瘤的手术前评估,了解有无血管癌栓。
颈部CTA(椎动脉)CPR图
主 动 脉 动 脉 瘤
胸.腹部血管CTA MPR
VRT图
3
肺动脉
下肢血管
分享病例
重建技术
• MPR • CPR • VRT • VE • MIP
右肾结核MPR
输尿管VRT
双输尿管双肾盂畸形
右输尿管结核
右肾结核VRT
右肾结核脓腔及钙化,肾盂及输 尿管未显影,左侧肾盂及输尿管 显影良好
基于不完备投影数据重建的四种迭代算法比较研究

第21卷 第2期 CT理论与应用研究 Vol.21, No.2 2012年6月(169-178) CT Theory and Applications Jun., 2012阙介民, 王燕芳, 孙翠丽, 等. 基于不完备投影数据重建的四种迭代算法比较研究[J]. CT理论与应用研究, 2012, 21(2): 169-178.Que JM, Wang YF, Sun CL, et al. Comparison of four iterative algorithm based on incomplete projection reconstruction[J]. CT Theory and Applications, 2012, 21(2): 169-178.基于不完备投影数据重建的四种迭代算法比较研究 阙介民1,2,3,王燕芳1,2 ,孙翠丽1,2,魏存峰1,2,史戎坚1,2,魏龙1,21.北京市射线成像技术与装备工程技术研究中心,北京1000492.中国科学院高能物理研究所核分析技术重点实验室,北京1000493.中国科学院研究生院,北京100049摘要:在发射成像和穿透成像过程中,由于各种原因会造成投影数据不完备,若仍采用传统解析方法重建出的图像会产生伪影,而迭代算法则可以很好地改善图像质量。
本文应用不同的迭代算法分别就真实标准线对测试卡的稀疏投影数据和有限角度投影数据进行重建,定量分析比较它们各自的优缺点,为几种迭代算法的工程或临床应用提供重要参考。
关键词:稀疏投影;有限角投影;迭代算法;图像总变差;MAP文章编号:1004-4140(2012)02-0169-10 中图分类号:TP301.6 文献标识码:ACT图像重建的基本方法有两种:解析法和迭代法。
解析法建立在连续信号模型上,对噪声比较敏感且要求投影数据完备;迭代法建立在离散信号模型上,相比较解析法,迭代法在低信噪比(低剂量)以及投影数据不完备的情况下,仍能重建出质量优于解析法的图像。
一种投影预处理算法在局部CT图像重建中的应用

一种投影预处理算法在局部CT图像重建中的应用
张卫贞
【期刊名称】《《电子测试》》
【年(卷),期】2013(000)006
【摘要】本文首先对Shepp Logan头颅投影数据低分辨率重建,然后对含噪感兴趣区域相关的投影数据使用一种将小波变换与Wiener滤波相结合的局部投影数据预处理算法进行降噪,最后对降噪后的投影数据局部反投影重建。
通过图像平方根误差分析实验结果可知,重建图像相对原图像误差较小。
【总页数】2页(P256-257)
【作者】张卫贞
【作者单位】太原科技大学电子信息工程学院山西太原 030024
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.基于小波变换的Wiener滤波投影预处理算法在图像重建中的应用 [J], 张卫贞;王明泉
2.一种投影预处理算法在局部CT图像重建中的应用 [J], 张卫贞;
3.一种新算法在ECT图像重建中的应用研究 [J], 孙昕;王桂权
4.赵金早幅度分类算法与相位分类算法在4D-CT图像重建中的应用 [J], 赵金早
5.一种局部CT图像重建算法研究 [J], 霍修坤
因版权原因,仅展示原文概要,查看原文内容请购买。
三维信号重建的方法

三维信号重建的方法介绍三维信号重建是一种将二维观测数据转化为三维原始数据的过程。
在许多领域,包括医学成像、地质勘探和计算机视觉等,三维信号重建都是一个重要的研究领域。
本文将介绍三维信号重建的方法,包括传统方法和深度学习方法。
传统方法传统的三维信号重建方法主要基于数学模型和统计学理论。
这些方法通常需要对信号进行传感器测量,并利用测量数据进行重建。
以下是一些常用的传统方法:直接方法直接方法是指直接测量目标信号的物理量,并使用逆问题的求解方法来重建原始信号。
常见的直接方法有:1.迭代重建方法:使用迭代算法,如最小二乘法(Least Square Method)或迭代最小二乘法(Iterative Least Square Method)来逐步逼近原始信号。
2.正则化方法:在迭代过程中引入正则化项,以提高重建的稳定性和精度。
投影方法投影方法是通过测量目标信号的投影数据来重建三维信号。
常见的投影方法有:1.单次投影重建方法:直接使用一次投影数据进行重建,如传统的CT扫描技术。
2.多次投影重建方法:通过多次不同方向的投影数据进行叠加,以获得更精确的重建结果。
反射方法反射方法是通过反射系数和传播模型来重建三维信号。
这些方法通常基于物理反射模型,如声波的反射、光线的反射等。
常见的反射方法有:1.反射系数估计:通过测量目标信号的反射系数,使用反演算法来重建原始信号。
2.波动方程反演:根据波动方程的传播模型,使用正演和反演算法来重建原始信号。
深度学习方法深度学习方法在三维信号重建中取得了显著的成果。
深度学习方法通过训练神经网络来实现信号的重建。
以下是一些常用的深度学习方法:自编码器自编码器是一种无监督学习方法,用于将输入数据压缩到潜在空间并重建输出。
在三维信号重建中,自编码器可以用于将高维的观测数据映射到低维潜在空间,并通过解码器将其重建为三维信号。
卷积神经网络卷积神经网络(Convolutional Neural Network,CNN)在图像处理领域有很好的表现。
最小特征值的迭代非刚体三维射影重建方法

最小特征值的迭代非刚体三维射影重建方法裘国永;刘静娜;刘中华;彭亚丽;刘侍刚【摘要】To obtain 3D non-rigid projective reconstruction from an image sequence,an iteration projection reconstruction method for 3D non-rigid based on minimal eigenvalue is presented.Based on the characteristic that all the image points and the depth factors constitute a low rank image matrix,the method replaces projection solution by eigenvalue and eigenvector solution.Then we can obtain the depth factors by iteration.Finally,the 3D non-rigid projective reconstruction is realized.The method can guarantee to converge to the global optimal solution.The experiments with both simulate and real data show that the proposed method has the advantages of fast convergence speed and small error.%为了从图像序列中重建出非刚体三维射影重建,本文提出了一种最小特征值的迭代非刚体射影重建方法.该方法利用所有的图像点和深度因子组成一个低秩图像矩阵的特性,将投影求解转化为矩阵特征值及特征向量的求解,迭代地求解深度因子,实现非刚体的三维射影重建.该方法能够保证算法能够收敛到全局最优解.模拟实验和真实实验结果表明,本文方法具有收敛性速度快、误差小等优点.【期刊名称】《电子学报》【年(卷),期】2017(045)005【总页数】7页(P1211-1217)【关键词】非刚体;射影重建;特征值【作者】裘国永;刘静娜;刘中华;彭亚丽;刘侍刚【作者单位】现代教学技术教育部重点实验室,陕西西安 710062;陕西省教学信息技术工程实验室,陕西西安 710119;陕西省教学信息技术工程实验室,陕西西安710119;河南科技大学电子信息工程学院,河南洛阳 471023;现代教学技术教育部重点实验室,陕西西安 710062;陕西省教学信息技术工程实验室,陕西西安 710119;现代教学技术教育部重点实验室,陕西西安 710062;陕西省教学信息技术工程实验室,陕西西安 710119【正文语种】中文【中图分类】TP391.41从已有图像序列中重建出物体的三维结构是计算机视觉研究热点问题之一[1,2],早期的三维重建研究工作都针对物体做刚体运动的情况[3].然而,现实世界中大部分物体的运动属于非刚体运动.非刚体运动比刚体运动更具有普遍性和多样性,其重建的难度也将增加[4,5].为了重建三维非刚体,Bregler等人首次提出了三维非刚体可由若干个形状基(Shape Basis)线性加权组成[6],并重建了三维非刚体的结构,但事后已证明这是一个病态不定问题求解[7].后来许多三维非刚体重建方法都基于Bregler的假设[8,9].其中Fragkiadaki利用秩的约束采用迭代方法重建非刚体的三维结构及运动[10],Bue等人基于SVD分解方法重建三维人脸结构及运动[11].但这些方法仅适合正投影模型.在针孔模型下,从图像序列中仅能实现物体的射影重建[12,13],为了实现非刚体的射影重建,有些学者将非刚体的部分当作出格数据进行处理[14],采用刚体重建方法进行射影重建,但该方法要求物体做近似刚体运动,在许多情况下,物体的运动并不能近似于刚体运动.因此,该方法在许多场合并不适用.为了更符合实际情况,本文在相机为针孔模型下,提出了一种基于最小特征值的迭代非刚体三维射影重建方法.该方法利用所有的图像点和深度因子组成一个低秩图像矩阵的特性,将投影求解转化为矩阵特征值及特征向量的求解,迭代地求解深度因子,实现非刚体的三维射影重建,而且本文方法能够从理论上保证算法收敛至全局最优解.假定相机为针孔模型,其成像过程可表示为假设有F幅图像,N个三维空间点,对于第i幅图像,由式(1)有当物体做非刚体运动时,Zi可以认为由L个形状基线性组成[6],即将式(3)代入式(2)可得将上式展开并整理得从式(6)可以看出,M3F×N为低秩矩阵,其秩为3L+1.同时,从上式还可以看出,对于任意的非奇异矩阵Π,都有从式(6)还可以看出,M3F×N中含有未知的深度因子γi,j.若深度因子γi,j已知,通过SVD分解则有由于M3F×N的秩为3L+1,则有因此,可以令射影重建为:从上面可以看出,若深度因子γi,j已知,通过SVD分解,很容易实现非刚体的射影重建.因此,射影重建的转化为深度因子γi,j的求解,下面讨论如何实现深度因子γi,j的求解.任一列向量投影到列向量生成的正交补子空间的投影矩阵为[15]:同时,M3F×N中的任一列cj在列生成的正交补空间上的投影为在实际应用中,图像含有噪声,因此上式的求解可以最小化余差,即为了避免非平凡解的出现,将式(17)修改为式(18)的求解可以转化为求解HF×F的最小特征值对应的特征向量.在3.1中,利用每个空间点在图像矩阵中组成一个列向量对深度因子λj进行求解.和上节类似,利用每幅图像构成三个行向量对深度因子γi=(γi,1,γi,2,…,γi,N)T进行求解.任一行向量投影到由的行向量生成的正交补子空间的投影矩阵为[15]:证明:由于在M3F×N矩阵中,同一幅图像中的连续三行都有相同的γi,j,因此,取连续的三行r3i-2、r3i-1和r3i(i=1,2,…,F),将其r3i展开,则有同理,为了避免非平凡解的出现,将上式可以写为在上面求解深度因子γj和γi的过程中,事先假定和都已知,但和是从M3F×N得到,而M3F×N中却含有深度因子γi,j,因此,可以构造一个迭代算法对深度因子γi,j进行求解.本文算法流程如图1所示,详细步骤总结如下:步骤1 假设所有的图像深度因子γi,j=1,k=1,令ε为任意小的正数;步骤2 对M3F×N进行奇异值分解,利用式(9)求到和;步骤3 利用式(11)构造投影矩阵;步骤4 利用式(17)求取矩阵HF×F;步骤5 求取矩阵HF×F的最小特征值及其对应的特征向量,即最小余差为及对应的深度因子为γj;步骤6 利用式(19)构造投影矩阵;步骤7 利用式(22)求取矩阵FN×N;步骤8 求取矩阵FN×N的最小特征值及其对应的特征向量,即最小余差为及对应的深度因子为γi;步骤9 若,转步骤(10);否则,k=k+1,转步骤(2);步骤10 利用式(10)实现非刚体的射影重建.在本文算法中,每次迭代的运算量主要来自以下3部分:(1)步骤2中对M3F×N进行奇异值分解,其运算复杂度为min(O(F2N) O(FN2));(2)步骤5中求HF×F的最小特征值及特征向量,其运算复杂度为O(F3);(3)步骤8中求FN×N的最小特征值及特征向量,其运算复杂度为O(N3).因此,这3部分总的运算复杂度为max(O(F3) O(N3)),即本文算法每进行一次迭代的运算复杂度为max(O(F3) O(N3)).为了验证本文方法的性能及各种参数对本文方法的影响,首先产生不同形状基数目的非刚体运动,再产生不同数量的图像,并在图像中加入均值为零,方差变化的高斯噪声.根据模拟产生的非刚体图像序列,用本文方法进行非刚体的射影重建,并用v(3L+2)的值和最小余差er的大小来衡量算法的性能.实验1 为了检验本文方法的收敛性能,假设形状基数目L分别为6、8,模拟产生含有60个空间点、60幅图像的非刚体图像序列,同时,在图像中分别加入零均值,方差分别为0,0.5,1.0,1.5,2.0个像素的高斯噪声,实验结果如图2和图3所示.从图2和图3可以看出,v(3L+2)和er的值均随迭代次数的增加逐渐减小,一般情况下,只需要迭代20次之内就达到了收敛,说明本文方法具有较好的收敛性能.从图2和图3还可以看出,噪声越小收敛性能越好.同时,比较图2(a)与2(b)和3(a)与3(b),可以看出,非刚体的形状基数L越大,收敛速度越慢,原因是因为形状基数L越大,秩越大,要求解的未知数就越多,而方程数却是一定的,因此收敛速度就越慢.实验2 为了检验形状基数目L对本文方法的影响,模拟产生60个空间点,60幅图像,在图像中加入零均值,方差分别为0,0.5,1.0,1.5,2.0个像素的高斯噪声,形状基个数L 由1变化至12,在每种情况下分别运行50次后求其平均值,实验结果如图4和图5所示.从图4和图5可以看出,随着形状基数L的增加,v(3L+2)和er的值都减小,图像噪声越大,v(3L+2)和er的值也越大,原因是由于:(1)对于v(3L+2),矩阵在进行SVD分解时,对角阵V3F×N对角线上元素的值是从大到小进行排列,能量主要集中在前面特征值上,基数L越大,v(3L+2)的位置越靠后,其对应的值就越小.(2)对于er,基数越大,要求解的未知数就越多,而方程数量却一定的,因此,er的值就越小.实验3 为了检验空间点数对本文方法的影响,在图像保持60幅不变的情况下,空间点数由40变化至240,同时,在图像中加入零均值,方差为1.0个像素的高斯噪声,形状基数分别取4,6,8,10,在每种情况下分别运行50次后求其平均值,实验结果如图6和图7所示.从图6可以看出,随着空间点数的增加,v(3L+2)的值增大,原因是由于空间点数越多,矩阵越大,其能量相对越大,因此,v(3L+2)的值就越大.从图7也可以看出,er的值随着空间点数的增加而增大,这是因为空间点数越多,约束就越多,方程求解的余差就会越大.实验4 为了检验图像数对本文方法的影响,同实验3一样,只是本实验保持空间点数为60,而图像数由20变化至200幅,实验结果如图8和图9所示.从图8和图9可以看出,v(3L+2)和er的值随着图像数的增加而增大,原因和实验3一致.实验5 为了检验及比较本文方法的抗噪能力,模拟产生60个空间点,60幅图像,形状基数分别取4,6,8;同时,在图像序列中加入零均值,方差由0变化至2个像素的高斯噪声.利用这些图像序列,分别用本文方法和Dai方法[13]进行射影重建,在每种情况下分别运行50次后求其平均值,实验结果如图10和图11所示.从图10可以看出,用本文方法,v(3L+2)随图像噪声的增加呈线性增长的趋势,说明该方法鲁棒性较好,而Dai方法仅考虑列向量的约束,因此,本文方法的重建精度高.从图11可以看出,er值随图像噪声的增加而增加.比较发现本文方法的v(3L+2)和er值比Dai方法都要小,说明本文方法具有更好的抗噪能力.同时,从图10和图11中还可以看出,基数越大,v(3L+2)和er的值越小,其结论和实验2是一致的.为了验证本文算法的正确性,本文获得一个由230帧图像组成的恐龙图像序列,图像大小为570×338,其中的两帧如图12所示.从图12可以看出,该恐龙运动是非刚体运动.在该图像序列中,通过人工提取及跟踪了49个特征点(如图中*所示),选取形状基的个数L为10,用本文方法对这些特征点进行射影重建.为了衡量本文方法的重建精度,对这些重建点进行重投影,重投影点如图12中○所示.从图12可以看出,重投影点和原始特征点基本重合,同时,我们计算了重投影点到原始特征点的平均距离,即平均重投影误差为0.6214像素,这说明本文方法具有较高的重建精度.本文提出了一种基于最小特征值的迭代非刚体三维射影重建方法.该方法利用所有的图像点和深度因子组成一个图像低秩矩阵的特性,将投影求解转化为矩阵特征值及特征向量的求解,迭代地求解深度因子,最终实现非刚体的射影重建.该方法保证了算法能够收敛至全局最优解.模拟实验和真实实验的数据结果表明,本文方法具有收敛性速度快、误差小等优点.为了进一步提高三维射影重建精度,本文下一步工作将结合度量学习理论[16~18],通过度量学习建立非刚体三维模型库,利用三维模型库实现非刚体的射影重建.刘静娜女,1992年2月出生,河南周口人,2014年在河南师范大学获得学士学位,现为陕西师范大学硕士生.从事图像序列分析、相机标定等方面的有关研究.刘中华(通信作者) 男,1975年3月出生,河南郑州人,1998年在空军第一航空学院获得学士学位,2005年在西华大学获得硕士学位,2011年在南京理工大学获得博士学位,现为河南科技大学副教授.从事计算机视觉、模式识别、图像处理等方面的有关研究.刘侍刚男,1973年11月出生,江西峡江人,1997年和2001年在哈尔滨工程大学分别获得学士学位和硕士学位,2005年在西安电子科技大学获得博士学位,现为陕西师范大学副教授.从事计算机视觉、三维重建等方面的有关研究.裘国永男,1964年6月出生,浙江绍兴人.1999年浙江大学计算数学专业理学博士.现为陕西师范大学副教授,从事三维重建、相机标定等方面的有关研究.。
基于仿射重投影的增强现实三维注册方法

基于仿射重投影的增强现实三维注册方法
陈鹏;管涛
【期刊名称】《计算机辅助设计与图形学学报》
【年(卷),期】2010(022)003
【摘要】针对增强现实虚实配准中的无标志点虚实场景注册问题,提出一种基于仿射重投影与自然特征点追踪相结合的虚实注册方法.该方法以仿射变换为桥梁来建立欧氏空间下的摄像机坐标系与世界坐标系之间的变换关系,它与OpenGL等当前流行的图形渲染工具一致,具有更强的通用性;采用基于分类的自然特征匹配策略,能够在视角和视点发生大幅度变化情况下依然正常工作;提出基于特征点集合的仿射坐标系定义方法,使增强现实系统在最小配置下只需4点追踪成功即可完成注册,比需要6点的透视投影方法具有更好的健壮性和精确性.实验结果表明,该方法的运算速度能够达到18帧/s,具有较好的实时性;同时注册误差保持在5mm以内,达到令人满意的配准精度.
【总页数】7页(P480-486)
【作者】陈鹏;管涛
【作者单位】三峡大学智能视觉与图像信息研究所,宜昌,443002;华中科技大学数字化工程与仿真中心,武汉,430074
【正文语种】中文
【中图分类】TP391.9
【相关文献】
1.基于仿射投影的弹载图像几何失真校正方法 [J], 岳冬雪;黄新生;谭红力
2.基于仿射投影的微弱信号检测方法研究 [J], 刘世金;刘大利
3.基于仿射投影算法的AR模型参数估计方法 [J], 彭秀艳;门志国;刘长德
4.仿射重投影混合虚实注册方法 [J], 雍玖;王阳萍;雷晓妹
5.基于仿射投影的光线空间插值方法 [J], 孙季丰;吴军政
因版权原因,仅展示原文概要,查看原文内容请购买。
基于FBPR算法的CT系统图像重建技术

基于FBPR算法的CT系统图像重建技术针对目前CT系统中待测物体的图像重建问题,首先采用R-L函数滤除环境噪声,然后利用FBPR算法将反投影算法和Richardson算法结合起来,通过卷积和迭代的方式求解出待测物体的成像矩阵。
最后对成像矩阵作了进一步优化。
该算法可应用到军事、医疗等领域材料的断层成像中,能够在噪声较大的环境中快速稳定的获得分辨率较高的物体图像。
标签:图像重建;噪声滤除;FBPR算法Abstract:In order to solve the problem of image reconstruction in the current CT system,the R-L function is firstly used to filter out the environmental noise. Then the FBPR algorithm is used to combine the back-projection algorithm with the Richardson algorithm,which is applied to solve the imaging matrix of the object to be measured by means of convolution and iteration. Finally,this paper further optimized the imaging matrix. The algorithm can be applied to the tomography of military engineering materials,and we can obtain stable object images quickly with high resolution in a noisy environment.Keywords:image reconstruction;noise filtering;FBPR algorithm引言CT系統凭借在不损坏样品内部结构的情况下能够对工程材料、生物组织等断层成像的优点,在医疗、军事等领域有广泛的应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期 : 2007209215. 作者简介 : 徐 帆 (19832) ,男 ,博士研究生 , E2mail : drowterran @gmail. co m.
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved.
要缺点 :a. 观测矩阵 M 可能存在缺失数据 ,直接 导致 SVD 分解不能执行 ; b. 实际应用中需要精 确的数据正规化才能取得不错的重建效果.
针对上述 缺 点 进 行 改 进 是 近 几 年 的 研 究 热 点[7~11] . 本文将原基于仿射投影模型提出的 PF 方法扩展到了透视投影模型 ,提出了一种最小化 重投影误差的线性射影重建算法 PF rep rojectio n ( PFR) . 通过添加权值参数将重投影误差非线性 的代价函数转化为三线性的代价函数 ,并通过拆 分求解加权线性方程组来实现重投影误差的交错 最小化. 实验结果表明 ,本算法在不影响输出精度 的前提下提高了射影重建的整体效率.
定 X ,B ,求解 P = argminφ;c. 固定 P , X ,求解B = P
a r g mi nφ. B 通过将每 一 步 拆 分 成 若 干 小 的 线 性 方 程 组
Ax = b 的最小二乘求解问题 ,可以很好地处理缺
失数据. 如式 ( 2) 的解为 m = ( AT A) - 1 AT b , PFR
首先运行由 Martinec 和 Pajdla[13] 提出的一 种快速批量算法 ,输出联合投影矩阵 P 以及各个 投影点的射影深度 ,随后执行文献[ 5 ]描述的线性 三角测量方法以获取 X. 将以上计算得到的 P , X 以及射影深度作为初始值代入 PFR 进行迭代计
∑ φreproj =
[ ( uj , i - Pi ,1 Xj /λj , i ) 2 +
ij
( vj , i - Pi ,2 Xj /λj , i ) 2 ] ,
(3)
式中λj , i = Pi,3 Xj . 式 (3) 定义了一个非线性的代价
函数 , 使得最小化重投影误差变得十分困难. 取
βj , i = 1/λj , i可以将式 (3) 转化为一个三线性的代价
徐 帆 王宏远 方 磊 田 文
(华中科技大学 电子与信息工程系 , 湖北 武汉 430074)
摘要 : 基于 Power Facto rizatio n ( PF) 仿射重建算法提出了一种最小化重投影误差的线性射影重建算法 PFR ( PF rep rojectio n) . 该算法通过线性算法实现了重投影误差的最小化. 算法通过添加权值参数将重投影误差非 线性的代价函数转化为三线性的代价函数 ,并基于摄像机运动 、三维场景结构以及射影深度之间的加权交错 最小二乘法实现了重投影误差的交错最小化. 实验结果表明本算法能在不影响输出精度的前提下提升射影 重建 30 %的整体效率 ,适合作为标准光束法平差算法的引导算法或与光束法平差组成混合算法. 关 键 词 : 射影重建 ; Power Factorization ( PF) ; 矩阵分解 ; 重投影误差 ; 缺失数据 ; 主元分析 中图分类号 : TP391. 41 文献标识码 : A 文章编号 : 167124512 (2008) 1020052204
λ x 1 ,1 1 , m
… λ x n,1 n,1
ω
…=
… λ x n, m n, m
[ P1 , P2 , …, Pm ] T [ X1 , X2 , …, Xn ] , 式中 表示由于阻挡等原因而无法观测到的二维
点. 本文要解决的问题是如何从包含缺失数据的
观测矩阵 M 重建描述摄像机运动的联合投影矩
第 10 期
徐 帆等 : 最小化重投影误差的 PFR 三维射影重建
·53 ·
1 最小化重投影误差的 PFR 算法
1. 1 透视投影扩展
假设某三维场景共 n 个三维点 , 分别在 m 幅
透视视图中可见. 用 Pi 表示 3 ×4 的投影矩阵 , Xj 表示三维点的齐次坐标向xj , i表示此二维投影点的齐 次坐标向量 , 且有λj , i x j , i = Pi Xj , 其中 λj , i 是该投
影的射影深度[3] . 把所有投影方程联合起来则有
联合投影方程 M = P X ,即
λ x 1 ,1 1 ,1
…
λ x 2 ,1 2 ,1 λ x 2 ,2 2 ,2
第36卷 第10期 2008年 10月
华 中 科 技 大 学 学 报 (自然科学版) J . Huazhong U niv. of Sci. & Tech. (Nat ural Science Editio n)
Vol. 36 No . 10 Oct . 2008
最小化重投影误差的 PFR 三维射影重建
函数[12 ]
∑ φreproj =
[ ( uj , i - βj , i P i ,1 Xj ) 2 +
ij
( v j , i - βj , i P i ,2 Xj ) 2 ] ,
(4)
式中βj , i Pi,3 Xj = 1 , 最小化式 ( 4) 所定义的代价函
数的困难在于约束βj , i Pi,3 Xj = 1 ,现将约束以误差
近φreproj , 可取 w j , i =
u2 j,i
+
v2j , i .
取 B = [βj , i ] , 式 ( 5) 定义的代价函数是关于
B , P , X 的三线性方程 ,基于 PF 的算法框架 ,可以
通过线性迭代算法最小化代价函数 φ,直至代价
函数收敛 :a. 固定 P ,B ,求解 X = argminφ; b. 固 X
X = ( PT P) - 1 PT M ;
P = MXT ( XXT ) - 1 .
(2)
交替迭代式 (1) 、(2) 直至代价函数收敛. 文献[10 ]
指出 PF 执行大型矩阵分解的算法消耗只有 SVD
分解的 5 %.
1. 3 最小化重投影误差
由于 PF 的代价函数是没有明显物理意义的
代数误差 , 因此取 xj , i = [ uj , i , vj , i , 1 ]展开式 ( 1) 有
阵 P 和三维场景结构 X.
考虑存在缺失数据的情况 ,最小化代价函数 φ = ‖H ⊙( M - PX) ‖2F =
∑‖λ x j , i j , i - Pi Xj ‖2 ,
ij
式中 :矩阵 H 用来标识确实数据 ; ⊙表示哈达玛 积 ;代价函数 φ只在现存数据上计算误差. 由于
M 存在缺失数据 ,因此需要把 P 和 X 分开求解.
∑ φ =
[ (λj , i u j , i - Pi ,1 Xj ) 2 + λ ( v j , i j , i -
ij
Pi ,2 Xj ) 2 + (λj , i - Pi ,3 Xj ) 2 ] ,
式中 :求和下标 i j 表示在所有现存数据上求和 ;
Pi,1 表示取投影矩阵 Pi 的第 1 行. 射影重建中最 理想的代价函数是重投影误差 ,即
1. 2 PF 算法
Power Facto rizatio n ( PF) 算 法[10] 是 一 种 典
型的交替最小二乘法 ,分两步最小化代价函数
φ = ‖M - PX ‖2F ,
(1)
式中 :下标 F 表示取二范数 ; 最小化代价函数 φ
等价于求解方程5φ/ 5 P = 5φ/ 5 X = 0 ,解得
To masi 和 Kanade[2] 基于仿射投影模型提出 了射影重建的矩阵分解方法 , 随后由 St urm 和 Triggs[3] 扩展到了透视投影模型. 矩阵分解方法 作为一种批量方法 ,它基于成熟的数学工具 SVD 分解[4] ,相对于射影重建的序贯方法[5 ] 拥有算法 执行效率高 、误差分布均匀且不用考虑重影效 果[6] 等优点 ;但目前矩阵分解方法受限于两大主
与原 PF 不同的是线性方程组需要按情况加上权 值βj , i 和 w j , i .
2 实验结果与分析
实验基于标准图像序列 Dino saur 和 Castle. Dino saur 图像序列视图数为 36 , 三维点个数为 4 983 ,数据缺失率高达 90. 84 % ,实验结果如图 1 所示 ,图 1 (c) 中 ,白色表示现存数据而黑色表示 缺失数据 ;Castle 图像序列包括一个静态三维场 景的 27 幅视图 ,三维点个数为 1 961 ,数据缺失率 为 77. 89 %(图略) .
3D reconstruction with minimum reprojection error using PFR
X u Fan W an g H on g y uan Fan g L ei T i an W en
(Depart ment of Elect ronics and Info rmation Engineering , Huazho ng U niversity of Science and Technology , Wuhan 430074 , China)
的形式代入代价函数 ,有
∑ φ =
[ ( uj , i - β P j , i i ,1 Xj ) 2 + ( vj , i -
ij
βj , i P i ,2 Xj ) 2 + w j , i ( 1 - β P j , i i ,3 Xj ) ] ,
(5)
式中 w j , i是对应 x j , i的权值 ,用来使代价函数φ逼
Abstract : On t he basis of Power Factorizatio n ( PF) , a linear Power Factorizatio n rep rojectio n ( PFR) met hod is p resented , in which 2D rep rojectio n error was minimized by using p rojective reco nst ructio n. This algorit hm was inspired by Hartley′s PF met hod for affine reco nst ructio n. The no nlinear rep rojec2 tio n error was t ransferred to a t rilinear co st f unctio n , and a weighted alternated least square met ho d was performed between t he st ruct ure , motio n and p rojective dept h , which can achieve rep rojectio n er2 ror minimizatio n. We show experimentally t hat o ur met hod can be used as a boot st rap or co mpo site for t he standard bundle adjust ment , which speed t he overall reco nst ructio n performance up to 30 %. Key words : p rojective reco nst ructio n ; Power Factorizatio n ( PF) ; mat rix factorizatio n ; rep rojectio n er2