kinect三维重建

合集下载

基于Kinect的三维重建

基于Kinect的三维重建

基于Kinect-OpenNI-OpenCV-OpenGL的环境三维重构项目源码详见:/forum/viewtopic.php?f=1&t=13042前几天刚入手了期待已久的Kinect ,用于实验室机器人项目的视觉导航与环境理解。

首先要做的是破解-->连接PC-->获取深度数据和图像数据-->三维点云显示这么几项基本工作。

开始仿照的是饮水思源[1]博客的方法(使用VS2008在windows平台上试用Kinect[2]),利用CL-NUI-Platform 来破解,它的最新版是1.0.0.1210,但我在XP上用会当机,后来换1.0.0.1121 版的就可以用了。

CL NUI 提供了十分简便易用的接口,在OpenCV 上调用很简单,另外它还提供了Kinect 底座马达的控制接口和LED 灯颜色的选择接口,其例程中可以操控Kinect 上下摆动。

如果只需要获取深度数据和图像数据,CL NUI 就够用了。

不过要做深入的应用,比如人体姿态识别、骨架提取、深度数据与图像数据的合并等等,就该用到OpenNI 了。

国的CNKINECT[3]是个不错的Kinect 开发论坛,版块丰富,有很多资料可供借鉴。

我通过论坛介绍的方法[4]成功配置了OpenNI + Kinect,先是用最新版的OpenNI+SensorKinect+NITE ,但在XP 下不能正常运行,可能跟 .net 平台有关,老实按上面论坛的方法装就成功了。

另外用CMake + VS2008 装了最新的OpenCV_SVN,开始试过在CMake 里选择With TBB,但诡异的是TBB 似乎只适用于VS2005,在VS2008 编译后试用里面的samples 老是提示报错找不到msvcp80.dll,重新用CMake 配置取消了With TBB,就一切正常了。

[编辑]一、深度摄像机的视角调整与深度/彩色图像的合并通过研究OpenCV_SVN 与OpenNI 相关的代码(cap_openni.cpp)发现,OpenCV 目前只支持对Kinect的深度图、视差图和彩色/灰度图及相关属性的读取,更进一步的设置还没有实现。

基于Kinect的旋转刚体三维重建方法

基于Kinect的旋转刚体三维重建方法
I S U A N J I Y U X I A N D A I H U A
总第 2 2 5 期
基于 K i n e c t 的旋 转 刚体 三 维重 建方 法
韦羽棉 , 尚赵伟
( 重庆 大学计算机 学院, 重庆 4 0 0 0 3 0 )
摘要 : 针 对在 非匀速非 定轴旋转条件 下利 用 K i n e c t 进行 刚体 三维重建问题 , 提 出一种 改进 的基 于 K i n e c t 传感 器的旋转刚 体三维重建方法。首先利 用 K i n e c t 采集深度图像 , 然后 用改进 的加权 I C P ( h e r a t i v e C l o s e s t P o i n t ) 算 法在 非 匀速非 定轴旋
( C o l l e g e o f C o m p u t e r S c i e n c e ,C h o n g q i n g U n i v e r s i t y ,C h o n g q i n g 4 0 0 0 3 0 , C h i n a ) Ab s t r a c t : A i mi n g a t t h e p r o b l e m o f u s i n g K i n e c t f o r i r g i d o b j e c t 3 D r e c o n s t r u c t i o n u n d e r t h e c o n d i t i o n o f n o n - - i f x e d a x i s a n d n o n ・ ・ u n i f o r m r o t a t i o n , t h i s p a p e r p r e s e n t s 8 1 ' 1 i m p r o v e d i r g i d o b j e c t 3 D r e c o n s t r u c t i o n m e t h o d b a s e d o n K i n e c t s e n s o r .F i s r t , t h e d e p h t i m a g e i s a c q u i r e d b y t h e K i n e c t d e p t h c a m e r a .T h e n he t i mp r o v e d w e i g h t e d I C P( I t e r a t i v e C l o s e s t P o i n t )a l g o i r t h m i s u s e d o f r

基于Kinect与PCL的三维重建系统研究的开题报告

基于Kinect与PCL的三维重建系统研究的开题报告

基于Kinect与PCL的三维重建系统研究的开题报告一、研究背景和意义随着虚拟现实、增强现实技术等新兴技术不断发展,三维重建技术也逐渐成为研究热点。

在工业、文化遗产保护、医学等领域,三维重建技术具有广泛的应用前景。

传统的三维重建技术主要基于摄像机、激光雷达等主流设备,但这些设备昂贵、操作复杂,且在室内场景中容易受到光线的影响。

相比之下,基于Kinect和PCL库的三维重建技术更加便捷、快速、精确。

因此,本研究将探讨基于Kinect和PCL的三维重建技术,并将其应用于实际场景中。

二、研究内容和方法本研究将主要分为以下几个部分:1. 系统搭建和环境配置:在搭建三维重建系统前,需要对Kinect和PCL库进行环境配置。

本研究将详细介绍Kinect和PCL库的安装和配置方法。

2. 数据采集与处理:本研究将使用Kinect采集实际场景三维数据,并使用PCL库进行处理。

首先,需要对数据进行滤波处理和信号增强,提高数据的精度和稳定性。

然后,对数据进行配准和重建,生成三维重建模型。

3. 算法优化和实现:本研究将对PCL库中的基本三维重建算法进行分析和优化,力求提高算法效率和重建精度。

然后,将算法实现到三维重建系统中,实现实时三维重建。

4. 系统测试和评价:最后,本研究将对三维重建系统进行测试和评价,以验证其重建精度、效率和可靠性。

三、研究预期成果本研究期望得到以下预期成果:1. 基于Kinect和PCL库的三维重建系统:实现基于Kinect和PCL的三维重建系统,并提供用户友好的界面。

2. 三维重建算法优化:通过分析和优化PCL库中的基本三维重建算法,提高算法效率和重建精度。

3. 实际场景数据重建:使用系统生成三维模型对实际场景进行重建,并进行评估和分析。

四、研究计划研究计划如下:1. 第一阶段(2022年6月至2022年9月):系统搭建和环境配置。

学习Kinect和PCL库的基本原理和库函数,完成环境配置。

2. 第二阶段(2022年9月至2023年3月):数据采集与处理。

基于Kinect的动态人体三维重建的开题报告

基于Kinect的动态人体三维重建的开题报告

基于Kinect的动态人体三维重建的开题报告一、选题背景随着虚拟现实技术的不断发展,动态人体三维重建的需求也越来越大。

这种技术可以应用于游戏、电影等领域,能够实现真实逼真的人体动态效果。

目前,基于Kinect的动态人体三维重建技术已经比较成熟,但是仍然存在一些问题,如精度不高、容易受到环境因素的影响等。

因此,本文将从这些问题出发,研究如何提高基于Kinect的动态人体三维重建的精度和可靠性。

二、研究内容1. 研究基于Kinect的动态人体三维重建的原理和技术路线;2. 分析当前基于Kinect的动态人体三维重建存在的问题;3. 探索如何提高基于Kinect的动态人体三维重建的精度和可靠性,包括优化算法、增强环境稳定性等;4. 设计实验并进行验证,评估提出的方法的有效性和可行性;5. 结合实际应用场景,综合考虑Kinect设备的性能、场景复杂度等因素,提出应对不同场景下的动态人体三维重建技术方案。

三、研究意义本研究的成果不仅可以提高基于Kinect的动态人体三维重建的应用价值,还可以为其他相关领域的研究提供思路和方法,如虚拟试衣、医学影像等。

此外,本研究也有助于探索虚拟现实技术的应用前景和发展方向。

四、研究方法和技术路线本研究主要采用实验室实验和实际场景测试相结合的方法。

具体的技术路线如下:1. 建立基于Kinect的动态人体三维重建的数学模型和算法;2. 使用Kinect设备采集动态人体图像序列,并对图像序列进行预处理和实时处理;3. 基于已有算法提取肢体关节点、重建人体骨架、生成人体模型;4. 优化算法,提高重建的精度和稳定性;5. 构建实验场景,进行实验验证;6. 对实验结果进行分析和评估;7. 对提出的方法进行应用场景测试并给出方案。

五、预期结果本研究旨在提高基于Kinect的动态人体三维重建的精度和可靠性。

预期可以实现以下结果:1. 实现基于Kinect的动态人体三维重建,达到一定的精度要求;2. 提出优化方案,使得重建的精度和稳定性更好;3. 探索应对不同场景下的动态人体三维重建技术方案。

Kinect实现简单的三维重建

Kinect实现简单的三维重建

Kinect实现简单的三维重建Kinect实现简单的三维重建标签:Kinect三维重建OpenFrameworks2013-03-29 13:028418人阅读评论(71)收藏举报分类:Kinect(1)OpenFrameworks(3)版权声明:本文为博主原创文章,未经博主允许不得转载。

Kinect想必大家已经很熟悉了,最近基于Kinect的创意应用更是呈井喷状态啊!看到很多国外大牛用Kinect做三维重建,其中最著名的要数来自微软研究院的Kinect Fusion了,可以看看下面这个视频/show/7q2Sa__pa4-rWcAVtB3Xuw...html,或者/v_show/id_XNDcxOTg3MzUy.html。

可惜Kinect Fusion是不开源的,不过PCL实现了一个差不多的开源版本,/。

有兴趣同时电脑配置高的朋友可以研究一下。

最近比较闲,有一点手痒,想自己做一个三维重建,不过肯定不会像Kinect Fusion那么强大,只是自己练练手、玩玩而已。

代码在最后有下载。

1. 获取Kinect深度图:首先我使用微软官方的Kinect SDK来控制Kinect,三维绘图我选用了OpenFrameworks。

OpenFrameworks(以后简称OF)是一个开源的公共基础库,将很多常用的库统一到了一起,比如OpenGL,OpenCV,Boost等等,而且有大量的第三方扩展库,使用非常方便。

具体可见/。

在一切开始之前,我们需要对OpenGL和三维场景做一些设置:[cpp] view plaincopyvoid testApp::setup(){ //Do some environment settings. ofSetVerticalSync(true); ofSetWindowShape(640,480); ofBackground(0,0,0); //Turn on depth test for OpenGL.glEnable(GL_DEPTH_TEST);glDepthFunc(GL_LEQUAL);glShadeModel(GL_SMOOTH); //Put a camera in the scene. m_camera.setDistance(3);m_camera.setNearClip(0.1f); //Turn on the light. m_light.enable(); //Allocate memory to store point cloud and normals.m_cloud_map.Resize(DEPTH_IMAGE_WIDTH,DEPTH_I MAGE_HEIGHT);m_normal_map.Resize(DEPTH_IMAGE_WIDTH,DEPTH_I MAGE_HEIGHT); //Initialize Kinect.InitNui(); }OF是使用OpenGL进行绘图的,所以可以直接使用OpenGL 中的函数(以gl开头),为了方便,OF还自己封装了一些常用函数(以of开头)。

基于Kinect的室内场景三维重建共3篇

基于Kinect的室内场景三维重建共3篇

基于Kinect的室内场景三维重建共3篇基于Kinect的室内场景三维重建1随着科技的不断发展,人工智能、计算机视觉等领域正在逐步改变人们的生活方式和工作方式。

在这些技术中,Kinect作为一种能够实现深度感知、人体识别等功能的传感器,其应用领域也越来越广泛。

其中,基于Kinect的室内场景三维重建技术,成为了近年来备受关注的研究方向之一。

一、Kinect技术概述Kinect是由微软公司开发的一个结合了摄像头、深度感知器和麦克风的设备,通过人体轮廓的捕捉和分析,实现人体动作捕捉等各种应用。

Kinect可以通过红外光点的反射、深度感应的计算等技术,将人体的各种动作准确地捕捉到计算机中,并将其转化为计算机能够识别和处理的数据。

二、室内场景三维重建技术室内场景三维重建技术利用计算机视觉技术和三维重建算法,将室内场景或对象的图像和数据转化为三维建模,进而实现对室内场景或对象的快速、精确的重建、分析和数字化。

基于Kinect技术的室内场景三维重建技术,利用Kinect设备可以实时获取场景中的深度图像等数据,并通过循环设备测距算法将这些数据转换为三维坐标信息。

然后,根据这些坐标信息,可通过三维重建算法,对室内场景进行建模和重建。

三、基于Kinect的室内场景三维重建的应用1. 建筑物侦查利用Kinect设备,可快速捕捉建筑物内部空间的三维模型信息,对现场进行快速、准确的测量和分析,为建筑物改建、翻新和维护提供重要的数据支持。

2. 教育仿真基于Kinect的室内场景三维重建技术,可用于创建虚拟实验室、仿真实验场景、虚拟教学交互等,为学生提供更加生动、直观、互动的学习体验。

3. 游戏开发基于Kinect的室内场景三维重建技术,可用于游戏场景的建模与重建,在游戏中创造更加真实、生动的虚拟世界,提高玩家的游戏体验。

四、基于Kinect的室内场景三维重建技术存在的问题及解决方案1. 对环境的要求高Kinect设备对环境要求较高,对灯光、噪声、阴影等都有严格的限制。

基于Kinect的三维场景重建研究的开题报告

基于Kinect的三维场景重建研究的开题报告

基于Kinect的三维场景重建研究的开题报告一、研究背景随着计算机图形学、数字图像处理、立体视觉等技术的不断发展,三维场景重建技术应用越来越广泛。

已经广泛用于建筑测量、室内设计、工业设计、影视制作、虚拟现实等领域。

但传统的三维重建技术需要特定的硬件设备,例如激光雷达、摄像机等,成本较高。

而基于Kinect深度摄像头的三维场景重建技术具有成本低、精度高、控制方便等优点,越来越受到研究者的重视。

二、研究目的本文旨在开发一种基于Kinect深度摄像头的三维场景重建技术,并提出一种有效的算法用于获取三维点云数据,并进行场景重建,以实现高效、准确的三维建模。

三、研究内容1.调研已有的三维重建技术和Kinect相关技术,分析它们的优缺点。

2.设计并实现基于Kinect的三维场景重建系统,包括深度图像获取、点云数据获取、数据处理和三维场景重建。

3.提出一种基于点云数据的三维建模算法,解决点云数据的无序性和噪声问题,并实现场景的可视化重建。

4.验证系统的可行性和效果,并进行实验比较。

四、研究意义本文的研究可以为基于Kinect的三维场景重建技术的发展提供一定的参考和帮助,提供一种低成本、高精度的三维重建解决方案,对相关产业的发展和应用也有着重要的促进作用。

五、研究方法和技术路线本文采用了文献研究、实验研究、数值模拟等方法,采用C#语言、OpenCV、PCL等工具,设计了基于Kinect深度摄像头的三维场景重建系统,提出了基于点云数据的三维建模算法,并在实验中对系统进行了验证和比较。

六、预期成果预期完成一份论文,能够阐述基于Kinect的三维场景重建技术的研究内容、研究方法、实现过程和效果验证。

同时,还将提供基于该技术的三维重建系统软件,实现三维场景重建功能。

七、进度安排第一季度:调研已有的三维重建技术和Kinect相关技术,梳理方法和技术路线,初步设计三维场景重建系统。

第二季度:设计并实现基于Kinect的三维场景重建系统,包括深度图像获取、点云数据获取、数据处理和三维场景重建。

kinect fusion算法

kinect fusion算法

kinect fusion算法摘要:1.引言2.Kinect Fusion算法概述3.算法原理3.1 点云处理3.2 表面重建3.3 优化与可视化4.应用领域5.算法优缺点6.总结正文:【引言】在计算机视觉和增强现实领域,Kinect Fusion算法独树一帜。

它通过将多个Kinect传感器采集的数据进行融合,实现对场景的实时三维重建。

本文将对Kinect Fusion算法进行详细解析,带你领略其魅力所在。

【Kinect Fusion算法概述】Kinect Fusion算法是一种基于Kinect传感器的三维重建技术。

它通过实时捕捉场景中的深度信息和彩色信息,对场景进行三维重建。

与其他三维重建方法相比,Kinect Fusion算法具有更高的实时性和准确性。

【算法原理】Kinect Fusion算法主要包括以下三个部分:【3.1 点云处理】Kinect传感器捕捉到的深度数据是连续的深度值,需要将这些深度值转化为点云数据。

点云数据是由一系列三维坐标点组成的数据集,能更好地反映场景中的物体形状和位置信息。

【3.2 表面重建】在得到点云数据后,需要对点云数据进行表面重建。

表面重建的目的是从点云数据中提取出物体的表面信息,以便后续处理。

常用的表面重建方法有Poisson表面重建、球形重建等。

【3.3 优化与可视化】表面重建完成后,需要对结果进行优化和可视化。

优化主要包括降噪、平滑等处理,以提高表面质量。

可视化则是将重建结果以直观的方式展示出来,便于用户观察和分析。

【应用领域】Kinect Fusion算法在许多领域都有广泛应用,如虚拟现实、增强现实、机器人导航等。

通过实时三维重建,Kinect Fusion算法为这些领域提供了强大的技术支持。

【算法优缺点】Kinect Fusion算法具有以下优点:1.实时性:能够实时捕捉场景信息并进行三维重建。

2.准确性:与其他三维重建方法相比,Kinect Fusion算法具有较高的准确性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

上海大学2014 ~2015学年秋季学期研究生课程考试课程设计大作业课程名称:建模与仿真课程编号: 09SAS9011论文题目: 基于Kinect的三维重建研究生姓名: 邵军强学号: 14721629 论文评语:成绩: 任课教师:评阅日期:基于Kinect的三维重建邵军强(上海大学机电工程与自动化学院)摘要:三维重建是计算机视觉的一个重要目标,可以帮助人们快速精确地将日常生活中的物体数字化,并有着广泛的应用前景。

本文叙述了一种成本低廉、快速且操作简便的三维重建方法。

借助于微软公司的Kinect 体感传感器作为采集深度图像和彩色图像的输入设备,通过对原始深度图像的去噪、平滑、表面重建等一系列方法,最终可以获得在三维空间中的点云模型。

关键词:三维重建,Kinect,点云模型Based on Kinect 3D ReconstructionSHAO JUNQIANG( Shanghai University EMSD and automation College)Abstract:3 D reconstruction is an important goal of computer vision, and can help people quickly and accurately to digital objects in everyday life, and has a broad application prospect. This paper describes a kind of low cost, quick and easy operation method of 3 d reconstruction. By using Microsoft's device body feeling sensor as a collection of depth image and color image input device, through the depth of the original image denoising and smoothing, surface reconstruction and a series of methods, finally can get the point cloud model in three-dimensional space.Keywords:3D Reconstruction,Kinect, point cloud model1 引言Kinect 传感器是一种RGB-D 传感器,即可以同时获得环境颜色值(RGB)和深度值(depth)的传感器.它的采集速度快,精度高,且价格低廉,使其迅速被运用到很多领域.机器人领域也开始了对Kinect 传感器广泛的研究[1].利用Kinect 传感器对室内环境进行3D 重构,获得环境的3D 点云模型是研究热点之一.华盛顿大学与微软实验室[2],开发了基于SIFT (尺度不变特征变换)特征匹配定位及TORO(Tree-basednetwORk Optimizer)优化算法的实时视觉SLAM系统来建立3D 点云地图.德国Freiburg 大学[3]提出了RGBD-SLAM 算法,采用了与华盛顿大学类似的方法,但是为了提高实时性,使用了Hogman(hierarchical optimization for pose graphs on manifolds)图优化算法,同时在相对位姿检测上采用了SURF (加速鲁棒特征)特征进行对应配.KinectFusion 算法与这些算法不同,它仅使用深度信息,通过设计高效及高度并行的算法在GPU(图形处理单元)上运行达到了非常高的实时性,在试验中,在配置4000 元左右的电脑上运行速度达到了18 帧/秒(在同样配置的计算机上前面两种算法仅达到2 帧/秒),在进行场景建立时有良好的用户体验,甚至可以用来做一些人机交互方面的应用[4-5].同时KinectFusion 采用了基于TSDF(truncated signed distancefunction)模型的点云融合方法,构建的点云模型冗余点少.而前面的方法因为没有进行点云融合,所以在地图创建过程中,点云的容量将不断增加[1].除此之外,KinectFusion 算法也存在一些问题,由于其重建过程是在GPU上的实时重建,因此,受GPU 内存限制,只能建立较小规模环境。

其算法注重效率的提升,在鲁棒性方面有不足之处,比如在一些环境中容易出现定位失效而无法正常建模。

2 Kinect 传感器Kinect 传感器如图1,它包括随机红外点云投射器、红外相机和彩色相机.图1 Kinect传感器结构红外点云投射器和红外相机构成了一个结构光3D 成像系统[8].Kinect可以同时采集到环境的深度信息数据和颜色信息数据,其中深度信息数据是一个2 维矩阵,它的元素值表示环境中物体到相机中心的距离值,可以作为灰度图像进行处理.不同于普通的通过计算得到物体3D坐标的设备,Kinect可以直接获取物体与摄像头之间的距离,这是Kinect最受人瞩目的一个功能。

微软先后于2009年和2010年收购了3DV Systems(TOF)和PrimeSense(Light Coding)这两家以色列公司,并最终采用了Light Coding 技术作为Kinect体感设备的深度摄像功能的基础。

Light Coding技术理论是利用连续光(近红外线)对测量空间进行编码,经感应器读取编码的光线,交由晶片运算进行解码后,产生一张具有深度的图像。

Light Coding技术说到底还是结构光技术。

但与传统的结构光方法不同的是,他的光源打出去的并不是一副周期性变化的二维的图像编码,而是一个具有三维纵深的“体编码”。

这种光源叫做激光散斑(laser speckle),是当激光照射到粗糙物体或穿透毛玻璃后形成的随机衍射斑点。

这些散斑具有高度的随机性,而且会随着距离的不同变换图案,空间中任何两处的散斑都会是不同的图案,等于是将整个空间加上了标记,所以任何物体进入该空间以及移动时,都可确切记录物体的位置。

光源标定:测量前对原始空间的散斑图案做记录,先做一次光源的标定,方法是每隔一段距离,取一个参考平面,把参考平面上的散斑图案记录下来;假设Kinect规定的用户活动范围是距离摄像头1~4m,每隔10cm取一个参考平面,标定后保存了30幅散斑图像;测量时拍摄一幅待测场景的散斑图案,将这幅图像和保存的30幅参考图像依次做互相关运算,得到30幅相关度图像;空间中有物体存在的位置,在相关度图像上就会显示出峰值。

把这些峰值一层层叠在一起,经过插值运算,即可得到整个场景的三维形状。

Kinect就是以红外线发出人眼看不见的class 1镭射光,透过镜头前的diffuser(光栅)将镭射光均匀分布投射在测量空间中,再透过红外线CMOS传感器记录下空间中的每个散斑,结合原始散斑图案,再透过晶片计算成具有3D深度的图像。

传感器是通过黑白光谱的方式来感知环境的,纯黑代表无穷远,纯白代表无穷近,黑白间的灰色对应着物体到传感器的物理距离,如图2。

图2 Kinect激光点阵Kinect 的主要技术参数如图3:检测距离0.5m~ 7m,检测角度水平方向57◦,竖直方向43◦,采集帧率为30 帧/秒,误差在4m 远处为1.4%.图3 Kinect相关参数3 KinectFusion 算法KinectFusion 算法通过将Kinect 采集到的深度数据进行匹配定位与融合来实现3D 场景重构.它的算法流程如图4[4] 所示,主要由4 个部分组成:a) 深度数据处理,是将传感器原始的深度数据转换成3D 点云,得到点云中顶点的3 维坐标和法向量;b) 相机跟踪,是将当前帧3D 点云和由现有模型生成的预测的3D 点云进行ICP 匹配,计算得到当前帧相机的位姿;c) 点云融合,是根据所计算出的当前相机位姿,使用TSDF 点云融合算法[9]将当前帧的3D 点云融合到现有模型中;d) 场景渲染,是使用光线跟踪的方法,根据现有模型和当前相机位姿预测出当前相机观察到的环境点云,一方面用于反馈给用户,另一方面提供给b) 进行ICP 匹配.图4 KinectFusion 算法流程图4、KinectFusion 对原始深度图的处理由于获得的原始深度图像据有较多的噪点,不利于基于ICP算法的相机姿态追踪。

所以需要对原始深度图做去噪处理以增加配准的准确度和速度。

双边滤波是比较理想的滤波方法。

双边滤波是一种保边缘的光滑图象处理技术,它可以追溯到1995 年Aurich和Weule [9]非线性高斯滤波器的工作,他后来被Smith 和Brady[10]重新发现,并且作为其SUSAN 框架的一部分,Tomasi 和Manduchi[11]给出了它目前的名称。

自那时以来,双边滤波的使用迅速发展和普及,现在在图像处理中的应用已经随处可见,它已被用于多中应用领域,在理论和应用方面都有了很大的发展。

理论上,双边滤波和robust statistics, PDEs, Local mode filtering 一样,是一种各向异性扩散方法[12],它是几种框架连接的桥梁。

双边滤波的两种加速算法,一种是分段线性近似[13],即将双边滤波线性化并用下采样来加速,这种算法极大地降低了运算时间,但是并没有理论基础,近似的精度也不清楚。

另一种是将双边滤波表示成较高维空间的卷积[14],而卷积计算可以进行下采样,并不明显影响结果的准确性。

这种近似算法实现了几个数量级的加速。

再有就是双边滤波器两个参数的选取,可以自适应地根据噪声选取参数,能得到最好的滤波效果,而且省去了以往实验多次来选择参数的麻烦。

双边滤波的广泛应用是因为它有以下几个特征:1、表述简单:每个像素被相邻像素的加权平均所取代。

这个方面是重要的,因为它更容易获得有关其行为的直觉,更容易适应特定要求的应用并实现它。

2、效果完全取决于两个参数,这两个参数表示保持图像特征的大小和对比度。

3、可用于非迭代的方式。

这些参数不具有累积性的迭代,这使得参数易于设置。

4、可以以一种交互的速度计算大的图象,这要基于有效的计数算法,如果图形硬件是可用的,甚至可以实时计算[15]。

5 KinectFusion 中的ICP 定位方法ICP 定位环节将当前帧3D 点云和预测得到的3D 点云进行匹配时,由以下步骤来实现:A) 利用投影法来确定对应点关系.用一个2 维ICP 来表示其过程,如图5 所示.图5(a) 中黑色曲线是环境中的物体,相机在连续两个位置分别对其进行采样和预测,O k 和O k−1 分别是当前相机和前一帧相机的坐标系原点.首先将k 和k−1 时刻的两个点云都转换到当前帧k 的相机坐标系下,然后将两个点云通过相机中心O k 向像平面上投影,两个点云中具有相同的像平面上的投影点的点即为对应点,如图5(b) 中的P1 和P2 两点.算法中还通过对应点间的欧氏距离和法方向夹角来对对应点进行筛选.图5 2D 的ICP 例子示意图B) 利用点到平面的误差机制来衡量当前相对位姿的准确度.如图5(b) 所示,在2 维情况下,P1 和P2 间的误差为P1 到P2 点的切线的距离d.所有对应点间的总误差公式如下:其中Ω(u) ∅表示当前点云中的一个点u存在对应点,T g,k 是一个4×4 的位姿矩阵,表示当前帧相机在世界坐标系下的绝对位姿,世界坐标系定义为第一帧的相机坐标系,k(u) 为当前帧中u点的顶点坐标,是u点在预测帧中对应点的顶点坐标,为对点的法向量.C) 通过优化式(1) 得到最佳的相对位姿T g,k.采用线性化的方法将优化问题转化为一个最小二乘优化,通过计算一个线性方程组如式(2) 来计算最优解x.其中,,,D) 迭代A) ~B)10 次.6 KinectFusion 中的TSDF 点云融合算法TSDF 算法用一个立方体栅格来表示3 维空间(如图4步骤(c)),立方体中每一个栅格存放的是该栅格到物体模型表面的距离,同时使用正负来表示在表面被遮挡一侧和可见一侧,而过零点就是表面上的点,如图6 中左侧的立方体中的一个物体模型.当有新的数据需要加入模型时会按照式(3)和(4),进行融合处理,式中i+1 表示当前点云对应的栅格距离值,i 表示原有的栅格距离值,同一个栅格的距离值通过一个权重W 来进行融合,新的权重为两个权重之和,示意图如图6 中右侧.在KinectFusion 算法中当前点云的权重为1.图6 基于空间体的点云融合这种方法是具有最小二乘优化性质的,同时使用了权重值来进行融合,对传感器的一些噪声具有一定的抑制作用{1}。

相关文档
最新文档