视频拼接关键技术

全景视频拼接关键技术

作者：一、原理介绍

图像拼接(Image Stitching)是一种利用实景图像组成全景空间的技术，它将多幅图像拼接成一幅大尺度图像或360度全景图，图像拼接技术涉及到计算机视觉、计算机图形学、数字图像处理以及一些数学工具等技术。图像拼接其基本步骤主要包括以下几个方面：摄相机的标定、传感器图像畸变校正、图像的投影变换、匹配点选取、全景图像拼接（融合），以及亮度与颜色的均衡处理等，以下对各个步骤进行分析。

摄相机标定

由于安装设计，以及摄相机之间的差异，会造成视频图像之间有缩放（镜头焦距不一致造成）、倾

斜（垂直旋转）、方位角差异（水平旋转），因此物理的差异需要预先校准，得到一致性好的图像，便于

后续图像拼接。作者：

相机的运动方式与成像结果之间的关系见下图。

图1：相机的运动方式与成像结果之间的关系

图像坐标变换

在实际应用中，全景图像的获得往往需要摄像机以不同的位置排列和不同的倾角拍摄。例如由于机

载或车载特性，相机的排列方式不尽相同，不能保证相机在同一面上，如柱面投影不一定在同一个柱面上，平面投影不一定在同一平面上；另外为了避免出现盲区，相机拍摄的时候往往会向下倾斜一定角度。

这些情况比较常见，而且容易被忽略，直接投影再拼接效果较差。因而有必要在所有图像投影到某个柱

面（或平面）之前，需要根据相机的位置信息和角度信息来获得坐标变换后的图像。

理论上只要满足静止三维图像或者平面场景的两个条件中的任何一个，两幅图像的对应关系就可以

用投影变换矩阵表示，换句话说只要满足这其中任何一个条件，一个相机拍摄的图像可以通过坐标变换

表示为另一个虚拟相机拍摄的图像。作者：

一般情况下8参数的透视投影变换最适合描述图像之间的坐标关系，其中8参数的矩阵为

[m0,m1,m2; m3,m4,m5; m6,m7,1]；各参数对应的相机运动表示如下：

如图2显示的是相机向下倾斜一定角度拍摄图像，这个角度与m6和m7具有对应关系，如果要获得校正图像，只需要对8参数矩阵求逆后进行坐标变换。

(a) 原始图像

(b)x方向形变效果(c)倾斜校正后效果

图2：(a) 原始图像；(b)x方向形变效果；(c)倾斜校正后效果

图像畸变校正

由于制造、安装、工艺等原因，镜头存在着各种畸变。为了提高摄像机拼接的精度，在进行图像拼接的时候必须考虑成像镜头的畸变。一般畸变分为内部畸变和外部畸变，内部畸变是由于摄影本身的构造为起因的畸变，外部畸变为投影方式的几何因素起因的畸变。镜头畸变属于内部畸变，由镜头产生的畸变一般可分为径向畸变和切向畸变两类。作者：

径向畸变就是集合光学中的畸变像差，主要是由于镜头的径向曲率不同而造成的，有桶形畸变和枕型畸变两种。切向畸变通常被人为是由于镜头透镜组的光学中心不共线引起的，包括有各种生成误差和装配误差等。一般人为，光学系统成像过程当中，径向畸变是导致图像畸变的主要因素。

径向畸变导致图像内直线成弯曲的像，且越靠近边缘这种效果越明显。根据径向畸变产生的机理，对视频图像进行校正。效果如图3(b)所示，经过校正的图像，其有效像素区域缩小，一般可通过电子放大的方式进行校正，如图3(c)所示。

(a)

(b) (c)

分布式大屏幕拼接器技术方案.

显约XNET网络分布式处理器技术方案北京显约科技有限公司

目录 XNet分布式处理器介绍----------------------------------------3 XNet分布式处理器系统组成----------------------------------3 XNet系统连接图-------------------------------------------------3 XNet的主要技术特点-------------------------------------------5 XNet的设备性能指标-------------------------------------------6 XNet分布式处理器与传统集中式处理器比较------------14 XNet分布式处理器与其他分布式处理器比较------------15 XNet系统管理软件---------------------------------------------18 XNet系统设备清单---------------------------------------------25 XNet工程案例---------------------------------------------------26

XNet分布式处理器介绍分布式图像控制系统是基于传统集中式控制器的缺点及新的市场发展趋势而出现的。分布式图像控制系统就是以嵌入式系统为平台，以专有实时图像编解码算法为手段，以高速以太网为通道，实现大屏幕拼接墙高性能高灵活性的显示控制解决方案。 XNet是显约科技公司自主研发的国内首创的一款大屏幕拼接产品。他将计算机领域复杂的高带宽网络技术应用于视频数据交换，通过网络交换技术，可灵活的将大量的、多样化的视频源连接至同样大量的、多样化的输出设备上，实现视频的缩放、跨屏、漫游等功能。 XNet分布式处理器系统组成系统由输入节点、输出节点、千兆交换机、和控制节点（普通PC）及网线组成。输入节点采集视频信号并将它们转化为可被输出端点接收的通用格式，输出节点接收此格式信号并将它们转化为显示器可显示的格式。所有的XNet端点都通过交换机互联，交换机负责输入到输出的数据传输。 XNet系统连接图

基于SIFT特征向量的图像拼接技术研究

基于SIFT特征向量的图像拼接技术研究摘要图像拼接技术是数字图像处理邻域的一个研究热点，一直是计算机视觉、模式识别、医学等领域研究的一个重要课题，图像拼接技术也是图像处理工作中的关键技术之一。所谓图像拼接就是将有重叠的图像无缝拼成一幅大宽视域图像的技术。它包含两个关键技术：图像配准和图像融合。近年来，随着技术的成熟，图像拼接技术被很好的应用到了机器人导航、无人平台战场监控、航拍图像处理等多个领域。基于特征的图像配准与拼接技术配准结果准确拼接效果良好且不易受光照、旋转等因素的影响是当前图像配准与拼接领域研究的热点。本文在深入研究和学习已有的基于SIFT的图像配准与拼接技术的基础上，详尽地分析了现有算法的不足，并提出了若干改进算法。关键字：图像拼接，特征，线段特征，图像融合 Image splicing technology research based on SIFT feature vector abstract Image splicing technology is a research focus in the neighborhood of digital image processing, has been the computer vision, pattern recognition, an important hot topic in the field of medicine and other fields, image splicing technology is one of the key technologies of image processing work. The so-called image mosaicing is there will be overlapping images seamless Mosaic a big wide horizon image technology. It includes two key techniques: image registration and image fusion. In recent years, with mature technology, image splicing technology is very good application in robot navigation, unmanned platform battlefield monitoring, aerial image processing and other fields. Based on the characteristics of image registration and Mosaic registration results are accurate stitching effect is good and not easily influenced by factors such as illumination, rotation is the hotspot in research of image registration and Mosaic. Based on the in-depth research and study of the existing image registration based on SIFT and splicing technology, on the basis of the shortage of the existing algorithm is analyzed in detail, and puts forward some improved algorithm. The keyword：Image stitching, features, line features, image fusion 目录第一章绪论 (2) 1.1研究背景和意义 (2) 1.2国内外研究现状 (3) 1.3研究内容 (4) 第二章图像拼接的相关理论基础 (6) 2.1图像拼接的基本流程 (6)

全景拼接算法简介

全景拼接算法简介罗海风 2014.12.11 目录 1.概述 (1) 2.主要步骤 (2) 2.1. 图像获取 (2) 2.2鱼眼图像矫正 (2) 2.3图片匹配 (2) 2.4 图片拼接 (2) 2.5 图像融合 (2) 2.6全景图像投射 (2) 3.算法技术点介绍 (3) 3.1图像获取 (3) 3.2鱼眼图像矫正 (4) 3.3图片匹配 (4) 3.3.1与特征无关的匹配方式 (4) 3.3.2根据特征进行匹配的方式 (5) 3.4图片拼接 (5) 3.5图像融合 (6) 3.5.1 平均叠加法 (6) 3.5.2 线性法 (7) 3.5.3 加权函数法 (7) 3.5.4 多段融合法（多分辨率样条） (7) 3.6全景图像投射 (7) 3.6.1 柱面全景图 (7) 3.6.2 球面全景图 (7) 3.6.3 多面体全景图 (8) 4.开源图像算法库OPENCV拼接模块 (8) 4.1 STITCHING_DETAIL程序运行流程 (8) 4.2 STITCHING_DETAIL程序接口介绍 (9) 4.3测试效果 (10) 5.小结 (10) 参考资料 (10) 1.概述全景视图是指在一个固定的观察点，能够提供水平方向上方位角360度，垂直方向上180度的自由浏览（简化的全景只能提供水平方向360度的浏览）。目前市场中的全景摄像机主要分为两种：鱼眼全景摄像机和多镜头全景摄像机。鱼眼全景摄像机是由单传感器配套特殊的超广角鱼眼镜头，并依赖图像校正技术还原图像的鱼眼全景摄像机。鱼眼全景摄像机

最终生成的全景图像即使经过校正也依然存在一定程度的失真和不自然。多镜头全景摄像机可以避免鱼眼镜头图像失真的缺点，但是或多或少也会存在融合边缘效果不真实、角度有偏差或分割融合后有"附加"感的缺撼。本文档中根据目前所查找到的资料，对多镜头全景视图拼接算法原理进行简要的介绍。 2.主要步骤 2.1. 图像获取通过相机取得图像。通常需要根据失真较大的鱼眼镜头和失真较小的窄视角镜头决定算法处理方式。单镜头和多镜头相机在算法处理上也会有一定差别。 2.2鱼眼图像矫正若相机镜头为鱼眼镜头，则图像需要进行特定的畸变展开处理。 2.3图片匹配根据素材图片中相互重叠的部分估算图片间匹配关系。主要匹配方式分两种： A．与特征无关的匹配方式。最常见的即为相关性匹配。 B．根据特征进行匹配的方式。最常见的即为根据SIFT，SURF等素材图片中局部特征点，匹配相邻图片中的特征点，估算图像间投影变换矩阵。 2.4 图片拼接根据步骤2.3所得图片相互关系，将相邻图片拼接至一起。 2.5 图像融合对拼接得到的全景图进行融合处理。 2.6 全景图像投射将合成后的全景图投射至球面、柱面或立方体上并建立合适的视点，实现全方位的视图浏览。

图像拼接技术的研究历史悠久

图像拼接技术的研究历史悠久。早期用于航空遥感照片合成，由于飞机或卫星上相机和地面景物之间距离很远，这种图像配准采用简单的模板匹配法。这种方法在现在也有广泛应用，可应用于航空图片合成、大文档扫描合成，视频压缩。在20世纪90年代随全视函数、全景建模、光场与光照图、同心拼图、全景图概念的提出，模型维数不断下降。自1994年Chen等人提出全景图拼接技术，国内外出现很多关于全景图生成技术的文章。全景图生成技术的基本思想是通过普通相机或摄像机对场景信息进行照片图像或视频图像采样，在固定的视点，使相机在水平面内旋转一周拍摄场景，得到一组具有重叠区域的连续环视图像序列:将图像由相机坐标投影到空间坐标:利用图像配准方法寻找将环绕一周的这组图像中，两两相邻的图像间的重叠的区域;将确定的重叠区域利用图像融合方法进行图像序列的无缝拼合，得到一幅全景图像。全景图像根据其选取视点空间的不同可分为:平面、柱面、球表面、立方体表面。目前图像配准的研究方法主要集中为基于灰度相关的方法、相位相关法、基于特征的方法。基于灰度相关方法的计算量较大，很多力求缩小模版配准计算量的改进算法被提出来。国防科大开发的HVS系统,采用的是一种基于特征线段的图像匹配算法。封静波提出相似曲线的拼接算法通过匹配两幅图像重叠区域每列梯度最大值曲线完成拼接，大大减少了传统模板匹配方法的计算量。薛峰综合基于灰度相关和特征相关算法的优点提出了基于最大梯度和灰度相关的两步配接方法。于乱采用形状模板对模板内图像的边缘点与模板边界的最短距离统计实现特征点匹配。李文辉提出采用基于粒子群优化(POS)的多分辨率算法。 1975年相位相关法由Kuglin和Hines提出，具有场景无关性，能够对纯粹二维平移的图像精确地对齐。DeCastro和Morandi发现用傅立叶变换确定旋转对齐就像平移对齐一样。Reddy和Chatterji改进了Decastro的算法，大大减少了需要转换的数量。张世阳采用了基于2幂子图像的FFT对齐方法，从而减小了FFT的计算量加快图像对齐速度和减小图像间重叠率。吴飞采用基于快速傅立叶变换的图像配准算法求取两相邻视频帧之间的配准系数。基于特征的图像对齐典型的是基于图像几何特征的对齐方法。几何特征分为低级的学硕士学位论文基于特征点的嘴卜任曰生成执术的研究特征，如边、角和高级特征如物体的识别、特征之间的关系。文(34)通过二维高斯模糊过滤可以得到一些低级特征模型，如边模型、角模型和顶点模型。因为角模型提供了比坐标点更多的信息，文〔35)中基于几何角模型提出了图像对齐算法，文〔36〕中基于几何点特征优化匹配和文(37)中利用小波变换提取保留边(。dge一preserving)的视觉模型进行图像对齐。基于高级特征的图像对齐利用低级特征之间的关系或者通过识别出的物体实现对齐。文(38)利用特征图像关系图进行图像对齐。而如何选择特征是其中的关键技术，许多研究人员也在从事这方面的究，如提取特征点算子:Morave。算子〔3，，、Forstner算子〔‘0，、susan算子〔“，、HarriS算子〔‘，，，sIFT算子〔‘3，等。边缘检测算子:Canny算子〔44]、LoG〔46]算子等。此外用于提高特征点配准精度的算法很多，赵炫利用概率模型理论精确特征点的匹配〔46]。胡社教提出利用KLT跟踪算法精确确定角点位置，提高变换矩阵的求解精度〔4v]。李寒通过引导互匹配及投票过滤方法提高特征点的检测精度〔#8]。赵辉采用相位相关法进行自动排序的特征角点匹配算法〔49]。

视频拼接器

超大全彩LED拼接解决方案 CK4L系列全彩LED多画面视频图像处理器是国家高新技术企业深圳市创凯电子有限公司推出的针对全彩LED的高性能图像处理和控制设备。该设备整合创凯公司多年在视频图像处理、高清晰信号处理和显示等方面的丰富经验,采用专利技术硬件设计,结合全彩LED屏显示的特殊要求设计，可以同时接受并处理多种不同视频图形信号,并在全彩LED上显示。 CK4L6000, 多画面全彩LED拼接图像处理器,单机最多同时可支持16张不同分辨率的发射卡,单机最高可以支持30720*1080 LED点阵。多台机器级联可以实现无限幅度的LED点阵实时动态显示。 CK4L6000，可以任意配置发射卡进行LED点阵堆砌，可以自由选择灰度级数。可以任意设置单个LED发射卡的输出内容点阵。 CK4L6000 具备的技术特点：实时多通道并行图像处理,专利技术的全硬件架构,无运动拖尾和锯齿；单机最高可以支持30720*1080LED等效点阵,多机并联可以驱动无限幅度LED点阵； APSP技术,自定义图像输出的大小以及输出位置。具有值机功能，即可以通过监视器时时观看LED大屏幕的状态(选配)。帧同步技术，各输出图像间无错位和延迟；多窗口控制叠加显示技术,实现任意信号的窗口叠加、漫游、缩放以及无缝切换；针对LED显示领域的多种特殊显示驱动模式；所见即所得软件操控界面，无需复杂的窗口预设操作； 16种不同模式场景预设；预留LED发送卡槽位，系统高度集成；高可靠性和稳定性，7天/ 24小时应用。 CK4L 系列LED图像处理器，内部无操作系统支持，上电即可工作，稳定性高。系统连接拓扑图（以支持4张发射卡为例）特点介绍一、超大场景显示

360°全景拼接技术简介

本文为技术简介，详细算法可以参考后面的参考资料。 1.概述全景图像(Panorama)通常是指大于双眼正常有效视角(大约水平90度，垂直70度)或双眼余光视角(大约水平180度，垂直90度)，在一个固定的观察点，能够提供水平方向上方位角360度，垂直方向上180度的自由浏览（简化的全景只能提供水平方向360度的浏览），乃至360度完整场景范围拍摄的照片。生成全景图的方法，通常有三种：一是利用专用照相设备，例如全景相机，带鱼眼透镜的广角相机等。其优点是容易得到全景图像且不需要复杂的建模过程，但是由于这些专用设备价格昂贵，不宜普遍适用。二是计算机绘制方法，该方法利用计算机图形学技术建立场景模型，然后绘制虚拟环境的全景图。其优点是绘制全景图的过程不需要实时控制，而且可以绘制出复杂的场景和真实感较强的光照模型，但缺点是建模过程相当繁琐和费时。三是利用普通数码相机和固定三脚架拍摄一系列的相互重叠的照片，并利用一定的算法将这些照片拼接起来，从而生成全景图。近年来随着图像处理技术的研究和发展，图像拼接技术已经成为计算机视觉和计算机图形学的研究焦点。目前出现的关于图像拼接的商业软件主要有Ptgui、Ulead Cool 360及ArcSoft Panorama Maker等，这些商业软件多是半自动过程，需要排列好图像顺序，或手动点取特征点。 2.全景图类型： 1)柱面全景图柱面全景图技术较为简单，发展也较为成熟，成为大多数构建全景图虚拟场景的基础。这种方式是将全景图像投影到一个以相机视点为中心的圆柱体内表面，

视线的旋转运动即转化为柱面上的坐标平移运动。这种全景图可以实现水平方向360度连续旋转，而垂直方向的俯仰角度则由于圆柱体的限制要小于180度。柱面全景图有两个显著优点：一是圆柱面可以展开成一个矩形平面，所以可以把柱面全景图展开成一个矩形图像，而且直接利用其在计算机内的图像格式进行存取；二是数据的采集要比立方体和球体都简单。在大多数实际应用中，360度的环视环境即可较好地表达出空间信息，所以柱面全景图模型是较为理想的一种选择。 2)立方体全景图立方体全景图由六个平面投影图像组成，即将全景图投影到一个立方体的内表面上。这种方式下图像的采集和相机的标定难度较大，需要使用特殊的拍摄装置，依次在水平、垂直方向每隔90度拍摄一张照片，获得六张可以无缝拼接于一个立方体的六个面上的照片。这种方法可以实现水平方向360度旋转、垂直方向180度俯仰的视线观察。 3)球面全景图球面全景图是指将源图像拼接成一个球体的形状，以相机视点为球心，将图像投影到球体的内表面。与立方体全景图类似，球面全景图也可以实现水平方向360度旋转、垂直方向180度俯仰的视线观察。球面全景图的拼接过程及存储方式较柱面全景图大为复杂，这是因为生成球面全景图的过程中需要将平面图像投影成球面图像，而球面为不可展曲面。因此这是一个平面图像水平和垂直方向的非线性投影过程，同时也很难找到与球面对应且易于存取的数据结构来存放球面图像。目前国内外在这方面提出的研究算法较其他类型全景图少，而且在可靠性和效率方面也存在一些问题。 3.主要内容

拼接屏技术方案

技术方案设计书青岛三众泰网络工程有限公司 2013年12月

目录第1章．系统设计概述 (3) 第2章．LCD TFT 液晶屏的显示原理及DID屏的特征 (3) 第3章．液晶拼接墙的系统设计 (4) 3.1系统的可行性 (4) 3.2系统的实用性 (5) 3.3系统的可靠性 (5) 3.4系统的经济性 (5) 3.5系统的开放性及可扩展性 (5) 第4章．液晶拼接墙功能特点 (6) 4.1拼接单元功能特点 (6) 4.2液晶拼接控制器特点 (9) 第5章．液晶拼接墙的技术指标 (12) 5.1拼接单元性能参数 (12) 5.2液晶拼接控制器主要技术指标 (13) 第6章．系统结构与组成 (14) 6.1液晶拼接墙的基本构成 (14) 6.2拼接墙显示尺寸与外观尺寸 (16) 6.3系统连接示意图 (16) 第7章．液晶拼接墙显示系统配置清单 (17) 第8章．液晶拼接墙功能介绍 (18) 第9章．系统环境设计和要求 (20) 11.1 安装要求 (20) 11.2操作控制台（室）装修及设备位置要求 (20) 11.3光线要求 (21) 11.4走线及线槽要求 (21) 11.5空调要求 (21) 11.6供电电源 (21) 11.7系统环境 (22) 第10章．企业简介 (22) 第11章．售后服务体系 (23) 13.1售后服务范围............................................................... 错误!未定义书签。 13.2售后服务承诺............................................................... 错误!未定义书签。

高清图像全景拼接

高清图像全景拼接 Company Document number：WTUT-WT88Y-W8BBGB-BWYTT-19998

全景拼接白皮书

1 方案概述 1.1 市场需求全景拼接系统，是以画面拼接技术为基础，将周围相邻的若干个摄像机画面拼接成一幅画面。传统视频监控系统，用户如果要实时监控一片连续的大范围区域，最常见的做法是，安装多个摄像机，每个负责一小片区域，该方案的主要缺陷是，用户没有画面整体感，很难连续追踪整个区域内的某个目标。全景拼接系统，能很好的解决上述问题。传统意义上的全景拼接系统，虽然解决了“看的广”、“看的画面连续”的问题，但并没有解决“看的清”的问题。因此宇视的全景拼接系统中，增加了球机联动功能，以解决“看的清”的问题，一台10倍以上光学放大的球机可以看清100米甚至更远的目标。球机联动功能，是以枪球映射技术为基础，将全景画面坐标系和球机画面坐标系关联映射起来，用户只要在全景画面中拉框，球机就自动转动和变倍到指定位置，对用户来说这是一个设备，而不是孤立的两个设备。全景拼接系统，主要应用于大范围监控，如广场、公园、景区、机场停机坪、机场大厅、物流仓库、大型生产车间、交通枢纽等。 1.2 方案特点 ●画面拼接：支持3个高清相机（最高1080P）的拼接。 ●画面拼接：拼接后最高分辨率可以达到5760×1080。 ●球机联动：支持1个球机（最高1080P）的联动。 ●球机联动：支持在全景画面中拉框放大，自动联动球机转动和变倍到指定位置。 2 组网模型 2.1 全景拼接 2.1.1 逻辑框图（或拓扑图） 2.1.2 原理描述拼接原理：拼接前提：用于拼接的摄像机，在图像内容上，两两相交。

图像拼接算法及实现(一).

图像拼接算法及实现（一）论文关键词：图像拼接图像配准图像融合全景图论文摘要：图像拼接(image mosaic)技术是将一组相互间重叠部分的图像序列进行空间匹配对准,经重采样合成后形成一幅包含各图像序列信息的宽视角场景的、完整的、高清晰的新图像的技术。图像拼接在摄影测量学、计算机视觉、遥感图像处理、医学图像分析、计算机图形学等领域有着广泛的应用价值。一般来说,图像拼接的过程由图像获取,图像配准,图像合成三步骤组成,其中图像配准是整个图像拼接的基础。本文研究了两种图像配准算法:基于特征和基于变换域的图像配准算法。在基于特征的配准算法的基础上,提出一种稳健的基于特征点的配准算法。首先改进Harris角点检测算法,有效提高所提取特征点的速度和精度。然后利用相似测度NCC(normalized cross correlation——归一化互相关),通过用双向最大相关系数匹配的方法提取出初始特征点对,用随机采样法RANSAC(Random Sample Consensus)剔除伪特征点对,实现特征点对的精确匹配。最后用正确的特征点匹配对实现图像的配准。本文提出的算法适应性较强,在重复性纹理、旋转角度比较大等较难自动匹配场合下仍可以准确实现图像配准。 Abstract：Image mosaic is a technology that carries on the spatial matching to a series of image which are overlapped with each other, and finally builds a seamless and high quality image which has high resolution and big eyeshot. Image mosaic has widely applications in the fields of photogrammetry, computer vision, remote sensing image processing, medical image analysis, computer graphic and so on. 。In general, the process of image mosaic by the image acquisition, image registration, image synthesis of three steps, one of image registration are the basis of the entire image mosaic. In this paper, two image registration algorithm: Based on the characteristics and transform domain-based image registration algorithm. In feature-based registration algorithm based on a robust feature-based registration algorithm points. First of all, to improve the Harris corner detection algorithm, effectively improve the extraction of feature points of the speed and accuracy. And the use of a similar measure of NCC (normalized cross correlation - Normalized cross-correlation), through the largest correlation coefficient with two-way matching to extract the feature points out the initial right, using random sampling method RANSAC (Random Sample Consensus) excluding pseudo-feature points right, feature points on the implementation of the exact match. Finally with the correct feature point matching for image registration implementation. In this

视频拼接综述

视频拼接全景摄像机综述作者：上海凯视力成信息科技有限公司随着摄像机从模拟走向网络，“高清”日渐成为市场关注的热点，它的出现让人们可以看得更清楚，获得更多的细节。但是，客户在从之前“只能看见人脸”到现在“能看清人脸”的同时，又提出了另一方面的要求，那就是“看得更广”，即在同一个场景中能看到更多的东西。对此，原来是通过用几只摄像头覆盖一个区域，或用快球来回巡航扫描去解决。但在某些场合，这些方案还不能完全满足客户的要求，比如客户需要在同一个画面里确定人的移动，或需要用同一个场景中监看到的事物去说明一些问题，这个时候就需要全景摄像机，本文试图对全景摄像机做一综述。作者：上海凯视力成信息科技有限公司 1．全景摄像机的好处全景摄像机可以带来如下好处：（1）超宽监控视角。一枚鱼眼镜头尽收360度全景，四周的影像一次尽收眼底，完全消灭死角。（2）降低成本。一台好的全景摄像机可以替代多台传统摄像机的应用，这种360度实时全景监控能力，使得无需为涵盖整个监控区域而安装多台摄像机，因而节省了摄像机硬件投资。监控摄像机路数大大减少，可以节省配套设备，如镜头、防护罩、布线、电源、录像、显示等相应配件和设备的成本，还可降低施工布线难度，节省安装时间、人工费用以及后续维护费用。（3）虚拟PTZ技术。采用虚拟PTZ技术，可以放大或移动监控视野内的图像区域，当转变方向观察另一个图像区域时，不会发出任何噪音，隐秘且不易察觉。由于没有机械移动部件，不需要时刻的进行机械化运转，全景摄像机不会发生任何磨损，产品结实耐用，使用寿命大大延长。全景环视的图像失真矫正可对多个图像区进行，这样，与机械PTZ摄像机不同，全景摄像机能同时观察和摄录多个不同的区域。作者：上海凯视力成信息科技有限公司

图像拼接原理及方法

第一章绪论 1.1图像拼接技术的研究背景及研究意义图像拼接(image mosaic)是一个日益流行的研究领域，他已经成为照相绘图学、计算机视觉、图像处理和计算机图形学研究中的热点。图像拼接解决的问题一般式，通过对齐一系列空间重叠的图像，构成一个无缝的、高清晰的图像，它具有比单个图像更高的分辨率和更大的视野。早期的图像拼接研究一直用于照相绘图学，主要是对大量航拍或卫星的图像的整合。近年来随着图像拼接技术的研究和发展，它使基于图像的绘制( IBR )成为结合两个互补领域 ――计算机视觉和计算机图形学的坚决焦点，在计算机视觉领域中，图像拼接成为对可视化场景描述(Visual Seene Representaions)的主要研究方法：在计算机形学中，现实世界的图像过去一直用于环境贴图，即合成静态的背景和增加合成物体真实感的贴图，图像拼接可以使IBR从一系列真是图像中快速绘制具有真实感的新视图。在军事领域网的夜视成像技术中，无论夜视微光还是红外成像设备都会由于摄像器材的限制而无法拍摄视野宽阔的图片，更不用说360度的环形图片了。但是在实际应用中，很多时候需要将360度所拍摄的很多张图片合成一张图片，从而可以使观察者可以观察到周围的全部情况。使用图像拼接技术，在根据拍摄设备和周围景物的情况进行分析后，就可以将通过转动的拍摄器材拍摄的涵盖周围360度景物的多幅图像进行拼接，从而实时地得到超大视角甚至是360度角的全景图像。这在红外预警中起到了很大的作用。微小型履带式移动机器人项目中，单目视觉不能满足机器人的视觉导航需要，并且单目视觉机器人的视野范围明显小于双目视觉机器人的视野。利用图像拼接技术，拼接机器人双目采集的图像，可以增大机器人的视野，给机器人的视觉导航提供方便。在虚拟现实领域中，人们可以利用图像拼接技术来得到宽视角的图像或360度全景图像，用来虚拟实际场景。这种基于全景图的虚拟现实系统，通过全景图的深度信息抽取，恢复场景的三维信息，进而建立三维模型。这个系统允许用户在虚拟环境中的一点作水平环视以及一定范围内的俯视和仰视，同时允许在环视的过程中动态地改变焦距。这样的全景图像相当于人站在原地环顾四周时看到的情形。在医学图像处理方面，显微镜或超声波的视野较小，医师无法通过一幅图像进行诊视，同时对于大目标图像的数据测量也需要把不完整的图像拼接为一个整体。所以把相邻的各幅图像拼接起来是实现远程数据测量和远程会诊的关键环节圆。在遥感技术领域中，利用图像拼接技术中的图像配准技术可以对来自同一区域的两幅或多幅图像进行比较，也可以利用图像拼接技术将遥感卫星拍摄到的有失真地面图像拼接成比较准确的完整图像，作为进一步研究的依据。从以上方面可以看出，图像拼接技术的应用前景十分广阔，深入研究图像拼接技术有着很重要的意义 1.2图像拼接算法的分类图像拼接作为这些年来图像研究方面的重点之一，国内外研究人员也提出了很多拼接算法。图像拼接的质量，主要依赖图像的配准程度，因此图像的配准是拼接算法的核心和关键。根据图像匹配方法的不同仁阔，一般可以将图像拼接算法分为以下两个类型： (1) 基于区域相关的拼接算法。这是最为传统和最普遍的算法。基于区域的配准方法是从待拼接图像的灰度值出发，对待配准图像中一块区域与参考图像中的相同尺寸的区域使用最小二乘法或者其它数学方法计算其灰度值的差异，对此差异比较后来判断待拼接图像重叠区域的相似程度，由此得到待

二维图像拼接技术

专业设计报告设计题目：基于机器人视觉的图像处理方法研究 ——二维图像处理姓名：学号：学院：专业：指导教师：同组人姓名：

摘要：在实际应用中，经常会用到超过人眼视野范围甚至是全方位的高分辨率图像，普通数码相机的视野范围往往难以满足要求。为了得到大视野范围的图像，人们使用广角镜头和扫描式相机进行拍摄。但这些设备往往价格昂贵、使用复杂，此外，广角镜头的图像边缘会难以避免的产生扭曲变形，不利于一些场合的应用。为了在不降低图像分辨率的条件下获取大视野范围的图像，人们提出了图像拼接技术，将普通图像或视频图像进行无缝拼接，得到超宽视角甚至360度的全景图，这样就可以用普通数码相机实现场面宏大的景物拍摄。利用计算机进行匹配，将多幅具有重叠关系的图像拼合成为一幅具有更大视野范围的图像，这就是图像拼接的目的。图像拼接解决的问题一般式，通过对齐一系列空间重叠的图像，构成一个无缝的、高清晰的图像，它具有比单个图像更高的分辨率和更大的视野。最初主要是对大量航拍或卫星的图像的整合,也可运用于军事领域网的夜视成像技术,。利用图像拼接技术，拼接机器人双目采集的图像，可以增大机器人的视野，给机器人的视觉导航提供方便。在虚拟现实领域中，人们可以利用图像拼接技术来得到宽视角的图像或360 度全景图像，用来虚拟实际场景。在医学图像处理方面，把相邻的各幅图像拼接起来是实现远程数据测量和远程会诊的关键环节圆。在遥感技术领域中，图像拼接技术的应用也日益广泛。通过本课题的研究，初步了解图像拼接技术的基本应用，并了解sift语言的应用，将两幅具有相同特征点的图拼接在一起，实现二维图像的初步拼接处理。关键词：图像获取，图像配准，图像融合，图像合成，SIFT。一、设计的任务和目的二维和三维图像测量方法，具有非接触,自扫描,高精度的优点，已得到广泛应用。但在保证高精度的条件下，要实现大范围,多参数测量，单纯提高摄像机性能往往受到限制，而且成本高。图像拼接技术能够实现上述测量目的，达到较高的性能价格比。二维图像拼接是利用已获得的多幅被测物图像，提取图像间的公共特性，并通过公共特征将多图数据统一到同一坐标下，从而挖掘出数据中的深层次信息。二维图像拼接依据特征信息提取方法的不同，可以分为基于区域和基于特征两种。基于区域的拼接一般通过求相关系数实现，计算量大，运行时间长。基于特征的拼接可以提取有旋转,平移,缩放不变性的不变量，具有快速,准确的特点，在工业测量中还可人为加入特制标记，使测量更有实用性。图像拼接的关键是精确找出相邻图像中重叠部分的位置，然后确定两张图像的变换关系，然后进行拼接和拼缝融合。但是由于照相机受环境和硬件等条件影响，所要拼接的图像往往存在平移、旋转、大小、色差及其组合的形变与扭曲等差别。本设计采用基于特征的图像拼接技术，首先对图像进行轮廓提取，然后再对提取的轮廓进行匹配，从

视频图像拼接技术研究.

南京理工大学硕士学位论文视频图像拼接技术研究姓名：林学晶申请学位级别：硕士专业：控制理论与控制工程指导教师：茅耀斌 20100620 硕士论文视频图像拼接技术研究摘要视频图像拼接技术是视频应用领域研究的一个热门课题，可广泛应用于全景图生成、双目机器人应用等多个方面。本文主要针对三类视频图像序列拼接应用进行了研究：针对仅存在平移变换关系的视频图像序列，本文研究了一种基于频域的相位相关方法。论文首先介绍了相位相关方法的原理和利用这种方法实现视频拼接的算法流程，然后通过实验证明该方法适用于帧与帧问有较大重叠区域的视频序列，并且允许视频中存在少量小的运动物体。在此基础上设计实现了适用于小平移视频序列的实时拼接软件。针对在不同的视角位置同时采集得到的双实时视频图像序列，本文研究了两种基于点特征的拼接技术。论文首先介绍了Ｈａｒｒｉｓ角点和ＳＩＦＴ算子的原理，然后阐述了基于点特征的双摄像头拼接技术的各个环节，包括特征点匹配、ＲＡＮＳＡＣ去除误匹配点对、透视变换矩阵模型参数计算、插值处理和融合等。本

文比较了几种图像的融合方法，采用了一种自动调节亮度值和加权融合方法，消除了图像拼接后可能出现的拼接缝隙和颜色过渡不自然的现象。由于Ｈａｒｒｉｓ角点易受噪声影响，本文提出了一种投票机制的改进方法，增强了Ｈａｒｒｉｓ角点定位的准确性。本文最后搭建了基于ＤｉｒｅｃｔＳｈｏｗ的双摄像头采集平台、设计实现了基于Ｈａｒｒｉｓ角点和ＳＩＦＴ算子两种点特征的双摄像头实时视频拼接程序，前者适用于摄像机采集的视频图像存在平移、旋转的情况，后者适用于存在平移、旋转和尺度缩放的情况。本文最后针对低分辨率图像序列，研究了基于ＳＩＦＴ算子的拼接问题，并将之应用于手机连续抓拍文本序列图像的拼接。关键词：相位相关方法，Ｈａｒｒｉｓ角点，ＲＡＮＳＡＣ，透视变换矩阵，加权融合Ａｂｓｔｒａｃｔ硕士论文ＡｂｓｔｒａｃｔＶｉｄｅｏｍｏｓａｉｃｉｓａｐｏｐｕｌａｒｔｏｐｉｃｏｎｖｉｄｅｏｔｅｃｈｎｏｌｏｇｙｔｈａｔｓｈｏｗｓｓｉｇｎｉｆｉｃａｎｔｉｍｐｏｒｔａｎｔａｐｐｌｉｃａｔｉｏｎｆｏｒｐａｎｏｒａｍｉｃｉｍａｇｅｓ，ｂｉｎｏｃｕｌａｒｒｏｂｏｔａｎｄＳＯｏｎ．Ｄｉｆｆｅｒｅｎｔｔｅｃｈｎｉｑｕｅｓｏｆｖｉｄｅｏｍｏｓａｉｃａｒｅｕｓｅｄｉｎｄｉｆｆｅｒｅｎｔａｐｐｌｉｃａｔｉｏｎｓ．Ｉｎｔｈｉｓｐａｐｅｒ，ｔｈｒｅｅｔｙｐｅｓｏｆｃａｓｅａｒｅｓｔｕｄｉｅｄ：Ｔｈｅｍｅｔｈｏｄｏｆｐｈａｓｅｃｏｒｒｅｌａｔｉｏｎｂａｓｅｄｏｎｆｒｅｑｕｅｎｃｙｄｏｍａｉｎｉｓｓｔｕｄｉｅｄｆｏｒａｖｉｄｅｏ

关于视频图像处理系统关键技术的研究

关于视频图像处理系统关键技术的研究摘要：对视频图像处理系统的关键环节-图像采集，预处理，压缩编码进行了详细分析，并对该领域目前出现的具体实现技术进行了优缺点总结。关键词：视频图像处理图像处理图像压缩图像编码实现所谓视频图像处理系统，小到照相机，摄影机，录像机，大到地质成像扫描系统，气象卫星图像显示系统，视频监控系统都属于该范畴，但他们却千差万别，各有自己所属的专业领域、独特之处。本文旨在具体分析其中的关键环节，在广泛比较各种图像处理系统具体实现方式的基础上，总结出它们的优缺点、注意事项。为以后对视频图像处理系统的理论研究和项目实践提供系统决策阶段的方案选型参考。 1.视频图像采集 ①图像采集部分的主要工作是从图像采集传感器输出的模拟视频信号中提取图像，实现数字化后作后续处理和分析。目前，市场上通用的图像采集传感器主要有两种：CCD传感器和CMOS 传感器。CCD器件具有高信噪比和高电荷转换效率。但是要实现这一目标，需要专门处理器、高电压、多重电源，因此也带来高功耗，高价位。CMOS传感器简化了配套电路，降低了功耗和价位，但无法保证每个像点的放大率都保持严格一致，所得图像品质低于CCD传感器。 2.视频图像预处理 ②图像预处理部分的主要工作是把经过图像数字化后的图像信号进行亮度信号提取,奇偶场合并及图像尺寸剪裁,使最终读出的图像数据大小,数据位宽,象素时钟达到目标系统的要求。在要求较高的应用中，预处理还需要完成去噪声，平滑话等功能算法，例如比较知名的直方图均衡化处理，中值滤波降噪处理。视频信号预处理过程以前多由数字电路组合产生，这样做不但电路复杂、体积大，而且不够灵活；逐渐被采用单片机处理的方案取代，用单片机处理视频信号能够解决电路的复杂度和灵活性问题，但精度不高，难以用于对同步要求严格的场合；后来出现了利用DSP来进行视频信号的处理方案,DSP具有更高的集成度和更快的运行速度，比普遍采用的单片机在数字图像处理领域有着明显的优势，但是成本却居高不下；近年来，利用低成本的FPGA芯片来实现预处理逐渐流行开来,FPGA具有丰富的10端口数，触发器数量多，适宜进行复杂时序功能设计，缺点是开发门槛高，需要在FPGA专用开发平台下使用硬件描述语言实现预处理算法的调试，硬编码等一系列高级数字系统设计流程；同时，市场上也出现了以ARM处理器位为核心的精简处理方案：数字摄像头接收ARM送来的控制指令和工作时钟，并在采集到适当信号后放入指定的高速缓存，然后由ARM

图像拼接原理及方法

第一章绪论 1.1 图像拼接技术的研究背景及研究意义图像拼接(image mosaic)是一个日益流行的研究领域，他已经成为照相绘图学、计算机视觉、图像处理和计算机图形学研究中的热点。图像拼接解决的问题一般式，通过对齐一系列空间重叠的图像，构成一个无缝的、高清晰的图像，它具有比单个图像更高的分辨率和更大的视野。早期的图像拼接研究一直用于照相绘图学，主要是对大量航拍或卫星的图像的整合。近年来随着图像拼接技术的研究和发展，它使基于图像的绘制（IBR）成为结合两个互补领域——计算机视觉和计算机图形学的坚决焦点，在计算机视觉领域中，图像拼接成为对可视化场景描述（Visual Scene Representaions）的主要研究方法：在计算机形学中，现实世界的图像过去一直用于环境贴图，即合成静态的背景和增加合成物体真实感的贴图，图像拼接可以使IBR从一系列真是图像中快速绘制具有真实感的新视图。在军事领域网的夜视成像技术中，无论夜视微光还是红外成像设备都会由于摄像器材的限制而无法拍摄视野宽阔的图片，更不用说360 度的环形图片了。但是在实际应用中，很多时候需要将360 度所拍摄的很多张图片合成一张图片，从而可以使观察者可以观察到周围的全部情况。使用图像拼接技术，在根据拍摄设备和周围景物的情况进行分析后，就可以将通过转动的拍摄器材拍摄的涵盖周围360 度景物的多幅图像进行拼接，从而实时地得到超大视角甚至是360 度角的全景图像。这在红外预警中起到了很大的作用。微小型履带式移动机器人项目中，单目视觉不能满足机器人的视觉导航需要，并且单目视觉机器人的视野范围明显小于双目视觉机器人的视野。利用图像拼接技术，拼接机器人双目采集的图像，可以增大机器人的视野，给机器人的视觉导航提供方便。在虚拟现实领域中，人们可以利用图像拼接技术来得到宽视角的图像或360 度全景图像，用来虚拟实际场景。这种基于全景图的虚拟现实系统，通过全景图的深度信息抽取，恢复场景的三维信息，进而建立三维模型。这个系统允许用户在虚拟环境中的一点作水平环视以及一定范围内的俯视和仰视，同时允许在环视的过程中动态地改变焦距。这样的全景图像相当于人站在原地环顾四周时看到的情形。在医学图像处理方面，显微镜或超声波的视野较小，医师无法通过一幅图像进行诊视，同时对于大目标图像的数据测量也需要把不完整的图像拼接为一个整体。所以把相邻的各幅图像拼接起来是实现远程数据测量和远程会诊的关键环节圆。在遥感技术领域中，利用图像拼接技术中的图像配准技术可以对来自同一区域的两幅或多幅图像进行比较，也可以利用图像拼接技术将遥感卫星拍摄到的有失真地面图像拼接成比较准确的完整图像，作为进一步研究的依据。从以上方面可以看出，图像拼接技术的应用前景十分广阔，深入研究图像拼接技术有着很重要的意义 1.2图像拼接算法的分类图像拼接作为这些年来图像研究方面的重点之一，国内外研究人员也提出了很多拼接算法。图像拼接的质量，主要依赖图像的配准程度，因此图像的配准是拼接算法的核心和关键。根据图像匹配方法的不同仁阔，一般可以将图像拼接算法分为以下两个类型：（1) 基于区域相关的拼接算法。这是最为传统和最普遍的算法。基于区域的配准方法是从待拼接图像的灰度值出发，对

视频拼接关键技术

全景视频拼接关键技术作者：一、原理介绍图像拼接(Image Stitching)是一种利用实景图像组成全景空间的技术，它将多幅图像拼接成一幅大尺度图像或360度全景图，图像拼接技术涉及到计算机视觉、计算机图形学、数字图像处理以及一些数学工具等技术。图像拼接其基本步骤主要包括以下几个方面：摄相机的标定、传感器图像畸变校正、图像的投影变换、匹配点选取、全景图像拼接（融合），以及亮度与颜色的均衡处理等，以下对各个步骤进行分析。摄相机标定由于安装设计，以及摄相机之间的差异，会造成视频图像之间有缩放（镜头焦距不一致造成）、倾斜（垂直旋转）、方位角差异（水平旋转），因此物理的差异需要预先校准，得到一致性好的图像，便于后续图像拼接。作者：相机的运动方式与成像结果之间的关系见下图。

图1：相机的运动方式与成像结果之间的关系图像坐标变换在实际应用中，全景图像的获得往往需要摄像机以不同的位置排列和不同的倾角拍摄。例如由于机载或车载特性，相机的排列方式不尽相同，不能保证相机在同一面上，如柱面投影不一定在同一个柱面上，平面投影不一定在同一平面上；另外为了避免出现盲区，相机拍摄的时候往往会向下倾斜一定角度。这些情况比较常见，而且容易被忽略，直接投影再拼接效果较差。因而有必要在所有图像投影到某个柱面（或平面）之前，需要根据相机的位置信息和角度信息来获得坐标变换后的图像。理论上只要满足静止三维图像或者平面场景的两个条件中的任何一个，两幅图像的对应关系就可以用投影变换矩阵表示，换句话说只要满足这其中任何一个条件，一个相机拍摄的图像可以通过坐标变换表示为另一个虚拟相机拍摄的图像。作者：