计算机视觉系统(外文翻译)

计算机视觉系统：

功能和结构概论

摘要：计算机视觉系统(CVS)在实时工作时必须具备能快速选择（在空间和时间）感兴趣区域，且对接下来的数据结果变动时进行资源再分配，并且依据部分数据更新方法从而达到这样的功能。CVS最有发展潜力是直接地针对卷积的变化信息和多解决方案的计算的要求。本文中，在这些解决方案之中，我们将描述三种不同由典型的聚焦机制引导的生物系统的硬件。

1引言

一个标准图像解析过程由几个部分组成：图像顺序存储、预先处理和图像分割、最后是特征提取阶段，处理后的图像被分析和被解释或者被分类。这类开环的模式不支持实时处理，甚至连最简单的人类做到的任务也办不到。

图像采集由一台商用照相机拍摄，以7

610

10 个像素每秒并且规范了相机的视野。大多数收集的数据是不能直接使用的，并且必须从这些庞大的数据中提取一小部分有益的数据。普通计算机无法处理这种具有选择性的难题。在最近十几年，一些研究论述提到专业的计算机视觉系统(CVS)，他们由此能有效地进行区域和感兴趣部分的识别，并且以某种类似于人的视觉系统的方式处理这些区域和感兴趣部分。

人类的聚焦机理在相当大的数量的数据情况下能有效地通过直接的指挥(有很高的敏锐性和识别力的能力的视网膜部分)最佳区域完成当前的任务。焦点被移动到一个预先定义或暂时分辨序列的明显区域(scanpath)。为了完成实时的动作，简单来说，一个CVS必须有以下功能：

．在空间和时间上选择正在运动中的区域；

．计算机资源分配保持必要的效率，即使数据量以数据集合形式有相当大变动；

．如当前任务所需，为了及时处理整体和局部的特性而改变数据结果；

．基于以完成的部分一步一步更新处理方法。

在直接地针对被引述的要求的不同的提案之中，多数有前景的理论都是根据卷

积变化的空间区域[1，2]，和在多分辨率处理[3，4，5]提出的。这些方法包括通过在可变方案所提供场合的内容进行图像数据结构分析。这样为当前操作、任和图像开发最适当的小型数据结构。

作为一般方法，组分大的可以被分解成小的方案，而小组分的应进行充分的解决。然而，独立目标的尺寸，在每次众多的数据中有很大数量被去处的处理来获得介入的产物是独立区域那是更加适当的。

在第2节Schwartz 的提案如[6]Cortex I 系统可描述为一个在视网膜上的紧密跟踪传感器；第3节解决实现第一个商用的多功能系统的方法：金字塔型的流水线[7 (根据Sarnoff 芯片的系统的简介)；最后，第4节考虑最普遍的等级制度的建立的家庭：金字塔，特别是有些细节在PAPIA 2工程[8]给出。

2 卷积系统

人的视觉既是活跃的又是空间可变的。最近研究员把他们的注意力集中在空间变形传感器可模仿生物视觉系统。这种系统不得不处减少像素的数量，以处理那些大量与判断系统一致的命令。

Bederson ，Wallace 和Schartz 提出了Cortex I [6]基于对数结构小型化的几何像素的主动视觉系统。研究表明，类似的结构的视觉系统也存在于灵长类动物和人类的眼睛。展示的机器由一个CCD 传感器，微型云台、控制器、通用处理器和显示器组成。

2.1 空间可变化图像

空间变化图像传感器的是由一个不规则的像素几何描绘：图由一个非常大的数据描述，像素视场的周围覆盖了大片区域[9]。

特别是，采用图片采集方法( 图 2.1)的一个点P1，在图像区域，用复数θi re

z =的标记，通过对数转换被映射为P2在传感器空间变形的区域。

θθi r re i +=)log()log( （2．1）这种关系可把极坐标转换到直角坐标系。以上提出的映射显示一些有趣的特性。径向线被映射水平线并且圆弧集中到圆心处的垂直线；产生的结果是回转体和

尺寸径向线被简单卷积转换出来。

图2.1 圆行视场和相应的卷积

采集映射的反馈在起始点(z=0)是显著的，为避免这个问题作者引入一个实常数a ；映射函数变为：

)log(a z w += if 0)Re(≥z

)log()log(2a z a w +--= if 0)Re(

２）常数a 是在图像几乎是的线性区域区的一个测量值。在这个区域我们得[z] << a ，在这个假设之下可以得到：

a z

a f z f z f +≈'+≈)log()0()0()( （２．３）

因子l/a 是像点在锅中的放大率和传感器的矩阵求解有关：如果我们固定一个角度方法k(沿圆周的像素数目)，像素尺寸是：

k I π

2= （２．４）通过引入放大因子我们可以得到它的像素尺寸：

k a L fov π2= （２．５）这种标记的结果是一个典型蝴蝶形状。测量传感器的全部视场区域可以为被描述为半径为R 圆(R>> a)。如果像素数目为n,沿采集图的X 轴方向的像素尺寸是：

n a R a R a I )

/log(2))log()log(2(≈-+= （２．６）

如果像素是固定的并是四方形的，从上面的公式（2.4和2.6）我们可以得到： )l o g (a R k

n π= （２．７）像素总数在采集图中为

)log(222

log a R

k kn N π≈≈ （２．８）

另外一个固定程序的有同样视场和同样程序的传感器在图形中有

222222a R k L R N fov unif ππ== 个像素。

在固定方案的传感器情况下，如果我们保留锅形方法的常数，像素点的数量非常迅速增长为)(2R O RN unif =，此外在用采集传感器的情况下增长规律是

)(l o g l o g R O N =。

2.2连通性图表

当采取采集映射局部连通性时对4连通性或8连通性的标准图象处理是不同寻常的，它的特征被附近的非固均匀传感器所公用。这些畸变的像素不存在且有非常多个非标准的邻域。在蝴蝶右翼的像素与在左边的像素有关(图 2.2)。为了进行图像处理开发拓扑结构传感器的处理，作者[6]开发了一个基于连通性图表使用的技术。

图2.2 图2.1的连通性图表

图G = (V ， E)描绘拓扑结构传感器的特性通过设置垂直量V (每v 垂直量对应于一个像素点)并且边缘E (边缘对应于一个毗邻物理联系)，从这个假定这种邻里跟随的定义如下：N={q|(p,q) ∈E }。

使用连通性图表，我们可以建立图象处理的常规库，它是的独立于几何传感器

的。我们可以显示二个共同性的操作定义，频繁地用于图象处理：边缘探测器

2)())

()(()(1

)(∑∈-=p N q q L p L p N p e （２．９）

并且拉普拉斯计算

∑∈-=)()()()()(p N q p L p L p N p e

（２．１０）

注意对连通性图表的应用应避免图像处理问题交付到图像的界限(每个像素点都能正确地处理)。

连通性图表应用价值在于大的CCD 图像传感器的领域。这些设备是非常昂贵因为低生产量。有图像瑕疵的Utsing 传感器，费用变得很便宜。一个适当的连通性图表可以联接到每个传感器，因此坏像素点就不用考虑。

2.3原型系统的原型系统

原型系统的原型系统[10]由一个效仿卷积传感器(但VLSI 的传感器一直在研究之中)建立在三个正交电机绕组驱动的一个永久磁场的一个小型云台。该驱动器配置用来实现一个开环运动的小型摄像传感器。这一机制，称为球面方向电机( SPM )以几百度每秒的速度移动传感器通过大约有?60的视场。SPM 的尺寸为4x5x6cm,重170g 。

照相机传感器包括一个商用CCD 和普通镜头尺寸为8x8x10 mm 。标准CCD 图像转化为一个卷积有1378个像素的图像。在低分辨率镜头以每?175.0个象素已经实现，横向视野大小为?33。系统输出高达30帧每秒。普通的卷积传感器芯片应该支持数千帧每秒。控制器包括一个摄像头驱动器，2个MIPS 可编程单片机(摩托罗拉MC68332)，视频显示器和三个12位数字信号处理器；第一个相机读取数据，计算映射并将图像传送到控制器。二是作为一个视频显示器，第三(可选)，可将4卷积医加栽到标准电话线上。

简单工作已经集中到随机存储器，以测试Cortex I 系统的性能。运动追踪的应用能够带动摄像传感器跟踪移动物体。第二个应用是车牌跟踪和读取，完成这个任务是主机。Cortex I 系统的沿轨道驱动小车，并把像发送到主机。