基于WVD的文档图像纠偏算法

合集下载

基于Labview的图像测量技术标定方法

基于Labview的图像测量技术标定方法

基于Labview的图像测量技术标定方法摘要图像测量技术在工业现场的应用日益广泛,已成为产品几何尺寸测量的重要方法。

但光学镜头的径向畸变对测量结果有着很大的影响,本文着重介绍利用Labview开发平台下的vision组件对测量图像进行标定,能够很好的克服传统标定方法在现场应用的局限性,同时能将标定结果保存为独立文件,方便调用。

通过对实际物体的测量,验证了方法的可行性,能够很好的提高测量精度。

关键词Labview;图像测量技术;畸变;标定0 引言近年来,随着CCD感光元件分辨率的提升以及价格的降低,图像测量技术已经广泛应用在各行业产品几何尺寸的测量上面。

所谓图像测量技术,就是利用光电成像系统来采集产品的图像,将图像传输至计算机进行数字图像处理,再根据图像中目标区域的特征用相应的算法进行测量并得出结果。

依托于计算机快速的计算能力,可以大大降低现场工人的工作量,提高生产的自动化程度。

利用图像测量技术测量物体几何尺寸时,由于光学镜头固有的缺陷,会使采集的图像存在非线性的几何畸变,对测量精度产生很大的影响。

必须对系统进行标定以消除误差。

标定实际是确定相机内外参数的一个过程。

相机内部参数包括焦距和畸变系数,外部参数包括相机坐标系和世界坐标系之间的对应关系。

传统的标定方法很多,如Tsai两步法,Weng迭代法,张正友双平面法等,应用较为广泛,但实际的标定过程比较繁琐。

本文介绍基于Labview开发平台下vision组件的标定方法,能很好的解决这些问题。

1 关于Labview开发平台及vision组件Labview(Laboratory Virtual Instrument Engineering Workbench)是一种程序的开发环境,由美国国家仪器(NI)公司研制。

使用图像化编程语言G语言编写程序,是目前功能最强大,应用最广泛的图像化软件开发环境。

Lavbiew不仅仅是一种编程工具,而是一种高度集成化的开发平台。

一种基于页眉线的扭曲文档图像快速校正方法

一种基于页眉线的扭曲文档图像快速校正方法

一种基于页眉线的扭曲文档图像快速校正方法
曾凡锋;段漾波
【期刊名称】《图学学报》
【年(卷),期】2016(000)001
【摘要】在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。

对于含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。

首先分别检测并定位图像中的页眉线,保存页眉线的坐标信息。

根据等比算法计算页眉线上各点在校正时所需向上或向下移动的距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距离,同时进行像素点的移动重构图像,最终得到校正的图像。

实验结果表明,该方法校正效果明显,对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR识别率大幅度提高。

【总页数】5页(P79-83)
【作者】曾凡锋;段漾波
【作者单位】北方工业大学计算机学院,北京100144;北方工业大学计算机学院,北京 100144
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种基于页眉线的扭曲文档图像快速校正方法 [J], 曾凡锋;段漾波;
2.基于文本域分割和文本行检测的扭曲文档图像校正 [J], 张再银;童立靖;湛健;沈

3.改进的文档图像扭曲校正方法 [J], 宋丽丽;吴亚东;孙波
4.基于连通域的扭曲中文文本图像快速校正方法 [J], 曾凡锋;郭正东;王战东
5.一种复杂版面扭曲文档图像快速校正方法 [J], 曾凡锋;段漾波
因版权原因,仅展示原文概要,查看原文内容请购买。

基于实时视频图像中边缘检测方法的在线轧钢纠偏系统

基于实时视频图像中边缘检测方法的在线轧钢纠偏系统

置 ! 且图像质量较好的大小为 %!"&!" 的矩形区域进行处理 "
$!)$"0% !#/% %/!!)$" !#/% %/!)$"/% !#/% %%%’
% $( "’%!#0%/("’%!#/%/("!#0%/("!#/%0("*%!#0%0("/%!#/%0("*!!#0%0("*!!#/%% (
基于实时视频图像中边缘检测方法的 在线轧钢纠偏系统
宋 伟 !安徽大学特种电视技术中心 "合肥 !1""13 #
摘 要 提出了一种高效的在实时视频图像中检测轧钢钢带边缘的方法 " 该方法采用局部图像处理策略以降低计算量 " 根据钢带图像特征 " 设计了一种空间滤波器 " 在消除噪声的同时 " 能够保留较多边缘信息 $ 同时基于计算出的边缘点位置 的二维分布特征提出了一种简单 % 有效的边缘位置判断算法 " 从而可实时测出钢带的位置偏移量 $ 并构造了实际的图像 采集 % 处理和控制系统 " 取得良好的效果 $ 关键词 图像处理 边缘检测 实时视频图像 文章编号 %""!4(11%5 &!""##!"5"!%35"1 文献标识码 6 中图分类号 7813
%
简介
从视频图像中识别出某些图像特征 ! 是在无法进行接触式
!
系统结构
该系统采用两路摄像头分别采集钢带左右两侧的动态图
测量时实现动态监测和控制的基础 ! 这在工业领域尤其是在钢 铁 "水 泥 等 高 温 "封 闭 的 恶 劣 生 产 环 境 下 有 着 极 其 广 泛 的 应 用 前景 # 但特征识别需要对图像进行滤波 " 增强 " 识别等一系列处 理 ! 运算量大 ! 而视频图像质量较差 ! 特征识别对速度和精度的 要求更高 ! 需要根据图像的具体特点采取相应的策略 $ 本文针 对轧钢生产线上的炉内视频监控图像采取了一系列高效处理 方法 ! 为解决这一问题提供了思路 $ 在 轧 钢 生 产 线 上 !板 带 在 各 个 机 组 之 间 高 速 运 转 !由 于 生 产线的延伸和机组运行速度的变化! 以及板带自身因素的影 响 ! 板带会偏离原先的预定中心位置 $ 板带偏离会造成卷取后 的产品边缘不整齐 ! 偏离的位置过大则会成为事故的隐患 ! 使 安全生产受到影响 $ 若使生产线处于最佳工作状态 ! 必须始终 保持板带处于转动辊的中心位置 $ 在传统的板带纠偏系统中 ! 大 多 都 采 用 单 片 机 控 制 系 统 !由 于 生 产 线 工 作 条 件 恶 劣 ! 振 动 强度大 % 温度高 " 污染严重 ! 使单片机在这样的环境下工作很不 稳定 ! 另外传统的纠偏系统无法对炉内图像进行实时观察 ! 导 致纠偏精度低 ! 维护费用高 ! 操作不方便等缺点 $ 这里 ! 我们采 用近红外成像技术得到炉内的视频图像 ! 并对图像进行相应的 处 理 和 边 缘 识 别 !得 到 板 带 的 偏 离 数 据 !从 而 给 出 相 应 的 控 制 信号实现板带纠偏 $ 本文重点介绍了局部处理策略 ! 滤波 ! 边缘 检测和边线判定方法 $

测绘技术中的数据纠偏方法介绍

测绘技术中的数据纠偏方法介绍

测绘技术中的数据纠偏方法介绍测绘技术是利用一定的测量方法和仪器设备,获取地球表面各种空间数据,并绘制出具有一定尺度和精度的地图或三维模型。

随着测绘技术的发展和应用范围的扩大,对数据的准确性和精度需求也越来越高。

其中,数据纠偏方法是测绘技术中一个重要的环节。

数据纠偏是指在获取测量数据时,由于种种原因导致的误差,对数据进行修正的过程。

纠偏后的数据可以更准确地反映地球表面的真实情况,提高测绘数据的精度和可靠性。

数据纠偏方法有很多种,下面将介绍几种常见的数据纠偏方法。

一、坐标转化坐标转化是一种常见的数据纠偏方法。

它是将测量数据从一种坐标系统转化到另一种坐标系统的过程。

在测绘活动中,常见的坐标系统包括大地坐标系统、投影坐标系统等。

大地坐标系统是描述地球表面上各点位置的一种坐标系统,它以地球参考椭球体为基准,通过经纬度来确定地球上的位置。

而投影坐标系统是为了方便地图制作而设计的坐标系统,它将地球表面的经纬度坐标投影到平面上,以x、y坐标来表示地面的位置。

在测量过程中,通常需要将大地坐标转化为投影坐标,或反过来进行转化。

坐标转化的过程需要根据坐标系统之间的转换参数进行计算,这些参数包括投影方式、中央经线、偏心率、高程等。

通过坐标转化,可以纠正因不同坐标系统导致的数据误差,提高数据的准确性和可比性。

二、差分定位差分定位是一种利用卫星信号进行数据纠偏的方法。

它通过将一个已知位置的接收器(称为参考站)和一个待测位置的接收器进行比较,利用两者之间接收到的卫星信号的差异,来计算待测位置的误差,并进行修正。

差分定位需要利用全球定位系统(GPS)或其他类似的卫星导航系统。

它的原理是通过接收来自卫星的定位信号,测量接收器与卫星之间的信号传播时间,进而计算出接收器与卫星之间的距离。

通过与参考站的距离差异,可以推导出待测位置的相对误差,并对数据进行纠偏。

差分定位可以大大提高测量数据的准确性和稳定性。

它广泛应用于测绘、地理、导航等领域,可以为各种应用提供高精度的位置信息。

基于游长平滑的文档图像倾斜校正

基于游长平滑的文档图像倾斜校正

基于游长平滑的文档图像倾斜校正
汪同庆;朱永权;王洪
【期刊名称】《计算机工程》
【年(卷),期】2004(030)001
【摘要】图像获取设备将纸质文档转换为文档图像时,文档图像不可避免地存在一定的倾斜.目前,对于倾斜文档图像的处理仍然存在许多困难,因此有必要对倾斜的文档图像进行倾斜校正.但是文档版面十分复杂,包含文字、图像、图形和表格等内容,所以文档图像倾斜校正存在着一定的困难.文章提出了基于游长平滑处理的文档图像倾斜校正方法,实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点.已经在重庆市北碚区档案管理数字化系统中得到成功应用.
【总页数】3页(P141-143)
【作者】汪同庆;朱永权;王洪
【作者单位】重庆大学光电技术及系统教育部重点实验室,重庆,400044;重庆大学光电技术及系统教育部重点实验室,重庆,400044;重庆大学光电技术及系统教育部重点实验室,重庆,400044
【正文语种】中文
【中图分类】TP774
【相关文献】
1.基于版面的拍照文档图像倾斜校正 [J], 荆雷;张欣;郭金鑫
2.基于纹理梯度的文档图像的倾斜校正方法 [J], 夏波涌;童悍操
3.基于投影的文档图像倾斜校正方法 [J], 张顺利;李卫斌;吉军
4.基于数学形态学的文档图像倾斜校正算法 [J], 张吉玲;王希常;刘江
5.一种基于Radon变换的文档图像倾斜校正改进算法 [J], 李志明
因版权原因,仅展示原文概要,查看原文内容请购买。

数字图像的纠正过程

数字图像的纠正过程

数字图像的纠正过程数字图像几何纠正:通过计算机对离散结构的数字图像中的每一个像元逐个进行纠正处理的方法。

基本原理:利用图像坐标和地面坐标(另一图像坐标、地面坐标等)之间的数学关系,即输入图像和输出图像间的坐标转换关系实现。

纠正函数纠正的函数有多种:多项式方法、共线方程方法、随机场内插方法等。

多项式方法应用最普遍。

多项式纠正的基本思想:图像的变形规律可以看做是平移、缩放、旋转、仿射、偏扭、弯曲等形变的合成。

直接纠正方法:从原始图像阵列出发,按行列的顺序依次对每个原始图像像元点位用变换函数 F ()(正解变换公式)求得它在新图像中的位置,并将该像元灰度值移置到新图像的对应位置上。

⋯⋯++++++==25243210),(i i i i i i i i x i y c x c y x c y c x c c y x F X ⋯⋯++++++==25243210),(i i i i i i i i x i y d x d y x d y d x d d y x F Y间接纠正法:从空白的新图像阵列出发,按行列的顺序依次对新图像中每个像元点位用变换函数f () (反解变换公式)反求其它在原始图像中的位置,然后把算得的原始图像点位上的灰度值赋予空白新图像相应的像元。

⋯⋯++++++==25243210),(i i i i i i i i x i Y c X c Y X c Y c X c c Y X f x ⋯⋯++++++==25243210),(i i i i i i i i x i Y d X d Y X d Y d X d d Y X f y确定新的图像的边界:纠正后图像和原始图像的形状、大小、方向都不一样。

所以在纠正过程的实施之前,必须首先确定新图像的大小范围。

求出原始图像四个角点(a,b,c,d )在纠正后图像中的对应点(a ’,b ’,c ’,d ’)的坐标(Xa’,Ya’) (Xb’,Yb’) (Xc’,Yc’) (Xd’,Yd’),求出x,y坐标的最大最小值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第33卷第5期 2006年5月 应 用 科 技 

Applied Science and Technology Vo1.33.No.5 

Mav 2006 

文章编号:1009—671X(2006)05—0034—03 

基于WVD的文档图像纠偏算法 李静梅,姚成浪,冉祥金 (哈尔滨工程大学计算机科学与技术学院.黑龙江哈尔滨150001) 摘要:提出了一种效率很高的文档图像纠偏算法,即利用文档图像的水平投影值,得到水平投影值的维格 纳一威利分布.根据维格纳一威利分布的极值的最大值得到偏斜角度,实验结果验证了算法的有效性. 关键词:文档图像;维格纳一威利分布;图像纠偏 中图分类号:TP301 文献标识码:A 

A deskew algorithm of documentary images based on WVD LI Jing—mei,YAO Cheng—lang,RAN Xiang—jin (School of Computer Science and Technology,Harbin Engineering University,Harbin 150001,China) 

Abstract:This paper describes an efficient and automatic deskew algorithm for documentary images.WVD(Wign— er—Ville distribution)is attained by using the horizontal projection value of the documentary image.The skew angle can be obtained by calculating the maximal extreme value of WVD.The experimental results confirm the effective— ness of the algorithm. Keywords:documentary image;WVD;image deskew 

由于文档放入扫描不可能摆放非常水平。总是 或多或少有些偏斜.计算文档图像偏斜角度对于文 档图像的自动拼接和文字识别(OCR)是一个很重 要的环节.很多人提出了各种各样的解决方法,Dan Bloomberg提出投影轮廓技术(projection profile),翟 洋、杨利平 应用了哈夫变换法(Hough transform); LU Y、TAN C L 提出了连接组件(connect compo— nent)技术;曲新亮、魏守水、杜洋’ 应用了Gabor小 波变换实现图像倾斜矫正.但这些图像纠偏方法,大 多适用小角度(一15,+15)纠偏,当遇到大角度偏 斜时效果不佳,而且有一些算法使用了哈夫 (Hough)算法,导致耗费的时间太长,还有一些算法 受到字体、版面、图形和边界的干扰. 

1 维格纳一威利分布(WVD) WVD分布是一种时频分析方法,它将一维的时 域信号 (t)映射成1个时间频率平面上的二维信 号 (t,W),从而可描述1个信号的频率随时间的 变化.时域信号 (t)的WVD分布定义为 (t ):J (t+r/2) (t—r/2)e-j2 ‘dr, J— 频域信号 ( 的WVD定义为 一+∞ (f :f.X(f+(/2)X ( 一(/2)e-j2 . 本文中以图像的高度对应于时间t,水平投影值 对应于 (t),得到图像的水平投影WVD. 2 算法的原理 图1给出了1个词组4个不同的角度和对应的 直方图.水平投影直方图是指逐行统计文档图像水 平方向上的黑色像素点个数,并以统计直方图的形 式将其分布状况体现在平面直角坐标系中.定义 和H分别表示经二值化后文档图像的宽度和高度, 作水平方向投影,并累加各行上的黑色像素点,即 W—l c E ]=∑g( , ),0≤i<H,0≤J<W. J=0 式中: 表示该像素点所在的行,J.表示该像素点所 在的列,C[i]表示第i行上黑色像素点的总数.可 见0。和180。(即正向和反向)时,水平投影直方图 收稿日期:2oo5—09—07. 作者简介:李静梅(1964一),女,副教授,主要研究方向:图像处理和模式识别,E-mail:Lijingmei@hrbeu.edu.cn 

维普资讯 http://www.cqvip.com 第5期 李静梅,等:基于WVD布的文档图像纠偏算法 ・35・ 可达到最大峰值 

60。的词组和其对应的投影特征 中国电信 

的词组和其对应的投影特征 

(c)顺时针旋转30。的词组和其对应的投影特征 } E } 毋 

(d)处于竖直的词组和其对应的投影特征 图1 1个词组不同的角度和对应的直方图 图2给出了文档图像角度与水平投影直方图对 应的WVD的极值密度对应的关系.WVD的极值密 度是指将文档图像进行旋转,对每个旋转角生成相 应的水平投影直方图,并由该直方图计算出WVD 以及其所对应的极值密度值.因此文档图像的每个 旋转角的直方图均对应有WVD极值密度值.从图 中可以看出,文档图像越靠近水平方向,水平投影直 方图对应的WVD的极值数量就越大,即极值的密 度越大,当文档图像处于水平方向,水平投影直方图 对应的WVD的极值的密度最大,所以计算出水平 投影直方图对应的WVD的极值密度的最大值对应 的角度,就能得到图像的偏斜角度. 

崔 g 0 > 

≥ 

角度 图2各个角度对应直方图的WVD极值的密度 

3 图像纠偏算法 为了提高运算速度,只取文档图像的一小部分 

做代表来计算偏斜角度,为了避免文档图像里面的 图形的影响,只计算黑像素到白像素和白像素到黑 像素的重心;而且对应每一个不同的角度不必都计 算水平投影直方图及其对应的WVD的极值密度, 否则会增加很多额外的计算量.本算法开始采用较 大的步长得到一个大约的位置,然后逐步缩小范围, 减小步长,最终得到偏斜角度.具体算法为 1)选取图像的一部分 (1)计算文档图像计算黑像素到白像素和白像 素到黑像素的重心; (2)以图像的重心为中心取1块大小为400× 400pixel区域; 2)计算文档图像的偏斜角度. (1)设置初始步长为10。,搜索范围为(一89。,89。); (2)计算各个角度的水平投影直方图; (3)计算水平投影直方图对应的WVD; (4)得到各个WVD的极值密度,从而得到最大 的极值密度对应的角度ANG1; (5)设置步长为1。,搜索范围为(ANG1—5, ANG1+5); (6)计算各个角度的水平投影直方图; (7)计算水平投影直方图对应的WVD; (8)得到各个WVD的极值密度,并得到最大值 密度对应的角度ANG2; (9)设置步长为0.1,搜索范围为(ANG2—0.5, ANG2+0.5): (10)计算各个角度的水平投影直方图; (11)计算水平投影直方图对应的WVD; (12)得到各个WVD的极值密度,并得到最大 的极值密度对应的角度ANG3; (13)得到最终的纠偏角度: Angle=ANG1 10+ANG2 1+ANG3 0.1 3)文档图像旋转相应的角度 具体实现代码如下: calculate—image

—barycenter(); 

set—

selection

—area(); 

Angle=一89; while Angle<=89{ rotate[Angle]; calculate—horizontal—histogram[Angle]; 

calculate—WVD[Angle]; 

Angle+=10: 

旋 ~ }一 一 

维普资讯 http://www.cqvip.com ・36・ 应 用 科 技 第33卷 } ANG1=peakofmaximum

—intensity[Angle]; 

rotate[ANGLE1 10]; Angle=一5: while Angle<=5{ rotate[Angle]; calculatehorizontal—histogram[ANGLE] 

calculate—WVD[ANGLE] 

Angle=Angle+1 

ANG2=peak—of—maximum—intensity[Angle]; 

rotate[ANG2 1]; Angle=一0.5: while Angle<=0.5{ rotate—

window[Angle]; 

calculate—horizontalhistogram[Angle]; 

calculate—WVD[Angle]; 

Angle=Angle+0.1: } ANG3=peak—ofmaximumintensity[Angle]; 

Estimated_Angle=ANG1 10+ANG2 1+ANG3 0.1: 

rotateimage[Estimated—Angle]; 文档图像纠偏前后效果对比见图3. 

(a)偏斜的文档图像 

(b)纠偏后的文档图像 图3偏斜的文档图像和纠偏后的文档图像 

4 结束语 本文提出的算法纠偏速度快,试验中使用的电 脑的主要配置是CPU 3.00 GHz、内存1.00 GB、硬盘 160 GB,操作系统是Windows XP,采用的文档图像 大小是1 2ll x 1 750 pixel,平均耗费时间422 ms.这 个速度远远快于Hough变换倾斜校正,而且本算法 不受版面的影响,角度在(一89。,89。)都可以准确 地找到纠偏角度. 

参考文献: [1]翟洋,杨利平.Hough变换OCR图像倾斜矫正方法 [J].中国图形图像学报,2001,6(2):178—183. [2]Lu Y,TAN C L.A nearest—neighbor chain based approach to skew estimation in document images[J].Pattern Recog・ nition Letters,2003,24:23 15—2323. [3]曲新亮,魏守水,杜洋.一种基于Gabor小波变换的图 像倾斜矫正算法[J].微机发展,2004,14(11):19—20. [4]KAVALLIERATOU E,FAKOTAKIS N,KOKKINAKIS G.Skew angle estimation using Cohen S class distribution [J].Pattern Recognition Letters,1999,20:1305—13 12. 

[责任编辑:李雪莲] 

维普资讯 http://www.cqvip.com

相关文档
最新文档