汉字图像预处理算法的研究及实现

合集下载

字迹消除算法

字迹消除算法字迹消除算法是一种用于去除图片或文档中的字迹或笔迹的技术。

它在图像处理和计算机视觉领域具有广泛的应用。

本文将介绍字迹消除算法的原理、方法和应用。

字迹消除算法的原理是基于图像处理和机器学习技术。

它通过对图像中的字迹进行分析和识别，然后根据识别结果去除字迹。

字迹通常是由于手写、标记或其他方式在图像中添加的，因此可以通过对图像中的像素进行处理来实现字迹的消除。

字迹消除算法的方法可以分为两大类：基于规则的方法和基于机器学习的方法。

基于规则的方法是指根据字迹的形状、颜色、纹理等特征，通过设定一些规则或模板来判断和去除字迹。

这种方法适用于字迹比较规则和简单的情况，但在复杂的字迹场景下效果有限。

而基于机器学习的方法则是利用机器学习算法对字迹进行训练和识别。

首先，需要构建一个训练集，包含有字迹和无字迹的图像样本。

然后，通过对这些样本进行特征提取和分类器训练，得到一个模型。

最后，使用这个模型对新的图像进行字迹识别和消除。

这种方法可以适应各种复杂的字迹场景，并且具有较高的准确性和鲁棒性。

字迹消除算法在很多领域都有广泛的应用。

例如，在文档处理和扫描仪中，字迹消除算法可以用于去除扫描文档中的背景噪声和手写笔迹，提高文档的可读性。

在图像去水印中，字迹消除算法可以用于去除图像中的水印，保护图像的版权和隐私。

在数字图书馆和档案管理中，字迹消除算法可以用于去除老旧文档中的字迹和污渍，恢复文档的原貌和可读性。

除了应用领域外，字迹消除算法还有一些挑战和问题需要解决。

首先，字迹的形状、颜色和纹理各不相同，如何设计有效的特征提取和分类器训练方法是一个关键问题。

其次，字迹消除算法需要处理大量的图像数据，如何提高算法的效率和性能也是一个重要的研究方向。

此外，字迹消除算法还需要考虑图像的光照、噪声和变形等因素，以提高算法的鲁棒性和稳定性。

字迹消除算法是一种有广泛应用前景的图像处理技术。

它通过对图像中的字迹进行分析和识别，实现了字迹的自动消除。

文字识别技术的原理与应用

文字识别技术的原理与应用随着现代科技的不断发展，文字识别技术成为了人们生活中必不可少的技术之一。

无论是在工作中还是生活中，我们都会将与文字相关的内容进行文字识别处理，这里就介绍一下文字识别技术的原理与应用。

一、文字识别技术的原理在介绍文字识别技术的原理之前，我们需要了解一下OCR技术，OCR全称为Optical Character Recognition，即光学字符识别技术。

OCR技术是一种将图像中的文字和符号转化为文本形式的技术，属于图像识别和计算机视觉领域。

文字识别技术的原理与OCR技术紧密相关，主要通过以下几个步骤来完成：1. 图像预处理：在文字识别之前，需要对图像进行处理，根据需求进行二值化、降噪、图像增强等处理，以提高文字的识别率。

2. 分割字符：对于多个字符在一张图片中的情形，需要对图片中的字符进行切割，以便后续识别。

3. 字符识别：根据预处理后的图像和分割后的字符，使用OCR 算法对字符进行识别处理，将字符转化为计算机可以识别的文本形式。

4. 后处理：根据识别结果进行后处理，如去重、修正错误识别字符等，最后得到正确的文本结果。

总的来说，文字识别技术主要通过图像预处理、分割字符、字符识别和后处理这四个步骤来实现。

二、文字识别技术的应用1. 文字识别技术在金融行业的应用在金融行业，文字识别技术主要应用于票据扫描和结算业务。

票据扫描主要是将普通的纸质票据、电子票据等通过扫描仪等设备进行扫描，通过OCR算法和文字识别技术对其进行识别，将获取到的数据自动录入到相应的系统中，以便于后续对票据进行管理和核对。

在结算业务中，文字识别技术主要用于检测付款人和收款人信息是否一致，防止出现欺诈等问题，同时也可以提高结算的速度和准确性，减少人工处理时间和出错率。

2. 文字识别技术在医疗行业的应用在医疗行业，文字识别技术主要应用于医学图片转化、文字识别以及病历管理等方面。

例如，医学图片转化可以将医学影像图、X光片等通过文字识别技术实现数字化转化，提高医学数据存储、传输、比对和研究的效率。

古籍ocr的数据、方法和应用

古籍ocr的数据、方法和应用1.引言1.1 概述随着科技的不断发展，古籍OCR（Optical Character Recognition，光学字符识别）技术逐渐崭露头角，并在文献数字化与保护、学术研究与教育应用等领域展现出巨大的潜力。

古籍OCR是指将古代文献中的文字通过计算机进行自动化识别和转换的技术。

在很长一段时间里，古籍是以纸质形式存储和传播的，这给其文献保护、数字化和研究带来了很大的挑战。

传统的古籍研究需要人工耗时耗力地阅读、解读和整理大量的古籍文献。

而古籍OCR技术的出现，使得古籍的数字化处理和利用变得更加高效和便捷。

古籍OCR的基本思想是通过光学设备将古籍文献的纸质原稿转化为电子图像，然后利用机器学习、图像处理和自然语言处理等技术对图像中的文字进行识别和提取。

这项技术的目标是将古籍中的文字准确地转换为可编辑、可搜索和可存储的电子文本，以便于后续的数字化和利用。

古籍OCR的数据来源主要包括博物馆、图书馆、学术机构等拥有大量古籍文献资源的单位。

这些数据不仅包括汉字、图形等各类文字信息，还涉及到不同时期、不同版本的古籍文献。

这些数据的多样性和复杂性对古籍OCR技术的研究和应用提出了挑战，也为研究者提供了丰富的研究材料和实践平台。

古籍OCR的方法主要包括光学字符识别技术和图像处理技术。

光学字符识别技术通过对文字图像进行分析和模式匹配，将图像中的文字识别成计算机可处理的文本数据。

图像处理技术则主要用于对图像进行增强、降噪和切割等操作，以提高OCR的准确性和稳定性。

古籍OCR的应用广泛涉及到文献数字化与保护和学术研究与教育应用两个方面。

在文献数字化与保护方面，古籍OCR可以将大量的纸质古籍转化为电子文本，从而实现古籍的数字化保存和传播，有效地保护了珍贵的文化遗产。

在学术研究与教育应用方面，古籍OCR可以为研究者提供大量的文献资源，为学术研究和教学活动提供支持和便利。

总之，古籍OCR在数据、方法和应用方面都有着广阔的发展前景。

使用图像处理技术实现文字识别与提取

使用图像处理技术实现文字识别与提取近年来，随着图像处理技术的不断发展，文字识别与提取的应用也越来越广泛。

利用图像处理技术，我们可以从图片、视频等非文字形式的媒体中提取出文字信息，为实际应用带来了便利。

本文将介绍使用图像处理技术实现文字识别与提取的方法与应用。

文字识别与提取的基本原理是通过图像处理技术将图像转换为文字信息。

常用的图像处理技术包括图像预处理、特征提取与选择、模式识别等。

在文字识别与提取中，我们可以使用以下方法进行文字识别与提取。

一种常用的方法是基于光学字符识别（OCR）的文字识别与提取。

OCR是一种将图像中的文字转换为可编辑、可搜索的电子文本的技术。

该技术通过图像预处理、字符分割、字符识别等步骤，将图像中的文字信息提取出来。

OCR技术在实际应用中广泛使用，例如将纸质文档转换为电子文档、图像中的文字翻译等。

除了OCR技术，还可以使用卷积神经网络（CNN）进行图像中文字的识别与提取。

CNN是一种深度学习算法，通过多层卷积和池化层实现了对图像的特征提取和分类。

在文字识别与提取中，CNN可以通过训练大量标注的图像数据，学习到字母、数字等字符的特征，从而实现对图像中文字的识别与提取。

除了基于OCR和CNN的方法外，还可以使用基于模板匹配的文字识别与提取方法。

该方法通过事先准备好的文字模板与图像进行匹配，从而实现对图像中文字的提取。

该方法适用于文字的格式和字体相对固定的情况，例如车牌识别等应用场景。

文字识别与提取的应用领域非常广泛。

例如，在图像检索中，可以通过对图像中的文字进行识别与提取，实现对图像的内容进行搜索。

在自动驾驶领域，可以通过识别与提取道路交通标志中的文字，实现车辆的自动导航。

文字识别与提取还可以应用于手写体识别、身份证识别、银行卡识别等场景。

然而，文字识别与提取也面临一些挑战。

图像质量的影响。

如果图像清晰度低、光照不均匀等，将会影响文字识别与提取的准确性。

文字的多样性也是一个挑战。

基于CNN网络的汉字图像字体识别及其原理

基于CNN⽹络的汉字图像字体识别及其原理现代办公要将纸质⽂档转换为电⼦⽂档的需求越来越多，⽬前针对这种应⽤场景的系统为OCR系统，也就是光学字符识别系统，例如对于古⽼出版物的数字化。

但是⽬前OCR系统主要针对⽂字的识别上，对于出版物的版⾯以及版⾯⽂字的格式的恢复，并没有给出相应的解决⽅案。

对于版⾯恢复中主要遇到的困难是⽂字字体的恢复。

对于汉字字体识别问题，⽬前主要有⼏种⽅法，但是都是基于⼈⼯特征提取的⽅法。

以往的⽅法主要分为两⼤类，第⼀种为整体分析法，将⼀整⽚数据看做采⽤⼩波纹理分析抽取字体特征⽤于分类；使⽤滤波器提取⽂字的全局⽂字特征作为分类特征；使⽤⼩波包做多级分解，提取字体纹理特征的⽅法了；使⽤⼈⼯经验⽅式提取特征。

可以看到这些⽅法都有⼀个重要的缺陷，如果⼀个⽂字整个版⾯含有不同的字体信息，这种场景就不能采⽤整体分析法。

第⼆种为个体分析法，个体分析法对象为单个字符图像，依然采⽤⼩波分解提取特征。

这种⽅法需要知道单个汉字的图像，对于现代出版物的识别系统中，可以很容易得到单个汉字的图像。

很显然这种⽅法可以解决整体法不能解决⽂字中夹杂其他字符⽐如英⽂的情况。

另外有⼈提出特征点的⽅法来处理汉字字体识别，但是特征点的提取也是有问题，因为定义提取的特征需要⼈为⼲预。

由此可见，在考察完整体法和个体法来看，个体法明显更灵活并适⽤于多种情况。

但是应该看到传统⽅法基本上都是采⽤图像处理的⽅法，计算复杂度都很⾼。

另外不同汉字的外形差异是不⼀样的，⽽采⽤图像处理的⽅法往往不能有效解决这个问题。

综上所述，我们可以看到传统汉字字体识别⽅法的不⾜，因为汉字字符的复杂性，特征提取⽅法不能处理多变的汉字外形，特征点提取⽅法需要⼈⼯专家定义重要的特征点位置。

⽽且，对于哪些特征点重要也不能给出统⼀的标准。

故⽽基于CNN⽹络的字体识别⽅法可以靠卷积核以及池化层，⾃动⽣成特征，这就避免⼈为特征提取上的不稳定性以及盲点。

我们通过计算机内嵌的字体⽣成实验数据，然后训练CNN 深度学习⽹络。

基于神经网络的手写汉字识别技术研究与实现

基于神经网络的手写汉字识别技术研究与实现手写汉字识别技术的发展在近年来取得了重要突破，以神经网络为基础的识别方法被广泛应用和研究。

本文将对基于神经网络的手写汉字识别技术进行深入研究和实现。

一、引言手写汉字识别是计算机视觉领域中的一个重要问题，其应用广泛涵盖了人机交互、文本识别、自然语言处理等领域。

传统的手写汉字识别技术通常采用特征提取和模式识别方法，但其面对复杂的汉字结构和不同书写风格时，识别准确率较低。

近年来，随着深度学习和神经网络的快速发展，基于神经网络的手写汉字识别技术逐渐成为研究热点。

二、神经网络的原理神经网络是一种模拟人脑神经元网络的计算模型，其核心思想是通过模拟人脑神经元之间的连接，实现信息的自动处理和学习。

在手写汉字识别中，我们可以将每个汉字看作是一个模式，通过训练神经网络，使其能够准确地识别不同汉字模式。

神经网络的核心组件是神经元，每个神经元接收来自其他神经元的输入，并通过激活函数处理后生成输出。

神经网络的结构由多层神经元组成，包括输入层、隐藏层和输出层。

输入层接收手写汉字图像的像素作为输入，隐藏层通过一系列的加权和激活函数运算提取汉字的抽象特征，输出层则给出每个汉字的识别结果。

三、基于神经网络的手写汉字识别方法基于神经网络的手写汉字识别方法主要分为训练和测试两个阶段。

在训练阶段，我们首先构建神经网络的结构，并准备一批手写汉字的训练样本。

样本应包含多种不同书写风格和字体的汉字，并进行标记以便于后续的训练。

然后，我们通过反向传播算法不断调整神经网络的参数，使其能够准确地学习和识别手写汉字。

在测试阶段，我们使用另外一批手写汉字的测试样本来验证神经网络的泛化能力和准确率。

测试样本应包含未出现在训练集中的汉字，以检测神经网络是否能够正确识别新样本。

通过计算识别结果与标准结果的误差，评估神经网络的性能。

四、基于神经网络的手写汉字识别技术的实现为了实现基于神经网络的手写汉字识别技术，我们可以使用各种深度学习框架和工具，如TensorFlow、PyTorch等。

基于图像处理的数字字体手写体生成与识别技术研究

基于图像处理的数字字体手写体生成与识别技术研究随着信息技术的飞速发展，数字字体手写体生成与识别技术逐渐成为研究的热点之一。

该技术不仅可以应用于电子商务、自动化办公等领域，还在人工智能、智能手机等设备中有着广泛的应用。

本文将以图像处理为基础，从数字字体手写体的生成和识别两个方面来进行深入研究。

一、数字字体手写体生成技术数字字体手写体生成技术是指利用计算机算法和图像处理技术生成具有手写体风格的数字字体。

该技术的主要研究内容包括手写体风格建模、生成算法、数据集构建等。

1. 手写体风格建模手写体风格建模是数字字体手写体生成技术的基础。

通过收集大量的手写体样本，利用机器学习算法对其进行学习和建模，可以得到一个能够准确模拟手写风格的模型。

最常用的手写体风格建模方法是生成对抗网络（GAN），通过对抗训练的方式，生成出与真实手写体相似的数字字体。

2. 生成算法生成算法是数字字体手写体生成技术的核心。

基于手写体风格建模得到的模型，可以使用多种生成算法来生成手写体数字字体。

常见的生成算法包括随机生成、条件生成和自动学习生成。

其中，随机生成算法可以根据已有的手写体样本，生成出新的手写体数字字体。

条件生成算法则可以通过输入额外的条件信息，比如字体的大小、倾斜度等，生成出符合条件的手写体数字字体。

自动学习生成算法则是指机器学习模型根据输入的数字序列，自动学习生成对应的手写体数字字体。

3. 数据集构建数据集构建是数字字体手写体生成技术中不可或缺的一步。

构建高质量、多样化的手写体数字字体数据集对于模型的训练和生成效果具有重要影响。

数据集构建可以通过手动绘制、扫描真实手写体、字体生成软件等方式来进行。

在构建数据集的同时，还需要进行数据清洗和预处理，以提高生成算法的效果。

二、数字字体手写体识别技术与数字字体手写体生成技术相对应的是数字字体手写体识别技术，该技术是指通过图像处理和模式识别算法，将手写体数字字体转化为可识别的文本。

数字字体手写体识别技术在银行卡识别、自动填表等场景中有着广泛的应用。

文字识别原理

文字识别原理文字识别，又称为OCR（Optical Character Recognition），是一种通过计算机对图像中的文字进行识别和理解的技术。

它的基本原理是通过对图像进行预处理，然后提取文字特征，最终将文字转化为可编辑的文本格式。

文字识别技术在各种领域都有着广泛的应用，比如扫描文档、自动化数据输入、图书数字化等。

文字识别的原理主要包括图像预处理、文字定位、文字分割和文字识别四个步骤。

首先是图像预处理，这一步是为了提高文字识别的准确性。

图像预处理包括灰度化、二值化、去噪等操作，以便更好地提取文字特征。

其次是文字定位，通过文字定位可以确定图像中文字的位置和大小。

这一步通常使用边缘检测、连通域分析等算法来实现。

然后是文字分割，文字分割是将定位到的文字进行分割，以便后续的文字识别。

文字分割通常使用投影法、连通域分析等技术来实现。

最后是文字识别，文字识别是将分割后的文字转化为可编辑的文本格式。

文字识别技术主要包括模式匹配、神经网络、深度学习等方法。

文字识别技术的发展经历了几个阶段。

最早的文字识别技术是基于模式匹配的，它通过比对图像中的文字和已知的字符模式来实现文字识别。

然而，这种方法对图像质量和文字字体有较高的要求，且对于手写文字的识别效果较差。

随着深度学习技术的发展，基于神经网络的文字识别技术逐渐成为主流。

深度学习技术通过构建多层神经网络，可以更好地提取文字特征，从而提高文字识别的准确性和鲁棒性。

文字识别技术的应用也越来越广泛。

在办公自动化领域，文字识别可以实现扫描文档的自动化处理，大大提高工作效率。

在图书数字化领域，文字识别可以将纸质图书转化为电子文档，实现图书的数字化保存和检索。

总的来说，文字识别技术是一种十分重要的人工智能技术，它在各个领域都有着广泛的应用前景。

随着深度学习技术的不断发展，文字识别技术的准确性和稳定性将会得到进一步提升，为人们的生活和工作带来更多的便利。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Circle) 和基于笔画间隔 (Line Interval) 两种 ,这几类方法的
图7 非线性归一化前图8 非线性归一化后的手写体汉字图像
将式 ( 1) 代入式 ( 2) 即可得到简化的归一化公式 ( 3) 。
M I N n = j × J m = i × ( 3)
有了以上公式 , 即可得到线性归一化算法 , 图 5 和图 6 分别是经该算法处理前后的楷体汉字图像 , 线性归一化算法可如下描述 :
图3 位置归一化前的图4 位置归一化后的宋体汉字图像宋体汉字图像图5 线性归一化前的楷体图6 线性归一化后的楷体汉字图像 ( 120 × 120) 汉字图像 ( 64 × 64)
Study and Realization of Algorithms f or Chinese Characters Image’ s Preprocessing
ZHAN G Shi2hui
( Dept . of Computer , Yanshan University ,Qinhuangdao HB 066004 ,China)
由于汉字字形、字体繁多 , 同一汉字的特征也因此而不同 ,为了便于统一描述和提取同一汉字的特征 , 对不同字形、字体汉字均能识别 ,为汉字识别工作打好基础 ,在汉字特征提取前还需对汉字图像进行大小归一化的操作。所谓大小归一化就是指对不同大小的汉字图像做变换 ,使之成为同一尺寸大小的文字。汉字图像的大小归一化方
第 13 卷第4期微机发展 Vol. 13 No. 4 2003 年 4 月 Microcomputer Development Apr. 2003
汉字图像预处理算法的研究及实现
张世辉
( 燕山大学计算机系 ,河北秦皇岛 066004)
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.
5 微机发展第 13 卷・ 4 ・ Step1 : 找左边界。
其中 , H ( i ) , V ( j ) 分别表示水平和垂直方向的投影 , i =
1 , 2 , …, I , j = 1 , 2 , …, J 。
Step 2 : 找右边界、上边界和下边界 , 原理同上 , 用 Right Edge 、 Up Edge 和 DownEdge 分别表示之。 Step3 : 根据四个边界值画出四个边框。 113 归一化
・55 ・
( 2) 非线性归一化。线性归一化的变换函数为线性函
数 ,不能解决汉字图像的变形问题 , 故提出了非线性归一化的方法。非线性归一化是通过密度均衡的方法实现大小归一化 ,这方面日本学者提出了几种具体方法 , 以消除输入模式的各种变形 , 从而易于抽取到较为稳定的特征 , 这些方法大致分为以下三类 : ① 点密度均衡的方法 ( Dot Density Equalization) ; ② 线密度均衡的方法 (Line Density Equalization) ; ③ 笔画穿透数均衡方法 ( Crossing Line Number) 。其中 ,线密度均衡方法又分为基于内嵌圆 ( Inscribed
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.

第 4 期张世辉 : 汉字图像预处理算法的研究及实现
将图像 PP 中的像素点 (ii ,jj) 设置为黑色 / / 将此语句放入内两层循环中的目的是为了保证原始汉字图像小于 64 ×64 点阵时也能得到较好的效果。 ENDIF
M , n = 1 , 2 , …, N 。 ( m , n ) 为与原始图像中坐标点 ( i , j ) 对应的归一化后图像中的坐标点。
找到汉字图像区域后 ,为了消除汉字点阵位置上的偏差和方便汉字特征描述、提取 , 还需对汉字图像进行位置归一化 ,所谓位置归一化就是把任何一个汉字图像都放到某一固定的位置。位置归一化前后的宋体汉字图像分别见图 3 和图 4 ( 图中以汉字图像外围框的左上角作为归一化的基准位置) ,位置归一化算法描述如下 :
收稿日期 :2002 - 09 - 05
) ,男 ,河北人 ,讲师 ,博士生 ,主要研究方向作者简介 : 张世辉 (1973 —
图1 汉字图像 P 的坐标系图2 找边框后的汉字图像
输入 : 原始汉字图像输出 : 画出边框的汉字图像

为智能信息处理、计算机视觉和模式识别。
FORi = 1 TO P. WID TH / / P. WID TH 为汉字图像宽度 FOR j = 1 TO P. HEI GHT / / P. HEI GHT 为汉字图像高度 IF P(i ,j) = 1 THEN / / 当前像素点为黑点 Left Edge = i / / Left Edge 为最左像素点的横坐标值退出两层循环 ENDIF
输入 : 原始汉字图像 P 输出 : 位置归一化后的汉字图像 P P
Step1 : PP. CL S / / 清空图像 P P 所占区域 Step2 : 位置归一化
FOR i = 1 TO P. WID TH FOR j = 1 TO P. HEI GHT IF P(i ,j) = 1 THEN / / 原始像素点为黑点将图像 P P 中的像素点 (i - Left Edge + 1 , j Up Edge + 1) 设置为黑色 / / 此处用到了
摘要 : 汉字图像处理技术在汉字识别过程中占有重要地位 , 文中研究了汉字图像预处理的几个算法 , 特别是对大小归一化算法进行了深入研究 ,并给出了实验结果。实验结果表明 ,这些算法有效可行 ,为汉字图像后续处理打下了坚实基础。关键词 : 汉字图像 ; 二值化 ; 归一化 ; 密度均衡中图分类号 : TP391 文献标识码 :A 文章编号 : 1005 - 3751 (2003) 0053 - 03
0 引言
为把大量的印刷体和手写体汉字自动录入计算机中 , 提出了汉字的计算机识别问题。汉字识别是模式识别的一个分支 , 由于汉字数量大 ( GB2312 - 80 一级汉字 3 755 个 ,二级汉字 3 008 个 ,两级汉字共 6 763 个 , 再加上繁体字等共逾万个) ,字形、字体繁多 ,相似字多等原因 ,故汉字识别属于超多类模式识别问题 ,被公认为模式识别领域最困难的问题之一。汉字识别[ 1～4 ] 系统主要包括 : 汉字图像模式的获取 ,图像去噪 ,二值化 ,归一化 ,特征提取 ,汉字识别 ,识别结果输出和后处理等功能。笔者仅对汉字识别前的一些预处理算法进行研究 ,主要包括找边框、归一化、空心化等 ,并着重研究了大小归一化算法。
112 找边框
找汉字图像边框的目的就是在整个汉字图像中 ,找到汉字图像本身所占用的区域范围 ,以后在处理汉字图像时仅对该区域进行处理 , 以便节省存储空间和提高处理速度。经过该算法处理后的汉字图像见图 2 , 算法描述如下:
1 算法介绍
111 汉字图像的二值化和图像坐标系
汉字图像在处理前一般需进行二值化 ,二值化的目的就是把灰度图像转换为二值图像。汉字图像的二值化算法比较简单 ,只要选择合适的二值化阈值即可得到二值的汉字图像 ,二值化后图像中的像素点不是 1 ( 黑点) 就是 0
( 白点) 。为便于描述 , 可把汉字二值图像看作一矩阵 P ,
其中任一元素 p ( i , j ) 的值如下定义 :
0 , 像素点为白另外 , 为了不发生误解 , 给出本文中汉字图像坐标系
P ( i , j) =
1 , 像素点为黑
的定义。原点位于汉字图像 P 的左上角 , i , j 坐标轴分别为横轴和纵轴 , 如图 1 所示。
找边框算法中的 Left Edge 和 Up Edge ENDIF
水平比例 H-prop = M/ I ,垂直比例 V - prop = N/ J
113. 2 大小归一化
Step3 : 线性归一化。
FOR i = 1 TO I FOR j = 1 TO J IF P(i ,j) = 1 THEN / / 当前像素点为黑点 k = 式 (3) 中的 m l = 式 (3) 中的 n FOR ii = (i - 1) 3 H- prop To k FOR jj = (j - 1) 3 V-prop To l
归一化函数 :
m =
k =1
6 6
j
i
H ( k) × V ( l) ×
6 6
M
1
k =1
H ( k)
( 2)
汉字图像的归一化包括位置、大小、旋转和倾斜归一化 ,本文中主要研究位置和大小归一化。
11311 位置归一化
m =
N
J l =1
j =1
V ( k)
其中 , i = 1 , 2 , …, I , j = 1 , 2 , …J 。 m = 1 , 2 , …,
法分为两大类 ,即线性归一化方法和非线性归一化方法。
( 1) 线性归一化。是将汉字图像的笔画按比例线性放
大或缩小到规定尺寸的图像。线性归一化仅与原始汉字图像和归一化后图像的大小有关系 , 为了描述算法的方便 ,首先定义以下函数。特征投影函数 :
H ( i) =1 , V ( j) = 1 ( 1)
Abstract : The processing technology of Chinese characters images plays an important role in its recognition process. Here studies several al2 gorit hms for Chinese Characters image’ s preprocessing ,especially pays more attention to t he size binarization and gives all experimental re2 sults. The results indicate t hat t he proposed algorit hms not only are efficient and available but also build stable basis for t he subsequent pro2 cessing. Key words :Chinese character image ;binarization ;normalization ; densit y equalization