用VC_和MODI实现图像文字识别

合集下载

使用计算机视觉技术进行文本识别的技巧和方法

使用计算机视觉技术进行文本识别的技巧和方法

使用计算机视觉技术进行文本识别的技巧和方法计算机视觉技术是指通过计算机对图像和视频进行智能分析和处理的技术。

在计算机视觉的应用领域中,文本识别是一项重要的任务。

文本识别旨在将图像中的文字提取出来并转化为可编辑的文本形式。

本文将介绍一些常用的计算机视觉技术和方法,以及一些技巧和注意事项,以帮助您更好地进行文本识别。

首先,图像预处理是文本识别的关键一步。

由于图像中的文字常常受到噪声、光照变化和图像畸变等因素的影响,因此需要进行预处理来提高文本识别的准确性。

常见的预处理技术包括灰度化、二值化、降噪和图像增强等。

灰度化将彩色图像转化为灰度图像,使得图像中的文字更加突出。

二值化将灰度图像转化为二值图像,以便更好地识别文本区域。

降噪和图像增强技术可以减少图像中的噪声和改善图像的质量,从而提高文本识别的准确性。

其次,文本检测是文本识别的关键一步。

文本检测旨在从图像中准确地定位和提取出文本区域。

现有的文本检测方法可以分为两类:基于边缘的方法和基于区域的方法。

基于边缘的方法依赖于图像中的边缘信息来检测文本区域,常用的方法包括Canny边缘检测和Sobel算子。

基于区域的方法则利用区域生长算法或者模板匹配等方法来检测文本区域。

无论采用何种方法,文本检测的目标都是精确地定位和提取出图像中的文本区域。

接下来,文本识别可以分为两个阶段:字符分割和字符识别。

字符分割旨在将文本区域中的字符分割开来,以便进行后续的字符识别。

字符分割可以利用图像处理和机器学习等方法来实现。

常用的字符分割方法包括基于投影的方法、边缘检测方法和基于模板匹配的方法等。

字符识别则是将每个字符识别为其相应的文本形式。

字符识别可以采用基于模板的方法、基于统计的方法和基于深度学习的方法等。

深度学习方法近年来在文本识别中取得了很大的成功,并且在许多任务上实现了领先水平的性能。

此外,为了提高文本识别的准确性和鲁棒性,还需要注意一些技巧和注意事项。

首先,训练数据的质量对于文本识别的性能非常重要。

如何使用计算机视觉技术进行文本检测与识别

如何使用计算机视觉技术进行文本检测与识别

如何使用计算机视觉技术进行文本检测与识别计算机视觉技术是指通过计算机模拟人类视觉系统进行图像和视频的处理和分析。

在现代社会中,文本检测与识别常常需要用到计算机视觉技术。

本文将介绍如何使用计算机视觉技术进行文本检测与识别的方法和流程。

首先,文本检测是指在图像中准确地定位和检测出文本区域。

为了实现文本检测,我们可以使用目标检测算法,如卷积神经网络(Convolutional Neural Network, CNN)或候选区域提取器。

这些算法可以自动地在图像中定位文本区域,并生成文本边界框。

接下来,文本识别是指将文本区域中的字符转换为可识别的文本信息。

文本识别一般包括文本分割和字符识别两个步骤。

在文本分割阶段,我们需要将文本区域按照字符进行分割,以便后续的字符识别。

常用的文本分割算法包括基于像素的方法和基于区域的方法。

而在字符识别阶段,我们可以使用光学字符识别(Optical Character Recognition, OCR)技术来将分割后的字符转换为可识别的文本信息。

在实际应用中,可以使用一些开源工具或库来实现文本检测和识别的任务。

例如,Tesseract是一个常用的OCR引擎,可以用于字符识别。

而OpenCV则是一个常用的计算机视觉库,提供了丰富的图像处理和分析函数。

这些工具和库可以帮助我们快速地实现文本检测和识别的功能。

此外,为了提高文本检测和识别的准确率,还可以采用一些预处理技术。

例如,可以对图像进行图像增强处理,以提高图像的清晰度和对比度。

还可以通过图像分割算法来去除图像中的干扰物,从而更好地区分文本区域。

另外,需要注意的是,文本检测和识别的性能往往依赖于数据集的质量和数量。

因此,在进行文本检测和识别的任务时,应选择具有多样性和丰富性的数据集进行训练和测试。

训练数据集应覆盖各种不同的字体、大小、方向和背景等情况,以提高模型的鲁棒性。

最后,为了实现高效的文本检测与识别系统,还可以结合其他相关技术。

C语言中的计算机视觉与图像识别技术

C语言中的计算机视觉与图像识别技术

C语言中的计算机视觉与图像识别技术
计算机视觉和图像识别技术是近年来快速发展的领域,对于实现人工智能、自动驾驶、医疗影像诊断等具有重要意义。

在C语言中,同样可以实现一些简单的图像处理和识别功能,下面我们将介绍一些基本的概念和实现方法。

首先,要实现图像处理和识别功能,需要了解图像在计算机中的表示方式。

在C语言中,通常使用二维数组来表示图像,每个元素代表图像的一个像素点,可以根据需要设置不同的像素值来显示图像的颜色和亮度。

接着,对于图像的处理,可以通过简单的算法来实现一些基本的功能,比如灰度化、边缘检测、图像滤波等。

这些功能可以帮助我们对图像进行预处理,提取出关键信息,为后续的识别工作做准备。

在图像识别方面,可以利用一些基本的机器学习算法来实现简单的对象检测和分类。

比如,可以使用K均值算法对图像进行聚类,识别出不同的对象;也可以使用支持向量机(SVM)等分类器来对图像进行分类,识别出特定的目标。

除此之外,还可以利用一些开源的计算机视觉库来实现更复杂的功能。

比如,OpenCV是一个功能强大的图像处理库,支持多种图像处理和识别算法,可以帮助我们快速实现各种图像处理功能。

总的来说,虽然C语言并不是专门用来处理图像的语言,但是通过一些基本的图像处理算法和库的支持,我们同样可以在C语言中实现一些简单的计算机视觉和图像识别功能。

当然,如果需要实现更复杂的图像处理和识别功能,还是建议使用一些更专业的语言和库来完成。

如何通过OCR技术实现图片文字识别

如何通过OCR技术实现图片文字识别

如何通过OCR技术实现图片文字识别随着科技的不断进步,OCR技术已经成为了现代数字化时代中必不可少的一种技术手段。

OCR技术也称光学字符识别技术,是一种通过分析图像信息将文字信息转换为数字信息的一种技术。

在现代数字化转型时代中,OCR技术已经成为了数字化时代的基石之一。

而本文将从OCR技术的定义、核心原理、技术实现过程等方面对OCR技术进行深入的探究,以期有效提升读者对OCR技术的认识和理解。

首先,让我们来看看OCR技术的定义是什么。

OCR技术全称Optical Character Recognition,即光学字符识别。

一般情况下,OCR技术主要用于扫描文档的处理。

通过光学识别技术,将文字从扫描文档中识别出来,然后将其转换为文本文件或数据库文件。

OCR技术除了能够将字体识别出来,还能够将图片中的其他信息如条形码、二维码等进行识别。

这就是OCR技术的定义,接下来我们将看看OCR技术的核心原理是什么。

OCR技术的核心原理是通过图像处理技术将文本提取出来,然后将其转换为电子文本。

因此,OCR技术主要分为两个部分:图像采集与处理以及文本识别与输出。

在图像采集和处理中,OCR技术要清晰地读取图像,并将其分离出文字、数字等字符信息;在文本识别和输出阶段,OCR技术要识别出来每一个字符,并将其转换为计算机可以识别的文本输出。

这就是OCR技术的核心原理,接下来我们将看看如何通过OCR技术实现图片文字识别。

如何通过OCR技术实现图片文字识别?首先,我们需要了解OCR技术的实现过程。

OCR技术的实现过程主要可以分为图像采集与处理、字符分割和字符识别三个主要步骤。

其中,图像采集与处理是OCR技术的基础。

在这个步骤中,我们需要将扫描仪和图像处理技术结合在一起,去除图片中的杂质和干扰,并将图片信息转换为可以识别的格式。

其次,字符分割是通过算法实现的一个自动化过程,该过程是将图像中的字符分离开来,由于字符之间的距离、大小、字形等信息均不相同,所以会根据这些信息进行处理。

计算机视觉技术用于文本识别的方法

计算机视觉技术用于文本识别的方法

计算机视觉技术用于文本识别的方法计算机视觉技术的快速发展在很大程度上改变了我们对世界的认知。

特别是在文本识别方面,计算机视觉技术的应用已经取得了令人瞩目的进展。

计算机视觉技术的目标就是对图像或视频进行分析和理解,将其中的信息提取出来,而文本识别则是其中的一个重要应用领域。

本文将介绍计算机视觉技术用于文本识别的一些常用方法。

首先,计算机视觉技术中常用的一种文本识别方法是基于光学字符识别(OCR)的方法。

OCR是一项将图像中的文本转化为可编辑和可搜索的文本的技术。

它使用图像处理和模式识别算法,将图像中的字符转换为计算机可识别的文本。

OCR技术包括图像预处理、字符分割、字符识别和后处理等步骤。

图像预处理环节主要用于去除图像中的噪声和干扰,以提高文本识别的准确性。

字符分割是将图像中的字符分离开来,使其成为单独的字符图像。

字符识别是使用模式识别算法识别单个字符。

后处理步骤则是对识别结果进行校正和修正,以提高识别准确性。

其次,基于深度学习的方法在文本识别中也取得了很大的成功。

深度学习是一种模仿人脑神经网络的机器学习方法,在计算机视觉领域具有很强的表现力和泛化能力。

深度学习通过构建多层神经网络来学习输入数据中的特征和模式,并将其应用于新的未见过的数据。

深度学习在文本识别中的应用主要体现在端到端的文本识别任务上。

这种方法不需要经过预处理或分割,直接将整个图像作为输入,并直接输出对应的文本。

除了OCR和深度学习方法,还有其他一些方法被广泛用于文本识别中。

例如,基于统计学的方法,它将文本识别问题转化为一个字符序列的标注问题,通过对字符序列进行建模和训练来实现文本识别。

此外,条件随机场(CRF)也是一种常用的方法,它通过建立字符和字符之间的相关性来提高文本识别的准确性。

在实际应用中,文本识别会面临一些挑战。

首先,文本出现的环境和场景是多样化的,例如光线不均匀、背景复杂等,这些因素都会对文本识别的准确性造成影响。

其次,文本的大小和字体也是一个挑战,尤其是在特定的行业领域,如医学、金融等,文本可能会出现很小的字体或者很特殊的字体,这对于识别算法来说是一个考验。

如何使用计算机视觉技术检测图像中的文字

如何使用计算机视觉技术检测图像中的文字

如何使用计算机视觉技术检测图像中的文字在如今信息爆炸的时代,图像中的文字无处不在。

然而,许多时候我们需要从这些图像中提取文字,以进行翻译、识别、搜寻等各种操作。

这时,计算机视觉技术的应用就显得尤为重要。

本文将向您介绍如何使用计算机视觉技术来检测图像中的文字。

首先,为了实现文字检测,我们需要一种强大的计算机视觉技术算法,文字检测算法通常有两个主要步骤:文本区域检测和文本行检测。

文本区域检测是指从图像中准确地定位和提取包含文本的区域。

在这一步骤中,目标是用准确的边框框出所有包含文本的矩形区域。

为了实现这一目标,有许多不同的算法可以选择,例如基于边缘检测、基于颜色特征、基于深度学习等方法。

其中,基于深度学习的方法如YOLO、RCNN等都取得了很好的效果。

这些算法使用大量的标注数据进行训练,以便准确地检测出各种形状、大小和方向的文本区域。

在文本行检测这一步骤中,目标是将文本区域合并成连续的文本行。

这一步骤的难点在于,同一文本行的字符往往存在不同的形变、遮挡和倾斜等变化。

为了解决这个问题,一些研究者提出了基于投影和连通性的方法。

这些算法通过分析文本行的几何形态和连通性,将不连续的文本区域合并成完整的文本行。

此外,深度学习方法也被广泛应用于文本行检测,在解决文本行识别方面取得了较好的效果。

除了文字检测算法外,我们还需要一些前期处理来提高检测的准确性。

首先,我们可以进行图像预处理,包括去噪、灰度化、二值化等操作,以减少噪声的干扰。

其次,可以进行文本区域的候选生成,通过提取图像中的显著性区域或边缘信息来筛选出可能包含文本的区域。

最后,结合机器学习方法,通过训练一个识别模型来筛选出真正的文本区域,减少误检的可能性。

一旦完成了文字检测的过程,我们就可以进一步进行文本识别。

文本识别是指将图像中的文字转化为计算机可理解的文本形式。

在文本识别过程中,常见的方法是使用光学字符识别(OCR)技术。

OCR技术包括字符分割、字符识别和语言模型等几个阶段。

利用VC++实现汉字与位图点阵数据的提取

利用VC++实现汉字与位图点阵数据的提取
陈晓明;苗世洪;陈洪才
【期刊名称】《现代电子技术》
【年(卷),期】2007(30)9
【摘要】单片机加液晶显示模块构成的系统已广泛地应用于工业自动化设备和民用产品中,用户操作界面已逐渐成为产品竞争力的一个关键因数.此类产品需要用到汉字和位图的显示技术,如何提取点阵数据是产品开发中首先必须解决的问题.本文介绍了如何利用VC++编程实现字模的提取,程序可以任意选定Windows系统所装的字体,并提供位图点阵的提取功能.本程序界面友好,通用性强,适用于多种类型的产品开发.
【总页数】4页(P188-190,194)
【作者】陈晓明;苗世洪;陈洪才
【作者单位】华中科技大学,电气与电子工程学院,湖北武汉,430074;华中科技大学,电气与电子工程学院,湖北武汉,430074;武汉哈德威电力监控系统有限公司,湖北武汉,430070
【正文语种】中文
【中图分类】TP311
【相关文献】
1.一种从汉字库中快速提取汉字点阵的实现方法 [J], 时永鹏;傅和平
2.利用VC++实现GPS全球定位系统定位数据的提取 [J], 袁林;曹杰
3.利用VC++实现WIN95/NT下位图淡入淡出的二种技巧 [J], 岳朝伟;张秋枫
4.利用VC++实现汉字字模的提取与小汉字库的生成 [J], 王保华
5.基于VB实现的的汉字点阵字模的提取方法 [J], 范志敏;刘洁莉;补家武
因版权原因,仅展示原文概要,查看原文内容请购买。

C语言实现图像识别

C语言实现图像识别图像识别是计算机视觉领域的重要研究方向之一,它通过算法和模型实现计算机对图像内容的理解和分类。

C语言是一种通用的高级编程语言,具有高效性和强大的计算能力,因此在图像识别领域中也有广泛的应用。

本文将介绍C语言在图像识别方面的应用和实现。

一、图像预处理在进行图像识别之前,首先需要对图像进行预处理。

图像预处理的目的是去除图像中的噪声、调整图像的对比度和亮度等,从而更好地提取图像特征。

在C语言中,我们可以使用各种图像处理库,如OpenCV来实现图像预处理。

下面是一个简单的C语言代码示例,演示了如何使用OpenCV对图像进行预处理:```C#include <opencv2/opencv.hpp>using namespace cv;int main(){// 读取图像Mat image = imread("image.jpg", IMREAD_COLOR);// 转为灰度图像cvtColor(image, image, COLOR_BGR2GRAY);// 高斯模糊GaussianBlur(image, image, Size(5, 5), 0);// 边缘检测Canny(image, image, 50, 150);// 显示图像imshow("Processed Image", image);waitKey(0);return 0;}```二、特征提取在进行图像识别之前,还需要提取图像的特征。

特征提取是将图像转换为计算机可理解的数值形式,以便进行进一步的处理和分类。

C 语言提供了各种特征提取的方法和算法的实现,下面是一个简单的C 语言代码示例,演示了如何使用C语言进行图像特征提取:```C#include <stdio.h>int main(){// 读取图像特征数据float features[100];FILE *file = fopen("features.txt", "r");for (int i = 0; i < 100; i++) {fscanf(file, "%f", &features[i]);}fclose(file);// 进行图像分类或其他处理// ...return 0;}```三、模型训练与识别在进行图像识别之前,需要训练一个模型来对图像进行分类。

图像文字识别技术原理

图像文字识别技术原理
图像文字识别技术是一种将图像中的文字转化为可编程文本的技术,其原理主要包括图像预处理、文本检测、文本识别等步骤。

首先,图像预处理是指对输入图像进行必要的处理,以提高后续文本检测和识别的准确性。

预处理步骤包括去噪、增强对比度、灰度化等。

其次,文本检测是指从预处理后的图像中定位和标记出文字的位置。

文本检测可以使用基于特征提取的方法或者基于深度学习的方法。

特征提取方法通常会提取图像中的纹理、边缘等特征,然后利用分类器进行文字检测。

深度学习方法则可以使用卷积神经网络(CNN)或循环神经网络(RNN)等网络结构进行文字的检测和分类。

最后,文本识别是指将检测到的文字转化为计算机可理解的文本信息。

文本识别可以采用基于模板匹配的方法或者基于文本识别模型的方法。

模板匹配方法通过匹配预定义的模板和检测到的文字进行识别。

而文本识别模型则是使用深度学习模型,如卷积神经网络(CNN)和循环神经网络(RNN),对检测到的文字进行分类和识别。

综上所述,图像文字识别技术通过图像预处理、文本检测和文本识别等步骤,实现从图像中提取文字信息的过程。

这项技术在实际应用中有着广泛的应用,如自动驾驶、图像搜索和文档扫描等领域。

识别图片中的文字原理

识别图片中的文字原理
识别图片中的文字是一种计算机技术,通过训练模型和算法来从图像中提取文字信息。

其原理主要分为以下几个步骤:
1. 图像预处理:对输入的图像进行预处理,包括图像的灰度化、二值化、降噪等操作,以便提取出更清晰的文字区域。

2. 文字区域检测:通过检测图像中的文字区域,确定文字所在的位置。

常用的文字区域检测算法包括基于边缘检测的方法、基于角点检测的方法、基于连通分量的方法等。

3. 文字分割:将文字区域中的连续文字分割成单个字符。

文字分割可以使用基于垂直投影的方法、基于连通分量的方法等。

4. 字符识别:对每个字符进行识别,将其转化为对应的文字。

字符识别可以使用传统机器学习方法,如支持向量机(SVM)、随机森林等,也可以使用深度学习方法,如卷积
神经网络(CNN)等。

5. 文字后处理:对识别结果进行后处理,例如通过语言模型进行校正、对不确定的识别结果进行修正等。

通过以上步骤,能够实现对图像中的文字进行自动识别。

识别图片中的文字在很多应用场景中起到了重要的作用,例如扫描文档、文字识别软件、自动驾驶等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在该函数中,首先实例化 MODI 文档对象的包装类 CMo-
diDocument,然后调用其 CreateDispatch 函数创建 MODI 文档
对象,接着调用包装类的 Create 函数打开指定的图像文件,
最后调用控件的 put_Document 函数显示该图像。
为了获取图像中所包含的页数,调用 MODI 文档对象包装
CModiImage oPage; oPage.AttachDispatch (oImages.get_Item (i)) ; //图像压缩类型 oImageInfo.SetCompression (i, (int) oPage.get_Com- pression ()) ; //每像素位数 oImageInfo.SetBitsPerPixel (i, (int) oPage. get_BitsPerPixel ()) ; //水平解析度 oImageInfo.SetXDPI (i, (int) oPage.get_XDPI ()) ; //垂直解析度 oImageInfo.SetYDPI (i, (int) oPage.get_YDPI ()) ; //宽度,单位像素 oImageInfo.SetPageWidth ( i, ( int) oPage.get_Pixel- Width ()) ; //高度,单位像素 oImageInfo.SetPageHeight ( i, ( int) oPage.get_Pixel- Height ()) ; } CMainFrame *pMain = ( CMainFrame *) AfxGetMain- Wnd () ; pMain->GetImageInfoBar () ->GetTree () ->SetImageIn- fo (oImageInfo) ; //释放 Modi 文档对象 oDocument.Close (FALSE) ; }
CModiImage 对象上,然后调用 CModiImage 的 get_Compression
Implementing OCR Using VC++ and MODI
CAO Xiaojun, LIU Haiyun
(Department of Management Engineering, Nanjing Communications Institute Of Technology, Nanjing 211188)
在进行文字识别时,语言选项非常重要,必须与所安装 的 Microsoft Document Imaging 相对应。如果安装的是简体中文 版,那么在识别时的语言必须为简体中文。如果希望识别其 它语言,必须从安装了相应版本的机器中将有关文件复制到 对应的目录下,例如,如果希望识别繁体中文,必须从安装 了繁体中文版的 Microsoft Document Imaging 的机器中将 TC- CODE.UNI、TCPRINT.DAT、TCPRINT2.DAT、TCSERHT.DAT、 TCTREE.DAT、 TW_BU.DAT、 TW_UB.DAT、 TWBIG532.DLL 等文件复制到开发者和用户机器中相应的位置。
1 前言
目前,OCR 技术已经非常成熟,特别是对印刷体,识别 速度快,正确率高,比较流行的 OCR 引擎很多,英文 OCR 主 要有 OmniPage;中文 OCR 主要有清华紫光 OCR、清华文通 OCR、汉王 OCR 等,其中 Microsoft Office2003 简体中文版中 配置的就是清华文通 OCR。各 OCR 供应商一般都提供了可以 直接使用的文字识别软件,但有些情况下,可能需要在自己 的软件中集成文字识别功能。
Abstract:OCR has widely been used in the fields such as digital library, digital archive library etc. The procedure of de- veloping an OCR-based application with MODI of Visual C++ .NET 2003 and Microsoft office 2003 is introduced. Key words:VC++; MODI; OCR; ActiveX; COM
ARTIFICIAL INTELLIGENCE AND IDENTIFICATION TECHNIQUES
人工智能及识别技术
用 VC++和 MODI 实现图像文字识别
曹晓君,刘海云
(南京交通职业技术学院管理工程系,南京 211188)
摘 要:光学字符识别 (OCR) 已广泛应用于诸如数字化图书馆、数字化档案馆等各个领域。本文介绍了利用 Vi- sual C++.NET 2003 和 Microsoft Office2003 中的 MODI 组件开发 OCR 程序的过程。 关键词:VC++;MODI;光学字符识别;ActiveX;COM
MODI 是基于组件对象模型 (COM) 开发的,直接针对 COM 编写代码比较繁琐,比较简单的办法是利用 Visual Studio 提供的 COM 包装向导将所有的 MODI 对象生成包装类。
单击“项目”菜单,选择“添加类…”,在弹出的窗口 中,类别选择“MFC”、模版选择“类型库中的 MFC 类”,打 开相应的向导,在向导窗口中,来源选择“文件”,输入或选 择 MDIVWCTL.DLL 文件的完整路径 (该 DLL 文件一般位于 C: \Program Files\Common Files\Microsoft Shared\MODI\11.0),选择
4 开发过程
4.1 创建工程项目 启动 Microsoft Visual Studio .NET 2003,通过文件菜单创
建 一 个 基 于 MFC 的 SDI 应 用 程 序 项 目 (这 里 项 目 名 称 为 ModiOc)r ,需要注意的是要选中 ActiveX 支持。 4.2 向项目中添加 MODI 支持
(2) 先创建一个文档对象,然后调用控件的 put_Docu- ment (LPUNKNOWN) 函数将文档与该控件相关联。
无论采用哪种方式,都可以通过文档对象获取图像文件 的页数等统计信息。本文采用第二种方式,代码如下:
void CModiOcrView::OpenImageFile (CString sImageFile) { if (m_sImageFile == sImageFile)
return; GetDocument () ->SetTitle (sImageFile) ; m_sImageFile = sImageFile; //清除原来的图像,如果曾经打开过的话 m_wndImage.put_FileName (_T ("")) ; //创建 Modi 文档对象并打开给定的 tif 文件 CModiDocument oDocument; oDocument.CreateDispatch (_T (" MODI.Document")) ; oDocument.Create (sImageFile) ; //显示 tif 图像 m_wndImage.put_Document ( ( LPDISPATCH) oDocu- ment) ;
- 77 -
电脑编程技巧与维护
所有的接口 (对应于 MODI 对象模型中的每个对象),可以根 据自己的意愿重新命名所有将要生成的包装类,单击完成按 钮后,相应的类将被添加到项目中。 4.3 向视图中添加 ActiveX 控件
向视图类中添加一个成员变量 m_wndImage,类型为 Ac- tiveX 控件的包装类 (CModiDocView),并添加 WM_CREATE 和 WM_SIZE 消息处理函数:
类的 get_Images () 函数获取对 MODI 的 Images 集合对象的引
用,但该引用是一个 COM 接口,所以先实例化一个 Images 的
包 装 类 CModiImages 的 实 例 , 然 后 调 用 其 AttachDispatch
((LPDISPATCH) 函数 (该函数实际在 COleDispatchDriver 类中
//获取页数,但每页中的字数必须在识别后才可以获取 CImageInfo oImageInfo; oImageInfo.SetFileName (sImageFile) ; CModiImages oImages; oImages.AttachDispatch (oDocument.get_Images ()) ; oImageInfo.SetPageCount ((int) oImages.get_Count ()) ; //每页的统计信息 int nPages = oImages.get_Count () ; for (int i = 0; i < nPages; i++) {
CRect (0,0,0,0) ,thiቤተ መጻሕፍቲ ባይዱ,IDC_OCR_IMAGE)) { TRACE0 (_T (" Failed to create image view control\n")) ;
return -1; } return 0; }
void CModiOcrView::OnSize (UINT nType, int cx, int cy) { CFormView::OnSize (nType, cx, cy) ; if (m_wndImage.GetSafeHwnd ())
图 1 MODI 文档对象模型 本文收稿日期:2009-1-12
MODI 不仅能够识别 TIF (F) 格式的文件,还可以识别 BMP、JPG 等格式的文件,但是 MiDocView 控件只支持 TIF (F) 格式的图像的显示。
3 开发和运行环境
相关文档
最新文档