汉王OCR录入工厂软件系统应用方案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

汉王OCR录入工厂软件系统应用方案

汉王OCR录入工厂软件系统应用方案

一、背景概述

信息资源对于网络时代,正如蒸汽机于工业社会,我们致力于信息资源建设,正是在构建未来社会的基石。要丰富网络资源,提高原有信息知识的利用效率,对图书、文献等信息资料的数字化就显得尤其重要。

目前,我国各级政府对数字化图书馆工程非常重视,国家专门成立了“863”计划数字化图书馆战略小组,北京市把数字图书馆建设列为四项高科技基础工程之一。这是一个运用现代高科技的数字资源系统工程,涉及到信息资源加工、存储、检索、传输和利用的全过程,是信息基础建设的重要组成部分。但如何将种类繁多的文档资料、行业信息进行出自动化处理,以期满足各种数字化信息的应用呢?这就不能不说到OCR技术(光学字符识别)在信息数字化建设中的至关重要的作用。

二、汉王OCR技术简介

OCR是英文Optical Character Recognition的缩写,意为光学字符识别。中文OCR光学符号识别技术是一种汉字文稿的自动输入方式,它通过光学扫描仪和计算机的配合,经OCR软件将图像数据进行运算分类后,将图像数据转化为计算机内码,这样就可以极大地减轻数据录入工作的强度、提高数据录入的速度。随着数字化信息资源的建设与管理对现有印刷品数字化的需求越来越强,通过OCR技术处理的电子文档将广泛应用于各种电子出版物,网络资源,各种大型文献资料数据库,数字化图书馆等多种领域,OCR技术应用成为信息资源建设中的最重要阶段。

汉王科技公司自1985年就开始从事OCR技术的研究工作,曾受到国家863计划、国家自然科学基金委员会、中国科学院的支持.是国内从事文字识别研究与开发的骨干单位,在联机手写识别、中文OCR识别等方面处于国际领先或先进水平。研究内容涉及到中文、英文、日文、韩文的印刷体识别,中文的

手写体识别,手写数字识别,表格识别与还原,版面分析与还原,中文OCR系统.

汉王OCR技术的应用涉及到文字识别、身份证识别、银行票据识别、增值税发票识别、表格识别、车牌识别、教育系统的无纸化阅卷、大型网络化数据生产流水线等多方面。同时,汉王公司拥有一支稳定的、优秀的、年轻的、朝气蓬勃的OCR技术研究开发队伍,完全保证了在OCR技术研究方面的技术优势。

OCR技术主要应用

✧办公自动化中印刷汉字、英文、日文等文件资料的自动输入

✧建立汉字文献档案库

✧语言处理中文书刊资料的自动输入

✧汉字文本图像的压缩存储和传输

✧书刊自动阅读器,盲人阅读器

✧书刊资料的再版输入,古籍整理

✧智能全文信息管理系统,汉英翻译系统

✧名片识别管理系统

✧车牌自动识别系统

✧网络出版

✧表格、票据、发票识别系统

✧身份证识别管理系统

✧在教育系统的应用,如无纸化评卷

汉王OCR技术居国际领先水平

✧汉字多字体识别

多字体识别全面支持宋体、仿宋、楷体、黑体圆体、隶书、隶变、魏碑、行楷及各种变体

✧大字符集识别技术

大字符集简繁混排识别支持国标GB2312-80的全部二级汉字,简繁混识不但能识别6700多个简体汉字外,还可识别台湾的繁体5401字,香港

繁体字;中英文混排的识别

✧多识别引擎

采用了3个识别核心来提高识别率,降低误识率。并可准确定位可疑字。

✧英文混排识别技术:目前已达到国际领先水平。

✧手写汉字识别:支持GB2312-80全部二级汉字,工整字识别率在95%

以上,自由书写字的识别率在80%以上,多识别引擎。

✧手写体数字识别:3个独立的识别引擎,集成识别率99%以上。

✧印刷体数字识别:4个独立的识别引擎,识别率在99.5%

✧表格识别技术:国家级评比第一名

一、汉王OCR录入工厂软件系统

软件系统定义

是应用OCR技术,为满足书籍、报刊杂志、报表票据、公文档案等的海量录入需求,实现工业化流水线管理方式的大型Intranet软件系统。

目前,许多行业的海量信息资料需要转化成电子文档以便各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此就急需一种快速高效的软件系统来满足这种海量录入需求。“OCR录入工厂软件系统”凭借汉王公司在OCR领域的领先技术,结合强大的网络功能,实现了海量纸质文件的快速录入,可广泛运用于数字图书馆、档案资料馆、政府机关等不同机构的大量文字、图表的自动录入,具有巨大的社会效益和经济效益。

录入工厂系统可解决的录入问题

现代各种书籍: 横版、竖版、简体、繁体;

古籍:特别是珍本、善本;

各年代的报刊杂志及内部资料;

各年代公文档案;

各种报表或票据

录入工厂软件系统总体功能:

实现大量原始资料的快速扫描录入与保存;

OCR录入、校对、整理

数据库存储、备份、检索和管理;

对各工序环节能进行监督和调度协调;

员工岗位的管理;

质量控制

系统管理;

安全日志;

录入工厂软件系统特点

1、大量原始资料的快速扫描录入与保存

各种版式的现代书籍: 横版、竖版、简体、繁体

古籍:特别是珍本、善本

各年代的报刊杂志及内部资料

各年代公文档案

各种报表或票据

汉王表格票据扫描仪扫描速度为:30张/分钟,A4幅面纸:30-35页/分钟

2、汉字识别之王:国际领先的OCR录入、校对、整理功能。

采用汉王先进的OCR识别技术,识别率高、速度快;快捷精确的横校、纵校、对比校对;支持多种电子文档存储格式:PDF、HTML、RTF、TXT,方便地实现全文检索,并将逐步与国际标准电子文档格式接轨。

3、完善的员工管理功能

综合了考勤管理、岗位管理、工资管理三大功能,系统自动记录员工出勤情况,自动为各岗位分配工作并记录分配情况及工作量,并根据以上记录情况生成员工工资明细表;提供轻松友好的工作界面

4、自动进行各工序环节的监督和调度协调

服务器给各岗位分配任务,并进行任务协调,使各客户端的任务既相互独立又形成完整的生产流程,提高工作效率,使得文字处理速度可达到每人班10万字—12万字,比手工录入的效率提高5-8倍

系统自动进行员工工作量计算、差错量监控,可将整体差错量控制在万

分之五以内,从而达到了出版质量要求。

对本套系统的监控、管理及日常维护,并定期生成安全日志。

相关文档
最新文档