笔顺连笔自由的联机手写汉字识别

合集下载

笔画节点在手写体汉字识别中的作用

笔画节点在手写体汉字识别中的作用

心理学报 2023, Vol. 55, No. 12, 1903 1916 © 2023中国心理学会 Acta Psychologica Sinica https:///10.3724/SP.J.1041.2023.01903收稿日期: 2022-01-14* 国家自然科学基金面上项目(32071044、31871096)和中央高校基本科研业务费专项资金资助(2021FZZX001-06)。

通信作者: 周吉帆,E-mail:*****************.cn;沈模卫,E-mail:**************.cn笔画节点在手写体汉字识别中的作用*朱一鸣 赵 阳 唐 宁 周吉帆 沈模卫(浙江大学心理与行为科学系, 杭州 310058)摘 要 产生式理论认为, 视觉图形的识别是对其产生过程的逆推理。

汉字是笔画按正字法规则交错连接构成的象形文字, 手写体汉字识别可以认为是对汉字产生过程的反向推理。

基于典型的产生式模型——贝叶斯规划学习模型, 汉字的产生式识别过程从识别字的笔画开始, 先基于线段交点提取出节点, 再枚举能产生该节点的所有笔画组合方式, 从而获得汉字的产生方式。

据此预测, 节点数量和节点复杂度是手写汉字识别过程的重要影响因素。

本研究通过三个实验考察了节点在汉字识别中的作用。

结果显示, 含有较多节点的汉字具有更好的识别绩效(节点数量效应), 掩盖由较多笔画构成的高复杂度节点会对汉字识别产生更大干扰(节点复杂度效应)。

本研究增进了对汉字识别早期过程的认识, 为字形识别的产生式反向推理过程提供了证据。

关键词 手写汉字识别, 节点, 笔画, 产生式模型 分类号 B8421 前言汉字是利用二维空间表达信息的象形文字, 由笔画交错连接构成, 其正字法规则(Orthographic regularities)较为复杂(陈天泉, 1983)。

虽然当前印刷体汉字识别技术已经成熟, 手写体汉字因其笔画多变、风格各异, 给机器识别带来巨大挑战(任晓倩 等, 2018; Krizhevsky et al., 2012)。

对联机手写汉字识别技术的研究_实现笔画识别

对联机手写汉字识别技术的研究_实现笔画识别

收稿日期:2004-02-10作者简介:俞庆英(1980—),女,安徽黄山人,硕士研究生,研究方向为汉字识别技术。

对联机手写汉字识别技术的研究 ———实现笔画识别 俞庆英,吴建国(安徽大学计算机科学与工程系,安徽合肥230039)摘 要:联机手写汉字识别(OLCCR ),是指用笔在图形输入板上写字,人一边写,机器一边认,是一种方便的汉字识别手段。

在各种自动识别输入的方法中,OLCCR 是能够代替或部分代替人工编码输入的惟一可能的方法。

识别中主要是两方面的问题:建立汉字识别库和手写板上笔画轨迹的识别。

文中就第二方面即手写笔画识别的问题进行了全面的研究,采用笔画基元帮助分析笔画轨迹,并用可视化编程工具Visual C ++6.0实现了基于这种方法的笔画识别过程。

关键词:联机手写汉字识别;笔画;基元;模式识别中图分类号:TP391143 文献标识码:A 文章编号:1005-3751(2004)10-0068-02R esearch of on -line H andw ritten Chinese Character R ecognition :Implement Stroke R ecognitionYU Qing 2ying ,WU Jian 2guo(Dept.of Computer Science &Engineering ,Anhui University ,Hefei 230039,China )Abstract :On -line handwritten Chinese character recognition (OLCCR )refers to that the computer can recognize Chinese characters while people are writing on a data tablet.It ’s a convenient means by which people can input Chinese characters.In the process of recognition ,there are two primary problems needed to be solved.One is establishing a library of Chinese characters ,the other is recognizing the track of strokes on the handwritten board.This paper mainly deals with the latter ,that is to say ,it is written about the strokes recognition.And in the midst of research ,a kind of visual program tool :Visual C ++6.0is utilized.K ey w ords :on -line handwritten Chinese character recognition ;stroke ;base -unit ;pattern recognition0 引 言汉字如何进入计算机[1],一直是中国人使用计算机的一大难题。

联机手写笔画识别后处理算法的设计与实现

联机手写笔画识别后处理算法的设计与实现
法 称 为 回溯 法 ㈧ 。
_ 囊 i_ _ _ l


《lll § l
处理 算法的设 计与实现
俞庆英 刘莉 安徽 师范大学计算机科 学与技术 系 2 10 405
22用于笔画识别后处理中的回溯方法 . 单 笔 画 识 别 是对 构 成 汉 字 的 每 一 个 笔 画 逐 个地 、孤 立 地 进 行 识 别 。 通 过 产 生 笔
画 方 向 代码 序 列 、去 除 噪 声 、 匹配 笔 画特
征 串以实现 笔画的识别 ,在单笔画识别算
法 中,我f 只给 出识别结果 ,而对于处理 i ] 过 程 中所获 得 的不 少有 用信息 都没 有再 用 ,也没有利用汉字的笔顺关系等。理论 和 实践都表 明:利用笔顺关系可以提高笔 画 的 识 别率 。 因此 ,设 计 此 回 溯 思路 的后 处理算法 ,以利用汉字的笔顺关系对 已识 别的笔 画进行 后处理 。 例 如 ,写汉字 “ ”的时 候 ,笔顺 利 为 “ 一f、J” 但 是 如 果 写 到 第 五 笔 , , ,f , 系 统 识 别 成 ‘ ’而 非 ‘ ’ 则 当 继 、 , 续 下一 笔 ‘f’时 ,字库 中 只有一 个汉 字 “ ” ( 顺 为 “ 一f f 香 笔 / /\1一一 ” ) 满 足 该 序 列 ,很 显 然 ,不能 识 别 出原 先 想
找 不 到 对 应 该 笔 画序 列 的 汉 字 , 系统 显 示
Po oe n te I p r h r r W p ii d sr t 6 s rp sd i h a e ee ae t O o t z  ̄ a e1 p m e e
出错 提 示信 息 。 对此 ,我们设计 了一种回溯法的解决 方案 ,令 x为从根结点出发到当前结点的 笔画序 列,S L为当前结点所存放笔画的 S 相 似 笔 画 列表 ,i d x为 当前 笔 画 在 X 中 ne 的位置 ,i 表示相似 笔画在 S L中的序号 。 S 该 算法用 伪代码 描述如 下 : po akrc ( s rc ct kx: ̄ d d x i ee b a t ne :t r ng inee) : t r; i  ̄

OCR(联机手写汉字识别)

OCR(联机手写汉字识别)

2 联机手写汉字识别——笔输入——笔输入2.1 什么是笔输入——从键盘输入说起笔(式)输入也叫做手写输入。

它的用途是在一块跟计算机连接的书写板上写字,即时把字符输入计算机。

必须指出的是,笔输入的作用不只是输入字符的图形,还要据此对该字符加以识别,并用机内代码来表示,以便于对输入的文字作进一步处理。

电子计算机是西方发明的,用键盘来打印拼音文字在西方已有很长的历史,因此采用键盘向计算机输入拼音文字和标点符号是很自然的事,把字母等符号变换为便于计算机处理的编码也不困难。

1838年美国人莫尔斯就已发明用点和划两种符号来表示英文字母,用来传送电报信号,使电报机进入实用阶段。

1844年美国建成从华盛顿到巴尔的摩全程64公里的电报线路,揭开了人类通信新的一页。

这种莫尔斯电码现在还在通信领域(如无线电报)广泛应用。

计算机用的内码虽然和莫尔斯电码有所不同,但原理上是一样的,只不过采用位数固定的(0,1)码来表示各个字母而已。

因此,采用通常的QWERTY键盘、配以适当软件,就可以把拼音字母以编码的形式直接输入计算机,不需对输入信息再加以识别。

当然,如果输入的是写在(或印在)纸上的拼音字母或符号,那就和输入其他手写文字一样,也需要用识别软件进行识别,否则计算机也不可能“懂得”这种手写字母、符号所代表的信息。

方块汉字和拼音字母完全不同,如何把汉字输入计算机呢?20世纪70年代以前,我国曾仿照西文打字机的式样,研制几种用于打印汉字的大键盘打字机。

这种汉字打字机采用一字一“敲”的汉字键盘。

键盘的盘面安放着1000多个铅字,盘面上还有两根可分别在水平与垂直两个方向移动的杠杆。

移动杠杆使打字用的卡具对准某个汉字,然后敲击按键,就可以把该字打印在纸上。

由于汉字字量很大,使得键盘体积不可能太小,机械结构也不简单,操作相当不便。

更突出的问题是:打字员还必须熟记每个汉字的位置,否则不但不能提高打印速度,甚至无法工作。

此外,大键盘的盘面</PGN0023.TXT/PGN>虽然很大,但一般也只能容纳1000多个铅字,仅占常用汉字的一半左右(国标GB 2312-80汉字基本集第一级的字数为3755个)。

幼儿汉字笔画顺序识字表

幼儿汉字笔画顺序识字表

幼儿汉字笔画顺序识字表
笔顺是书写汉字的基本规范,正确的笔顺可以使汉字书写规范化、美观化。

下面介绍几种常见的笔顺。

丶是汉字中的一个基本笔画,它表示一个小点。

例如“日”字,先写一个丶,再写一个一。

横是汉字中的一种基本笔画,它表示从左到右的直线。

例如“人”字,先写一个横,再写一个竖。

点是汉字中的一种基本笔画,它表示一个小点。

例如“王”字,先写一个点,再写一个横。

横钩是一种常见的笔画组合,它表示一个横线上面带一个小钩。

例如“广”字,先写一个横,再在横的右边写一个小钩。

撇点是一种常见的笔画组合,它表示一个向左下方的斜线上面带一个小点。

例如“承”字,先写一个撇,再在撇的上面写一个小点。

弯钩是一种常见的笔画组合,它表示一个弯曲的线上面带一个小钩。

例如“小”字,先写一个弯曲的线,再在线的右边写一个小钩。

竖钩是一种常见的笔画组合,它表示一个竖线上面带一个小钩。

例如“屯”字,先写一个竖线,再在竖线的上面写一个小钩。

笔顺的正确与否直接关系到汉字书写的规范与美观。

在写字时,我们应该注意笔顺的正确性,以养成良好的书写惯。

汉王手写SDK产品介绍

汉王手写SDK产品介绍

汉王手写SDK产品产品简介汉王嵌入式手写SDK产品分为:手写识别产品和轨迹类产品。

手写识别产品支持文本识别,公式识别,图形识别,为客户提供全方位的手写识别方案;轨迹类产品通对手写轨迹进行反走样处理,并结合不同笔型及笔锋效果,为用户提供更加光滑、圆润、流畅、自然的书写体验。

汉王手写SDK产品为客户提供快速集成与部署能力。

产品分类手写识别产品文本识别(1)UWrite®Letter单字符识别产品产品介绍:本产品采用汉王自主研发的最新识别算法,该算法着重于字符整体书写形状和字符笔画结构间的关系,优势互补,大幅提升了潦草字体与自由书写字体的识别能力,从而为用户提供性能更加卓越的手写识别产品。

语言:支持60多种语言字符集支持所有主要的汉字编码标准字符集功能特性支持工整字体与自由书写体支持无笔顺识别(常见汉字的倒插笔写法)支持快速手势符号识别(空格、回车、回删、Tab)支持特殊偏旁部首识别支持行草书法与异体字识别支持倾斜字体识别支持用户笔迹学习支持输出候选结果的识别可信度提供识别得分支持快速手势符号识别(复制、粘贴、全选、撤销、剪切)支持书写框智能判断大小写同形字符(Oo,Vv,Zz,Xx等)支持联想与预测输出支持平台:Windows、Linux、MeeGo、iOS、Symbian、Android、QNX、VxWorks、ECOS、Nucleus等。

单字符引擎可准确识别中文连笔字倾斜字校正示例An example:-45 度: 45 度: -90 度:识别结果(未做倾斜校正):识别结果(增加倾斜校正):(2)FreeStylus®多字识别产品语言:支持26种语言a)F reeStylus®亚洲语系多字识别1)FreeStylus®多字符识别(自左至右书写)本产品支持单个书写行内的多字符手写输入识别(字,词,短句),同时支持数字串识别(如:电话号码),通过语言模型对输入笔迹进行智能分割和辨识,为用户提供更加高效、自然的录入方式。

脱机手写体汉字识别技术综述

脱机手写体汉字识别技术综述
方案 。
而汉字 识别 属 于大 类 别 ( 称 为 超 多 类 ) 式 或 模
识 别 问题 , 在模 式 识 别理 论 和 方 法 的研 究上 具
有 重要意 义 。
( ) 字字形 结构 复杂 。 2汉 ( ) 字 中相 似 字 符 较 多 , 些 汉 字 的 差 3汉 有
目前 , 字输入 主要 分 为人 工 键 盘输 入 和 汉 机器 自动 识 别 输 入 两 种 。人 工 键 盘 输 入 是 指 用 手工击 键 方 式 按 照 一 定 的规 律 将 汉 字 输 入 到计 算 机 , 目前 已有 数 百 种 键 入 方 法 。但 是 ,
弯 , 笔 的 拐 角 变 成 圆 折
弧等。

笔 画模糊 不规 范 该 连 的不 连 , 该 连 的 不 却相 连 。
自动识 别 输 入 分 为 语 音 识 别 和 字 符识 别 两种 。汉字识 别 是模 式识 别 的一 个重 要 分 支 ,
也 是文字识 别领 域 中最 困难 的 问题 , 涉 及模 它
与 拼音文 字的打 字输 入 不 同 , 人们 往 往需 要 经
别仅 在 于 一 个 点 或 一 个 笔 画 。 F 于手 写 体 字 } 1 符存在 变形 , 使得 手 写 体相 似 字 符 的 区分 比印
刷 体要 困难得 多 。
() 4 书写 风格 因人 而 异 , 成 手 写 体 汉 字 造 变形 , 具体 表现在 以下 几方 面 :
计 算机 进行识 别 处理 的方 法 , 是 机器 字符 识 也 别 中最 困难 的一 个 课 题 。这 些 困难 和 问题 表
现在 :
成 和发展有 着不 可磨 灭 的贡 献 , 并将 继 续 发挥 重要 的 、 与其 它 文字 形 式 难 以取 代 的作 用 。然

印刷体汉字识别系统

印刷体汉字识别系统

印刷体汉字识别系统一、文字识别概述汉字是历史悠久的中华民族文化的重要结晶,闪烁着中国人民智慧的光芒。

汉字数量众多,仅清朝编纂的《康熙字典》就包含了49,000多个汉字,其数量之大,构思之精,为世界文明史所仅有。

由于汉字为非字母化、非拼音化的文字,所以在信息技术及计算机技术日益普及的今天,如何将汉字方便、快速地输入到计算机中已成为关系到计算机技术能否在我国真正普及的关键问题。

图1文字识别的分类将汉字输入到计算机里一般有两种方法:人工键入和自动输入。

其中人工键入速度慢而且劳动强度大,一般的使用者每分钟只能输入40~50个汉字。

这种方法不适用于需要处理大量文字资料的办公自动化、文档管理、图书情报管理等场合。

而且随着劳动力价格的升高,利用人工方法进行汉字输入也将面临经济效益的挑战。

自动输入又分为汉字识别输入及语音识别输入。

由于汉字数量众多,汉字识别问题属于超多类模式集合的分类问题。

汉字识别技术可以分为印刷体识别及手写体识别技术。

而手写体识别又可以分为联机(on-line)与脱机(off-line)两种。

这种划分方法可以用图1来表示。

从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了联机手写体识别。

到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。

联机手写体的输入,是依靠电磁式或压电式等手写输入板来完成的。

在书写时,笔在板上的运动轨迹(在板上的坐标)被转化为一系列的电信号,电信号可以串行地进入到计算机中。

从这些电信号我们可以比较容易地抽取笔划和笔顺的信息。

从90年代以来,联机手写体的识别正逐步走向实用,方兴未艾。

中国大陆及台湾地区的科研工作者推出了多个联机手写体汉字识别系统,国外的一些大公司也开始进入这一市场。

这一技术也迎合了PDA(Personal Digital Assistant)的发展潮流。

与脱机手写体和联机手写体识别相比,印刷体汉字识别已经实用化,而且在向更高的性能、更完善的用户界面的方向发展。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(& 匹配的一个明显缺点是它的连笔自由是建立在笔顺不
自由的基础上的 " 虽然 ! 通过向字典里添加笔顺变种的模版 ! 可 在 一 定 程 度 上 解 决 笔 顺 自 由 的 问 题 !但 是 !会 带 来 字 典 过 于 庞 大 #匹 配 速 度 减 慢 等 问 题 !而 且 也 不 可 能 穷 尽 所 有 可 能 的 笔 顺 变化 " 因此 ! 必须加以改进才能用于笔顺自由的识别系统上 "
作者简介 $ 曹喆炯 ,/!EB& #" 硕士研究生 " 研究方向为手写汉字识别 ( 王永成 ,/!$!& #" 博士生导师 " 研究方向为智能信息处理 (
!!!!!!!!"
引言
文献标识码 )
键的解决连笔自由问题的整体 67 匹 配 方 法 % 解 决 笔 顺 自 由 问 题 的 笔 画 对 应 关 系 确 定 算 法 , 最 小 风 险 算 法 #" 并 同 现 有 的
I=’ JK62 G2D5AL 法
有 人 提 出 了 JK62 G2D5AL 方 法 )M+! 采 用 动 态 规 划 方 法 在 一 个 超 立 方 体 $LNE25AK62% 中 搜 索 输 入 汉 字 和 标 准 模 式 的 正 确 笔 画对应关系 ! 并同时计算出两者之间的匹配距离 " 设 " 为标准笔画数 !$ 为输入笔画数 " 搜索图 $ 也可看作是 一个超立方体 % 中每条从初始状态到终止状态的路径都代表了 一 种 可 能 的 笔 画 对 应 关 系 " 图 O 是 标 准 模 式 为 I 画 的 JK62
D5/ 1.0 1 $-& !0!$&%%!&#" ! 固定笔画对应关系 " 即固定距离最短
&
的笔画对应关系 ! $&3%" 跳转到 $’ %" 近邻优先算法的优点是速度快 ! 复杂度为 4 $"’%" 但是 ! 其 确定笔画对应关系的正确率不高 "
%& 匹配的算法复杂度为 ! $"’%!" 为序列点数 " 如果对其
笔画对应关系的算法 ! 最小风险算法 &" 并同现有的 89:; <;(=+2 法 % 匈牙利算法 % 近邻优先算法在识别速度 % 识别率等方 面作了比较 ’ 该方法克服了现有的一些方法的不足 " 能高效地同时解决笔顺自由和连笔自由问题 " 而且由于主要采用全 局特征进行识别 " 对形变和噪音具有很强适应能力 ( 另外 " 字典可以通过聚类自动生成 ( 另外还制作了原型 系 统 " 在 对
全世界已有近四分之一的人在使用汉字 " 近 " C## 万 人 在
89:; <;(=+2 法 % 匈牙利算法 % 近邻优先算法进行比较分析 (
"
连笔自由的整体 67 匹配方法
每一次从落笔到提笔的可见线段序列称为 ,5 线 " 从前一
次的提笔到下一次的落笔所经过的不可见线段称为 ,KK 线 ( 在 笔顺固定的情况下 " 随着 连 笔 的 不 同 ",5 线 和 ,KK 线 的 排 列 组 合也不同 ( 因此 " 如果仅匹配 ,5 线 " 无法解决连笔自由的问题 ( 可将输入汉字所有的 ,5 线和 ,KK 线按笔顺相连 " 去除冗余 点 " 抽取特征点 " 生成新的序列 " 记为 !Z[!",# "$#\##"#%] ( 字典 中的标准模式也按同样方法生成 " 记为 &Z[’(,# "$#\##(#)] ( ! 和 & 的 匹 配 距 离 为 * ,! "& #" 可 用 67 ,615(’)+ 7=,M=(’’)5M # 匹配的方法计算 ^C_( 即通过如下的 67 迭 代 式 计 算 出 一 条 最 佳 的输入序列和标准序列的匹配路径 " 请参见图 / ( * * ,+""’(#Z’)5[* ,+",/"’(F/#‘" - ,+""’(#"* ,+""’(&/#a
搜索范围沿对角线加以限制 ! 可以使算法复杂度降为 ! $#"%! 这样同时避免了极端的伸缩匹配 " 另 外 ! 在 (& 匹 配 之 前 可 以 先 用 快 速 的 线 性 匹 配 $ 复 杂 度 为 ! $" %% 进 行 处 理 ! 再 对 匹 配 距 离最小的前 " 个字典标准模式进行 (& 匹 配 ! 这 样 可 以 在 保 证 精度的前提下大幅提高识别速度 )*+"
@A4+1B(+$ H(=M;J)5M K=;; @J=,P; ,=L;= (5L +,55;+J),5 I=,:*;’@ ,5 ,5*)5; 2(5LQ=)JJ;5 82)5;@; +2(=(+J;= =;+,M5)J),5"Q; I=,I,@; R)5)’9’ S)@P T*M,=)J2’ !RST & K,= ,IJ)’(* @J=,P; +,==;@I,5L;5+; L;J;=’)5(J),5 :(@;L ,5 2,*)@J)+ 67 ’(J+2)5M ’;J2,L "(5L +,’I(=; RST Q)J2 89:; <;(=+2"G95M(=)(5 T*M,=)J2’ (5L U;(=;@J V)=@J T*M,=)J2’ )5 J2; (@I;+J@ ,K =;+,M5)J),5 @I;;L (5L =(J;3H2)@ ’;J2,L Q)** 5,J ,5*1 @,*W; J2; I=,:*;’@ ,K K=;; @J=,P; ,=L;= (5L +,55;+J),5 @)’9*J(5;,9@*1 :9J (*@, @2,Q ( 2)M2 J,*;=(5+; K,= L;K,=’(J),5 (5L 5,)@;3X5 (LL)J),5"J2; L)+J),5(=1 +(5 :; M;5;=(J;L (9J,’(J)+(**13R;(5Q2)*; ( I=,J,J1I; @1@J;’ )@ ’(L; (5L 2)M2 =;+,M5)J),5 I;=K,=’(5+; )@ I=,W;L Q2)*; J;@J)5M >?"$/" +2(=(+J;= @;J3H2; (W;=(M; =;+,M5)J),5 J)’; )@ #3$@"J2; =(J; ,K @J=,P; +,==;@I,5L;5+; L;J;=’)5(J),5 =;(+2;@ !!3/Y (5L J2; =;+,M5)J),5 =(J; 2)J@ !B4CA4 C’D0)1E4 $ ,5*)5; 82)5;@; +2(=(+J;= =;+,M5)J),5 "K=;; @J=,P; ,=L;= "K=;; @J=,P; +,55;+J),5
(& 匹配方法进行识别 ! 就可以同时解决笔顺自由和连笔自由
的问题 " 而确定输入汉字和标准模式的笔画对应关系问题其实是 一 个 指 派 问 题 $,--./01203 45"6721 %" 设 !"!$89%&’: 为 输 入 笔 画 和标准模式笔画之间的匹配距离矩阵 !%&’ 为输入的第 & 笔 和 标
>?"$/" 字符集进行的测试中 " 取得了较好的效果 $ 在笔顺 % 连笔完全自由的情况下 " 单汉字平均识别时间小于 #4$@ " 确定
笔画对应关系的正确率达 !!4/A " 识别率达 !B4CA ( 关键词 联机汉字识别 手写体汉字识别 笔顺自由 连笔自由 中图分类号 G/"B4E)H7$!
文章编号 %""!&’((%& !!""# &!!&#/DEF#$
!"#$"% &’()*"$+$)" ), -."/01$++’" 23$"’4% 23.1.5+’1 61’’ ,1)7 8+1)9’ :1/’1 ."/ ;)""’(+$)"
2.) <3’=$)"* >."* ?)"*(3’"* !6;I(=J’;5J ,K 8,’I9J;= <+);5+; (5L %5M)5;;=)5M "<NHO"<2(5M2() "###$#&
!"
/
学习汉语 " 说明汉语正在走向世界 ( 但至少对中国人来说 " 除了 语音输入汉字之外 " 最方便的莫过于手写 ( 于是人们一直热衷 于手写输入法的研究 ( 由于手写汉字的自由度太大 " 识别难度 很大 ( 因此 " 人们希望联机识别先行突破 ( 因联机手写时 " 汉字 的笔向 + 笔顺信息可被记载下来以帮助识别 ( 但写字人不一定 完全按规范的笔向 % 笔顺写字 " 更常常喜欢连笔 ( 这就使笔顺自 由 % 连笔自由成了联机识别中的两大难点 ( 从目前国内外的研 究情况来看 " 现有的一些方法在一定程度上解决了笔顺自由或 连 笔 自 由 问 题 "但 是 "既 能 很 好 地 适 应 手 写 汉 字 笔 顺 变 化 又 能 适应笔画数变化的识别方法还有待研究 ( 我们在嵌入式联机手写汉字识别引擎的研发中 " 提出了一 种能同时解决笔顺自由和连笔自由问题 " 而且对形变和噪音具 有很强适应能力的识别方法 ( 并制作了原型系统 " 在对 >?"$/" 字符集进行的测试中 " 取得了较好的效果 ( 本文将介绍其中关
相关文档
最新文档