五笔字型汉字编码流程图

合集下载

五笔字型键盘字根图

五笔字型键盘字根图

86五笔字型键盘字根图12五笔字型编码的汉字拆分原则由基本字根组成一个汉字,这是一个正过程,这个过程对我们没有什么影响。

我们学习的是逆过程。

即将一个完整的汉字拆分成若干个基本字根。

五笔字型编码方案拆字的基本原则可概括为下面几种情况:一、单字根汉字这种汉字就是我们所说的成字字根。

由于这种汉字只有一个基本字根,所以不用再拆,这类汉字的拆分有单独规定,在下一节中会详细讲述。

二、散结构的汉字由于组成这种汉字的字根之间没有什么关联。

各部分相对独立,所以拆分时只需要简单地将这些字根孤立出来就行,这类汉字的拆分也相对简单。

如"只"的字根是"口"和"八"。

"数",这个字的字根是"米" "女" "文"。

三、交叉结构或交连混合结构的汉字这类汉字如果一个汉字只是由单笔画与基本字根相连组成,哪么就可以将这个汉字直接拆份成单笔画和基本字根即可,如:"上"可以拆分为"卜""一","太"可以分为"大"和"、"。

四、复杂结构的汉字除此之外,更多的的汉字是哪些结构较复杂的,这些汉字由于组成字根之间有相连,包含或嵌套的关系,没有很明显的界限,对于初学者来说,难以拆分。

对这样的汉字,拆分时要按以下原则进行,也就是"取大优先"、"兼顾直观"、"能连不交"、"能散不连"。

书写顺序:拆分"合体字"时,一定要按照正确的书写顺序进行。

例:"新"只能拆成"立、木、斤",不能拆成"立、斤、木" "中"只能拆成"口、丨",不能拆成"丨、口";"夷"只能拆成"一、弓、人",不能拆成"大、弓"。

第七章 汉字的编码规则与输入

第七章 汉字的编码规则与输入
在按“书写顺序”拆分汉字时,不能无限制 地拆下去,否则全都变成了单笔画!而应当以 “再添一个笔画便不能构成为字根”为限度,每 次都拆取一个“尽可能大”的,即“尽可能笔画 多”的字根。
例如:
世:第一种拆法:一、凵、乙(误);
第二种拆法:廿、乙(正确)。
显然,前者是错误的,因为其第二个字根
“凵”,完全可以向前凑到“一”上,形成一个 “更大”的已知字根“廿”。再如:
(误);
、一、冂、丨、刂
、冂、丨、刂(正确)。
同样,第一种拆法是错误的。因为这种拆法
第二码的“一”,作为“ ”之后的一个笔画, 完全可以向前凑,与第一个字根“ ”凑成“更 大”一点的字根“ ”。
总之,“取大优先”,俗称“尽量往前凑”, 是一个汉字拆分中最常用到的基本规则。至于什 么才算“大”,“大”到什么程度才到边,等到
例如:“新”——只能拆成“立、木、斤”, 而不能拆成“立、斤、木”;
夷——只能拆成“一、弓、人”,而不能拆 成“大、弓”;
中 —— 只 能 拆 成 “ 口 、 丨 ” , 而 不 能 拆 成
口”。
(2)取大优先 “取大优先”,也叫做“优先取大”。它有 如下两层含义:
*拆分汉字时,拆分出的字根数应该最少; *当有多种拆分方法时,应取前面字根大、笔 画多的那种。
5种单笔画的编码规则与输入方法:报户口 + 单笔画 + L + L。
例如:“一”:GGLL,“丨”:HHLL
“丿”:TTLL,“丶”:YYLL
应当说明,“一”是一个极为常用的字,每 次都打4下健岂不费事?别担心,GGLL只是作为 全码,后边会讲到,“一”还有一个最简短的码, 也叫“高频字”码,你只要打一个“G11”,再打 一个空格键便可输入。

五笔字型

五笔字型

③ 成字字根输入方法 报户口+首笔码+次笔码+末笔码 报户口+首笔码+末笔码(当成字字根仅为两 笔时) 键名码即所在键字母,击此键又称报户口。 首单笔码、次单笔码和末单笔码,不是按字根 取码,而是按单笔画取码、横竖撇捺折五种单笔的
键名码+首笔码+次笔码+末笔码
单笔画取码即各类第一字母,对应关系如下:
些符合已知字根代码的字,将汉字及其正确代码显示在提示 行里。需要那个字,就打一下这个字前的数字,就可以将所 需要的字从提字行中“调”到当前的光标位置上。由于提示 行中的每一个字后面都显示它的正确编码,初学者也可以从 这里学习到自己不会拆分的汉字的正确编码。
4.5.2 五笔字型的造词方法
添加词语的步骤如下: 1、右击五笔字型输入状态栏的 ,弹出如图 所示快捷菜单。
三种字型

杂合型 1、包围和半包围关系比如“团、同、医、凶、句”等,含有“辶” 的字也是杂合型,如“过、进、延”等,“厂、尸、 ”等字根组 成的一些字也是杂合型, 2、一个基本字根和一个单笔划相连,也视为杂合型,如自己的 “自”,由一撇和一个目字连在一起组成,再比如“千、尺、且、 本”等。 3、一个基本字根之前或之后有孤立点的也当作杂合型,比如“勺、 术、太、主、斗”等。
王土大木工 禾白月人金 已子女又纟 目日口田山 言立水火之
3、成字字根的输入 在字根总表中,除了键名字根外,本身就 是汉字的字根,称为成字字根。这样的成字 字根一共有65个。
成字字根的输入方法是: 键名+首笔代码+次笔代码+末笔代码
4、一级简码的输入
在五笔中,挑出了在汉语中使用频率最高 的25个汉字,把它们分布在键盘的25个字母 上,并称之为一级简码。 一级简码的输入方法是: 按一下简码字所在的键,再按一下空格

wbzx

wbzx

3.汉字折分原则
• (1)汉字的结构分析 • 1)单:即基本字根本身单独成为一个汉字 • • •
(成字字根)。 2)散:指构成汉字的基本字根之间保持一定 的距离。或汉字由非单笔画组成,字根与字 根相连。 3)连:① 指一个基本字根连一单笔画 ;② 连的另一种情况是所谓“带点结构” 连的另一种情况是所谓“带点结构”。 4)交:是指几个基本字根交叉套迭之后构 成的汉字。
表1-8 末笔字型识别码与对应键 的关系
笔型 字型 横 1 竖 2 撇 3 捺 4 折 5 左右 型1
11g 21h 31t 41y 51n
上下 型2
12f 22j 32r 42u 52b
杂合 型3
13d 23k 33e 43i 53v
• 汉:43i 汉:43i • 字:45p 字:45p • 华:34w 华:34w • 同:25m 同:25m
6.简码的输入
• (1)一级简码(又称高频字)的输入 一级简码(又称高频字) • (2)二级简码 • (3)三级简码
• 1 ) 一级简码 ( 高频字 ) :共 25个 , 按区位排列。 一级简码( 高频字) :共25 个 按区位排列 。 • 一地在要工 上是中国同 • 和的有人我 主产不为这 • 民了发以经 • 输入方法:按该汉字对应的键,再按空格即可。
• 三字词:前两字各取一码,最后一字取 三字词:前两字各取一码,
前两码, 前两码,共4码。 • 计算机:讠木几(ytsm) 计算机:讠木几(ytsm) • 解放军:ク方冖车(qypl) 解放军:ク方冖车(qypl) • 操作员:扌亻口贝(rwkm) 操作员:扌亻口贝(rwkm) • 生产率:丿立亠幺(tuyx) 生产率:丿立亠幺(tuyx)
• ( 3 ) 合体汉字输入 。 单字的取码规则 合体汉字输入。

汉字五笔字型编码

汉字五笔字型编码

编码流程图
键面 有的汉字 即为 成字根
键名,把所在的键连打四下,例“山”MMMM
汉字
成字根,先报户口(即字根所在的键位), 再取一、二、末笔画为字根,不足补空格 例 “西”SGHG;“方”YYGN;“厂”DGT空格
超过四码,取1、2、3、末字根 例 “攀” SQQR
键面上无
刚好四码 例 “到” GCFJ
不足四码,取完字根后,再补末笔识别码,仍不足,再补上空格 例 “会” WFCU ; “汉” ICY空格
能散不连 能连不交
• •
• 汉字结构分析。字根在组成汉字,可以根据它们的结构分为下面四种情况。 单,基本字根本身就是一个汉字,例如:王,木 散,组成汉字的字根间保持一定距离,例如:江,吕。散的关系,一般属于 左右型或是上下型 连,注意“连”不是指字根相连关系,如:充,首,右等都不作连的关系, 这里所指的连是下面两种情况,1、一个基本字根与一个单笔划相连,如:自, 久;2、带点结构,规定:一个基本字根之前或是之后的孤立点, 看成是与 基本字根相连,如:术,太,勺。连的关系组成的汉字均为杂合型 交,字根交叉重叠,字根间没有距离,如:串,里, 夷。交的关系组成的汉 字均为杂合型 了解以上所说的单散连交,拆字的时候,应该把该字尽量按散的字根关系来 拆,不行,则按连的关系,再不行,只好按交的关系。例,“午“能拆成” 十“散的关系,就不要拆成”丿干“连的关系;”于“能拆成”一十“连的 关系,就不要拆成”二丨“交的关系。
编码
• 人机对话有键盘、手写、语音输入法,键盘输入法是最主要也是最稳 定的输入方法,当然手写与语音输入是发展的方向,但从目前来看这 两种方法技术方面还没有突破,识别率还是比较低。 • 键盘上没有汉字键位,全是英文和数字及一些符号,通常将汉字按一 定的规则与键盘上的键位相对应,这就是编码。 • 编码方式有很多种,所谓的“万码奔腾”,不外可以分为两种编码方 式, 根椐字的发音来编叫音码,例“全拼输入法”,根据字的结构和形状 来编叫形码,例“五笔字型” 。 五笔字型的优点,五笔字型是目前速度最快的汉字输入法(超级打手 可以每分钟输入近200个汉字),出现近二十年来,从来没有被撼动 输入法老大的地位,速度快的原因有三,1、字和码基本上是一一对 应,重码率很低;2、有简码功能;3、支持词组输入。 五笔字型的缺点,记忆量大,拆字方法难以掌握,久不用容易忘记。 谁来学五笔:计算机从业人员;文秘人员;工作、学习中以计算机为 主要工具人员;发音不准,南腔北调,说话老走火人员;年青记忆力 强容易接受新知识的学生。

新世纪五笔字型输入法

新世纪五笔字型输入法

1、“四元字”的编码规则 键外字中的“四元字”,是指刚好由四个字根构成的字。其拆分之后的取码方法是“依照书写顺序输入字 根” 。例如: 照:日刀口灬 22 53 23 44 JVKO 重:丿一日土 31 11 22 12 TGJF 2、“多元字”的取码规则 —— “前三末一”(一二三末) 键外字中的“多元字”,是指由4个以上的字根构成的字。这种字,不管实际上能“拆”成几个字根,我们只 需“按书写顺序,取拆分结果的第一二三及最末一个字根”便可,俗称“一二三末”,共输入四个码 。例如:
第三代五笔字型从理论和实践两个方面,都取得了质的突破,实现了对第一代和第二代的再创新。第三代的 各项技术指标,包括字根的增减或移位、键位负荷的均衡设计、简繁汉字的简码设计、汉字“大小写”的定义和 应用、容错码设计以及《助记歌》等等,与前两代比,都有质的进步。从实用性评价,其重码实用频度降低,取 码规范化,打起顺手;规律性、易学性等方面也都有显着的进步。所以,发明人王永民教授说,第三代五笔字型 (新世纪版)将是他30年来研究五笔字型的一个“终极版”,“第三代是个大方向”!王码集团将以这个版本为 核心,统一全国的“形码”输入法。
五笔字型于1983年8月28日鉴定之后,25年间其软件共有三代版本 :
第一代:1986年推出86版五笔,并附有五种笔画“前四末一”简易输入法,史称86—4.5版;其取码规范化 的一个改进版WB-,2001年推出,称“新86”版或“标准86版”;
第二代:1998年推出98版五笔,增加整字根甫、未、甘、母等,移广到O键;
图3新世纪五笔字型字根键位图
为保持技术的连续性,第三代五笔字型(新世纪版)的25个“键名”没有变动。新设计的字根体系更加符合 分区划位规律,更加科学易记而实用,按规范笔顺写汉字的人,取码输入将得心应手。新世纪版的《字根助记歌》 如下 :

五笔汉字录入-(识别码)少于4字根字

五笔汉字录入-(识别码)少于4字根字
元:二→儿,识别码:末笔折、上下型2→2折,编码: FQB;
洒:氵→西,识别码:末笔横、左右型1→1横,编码: ISG;
字:宀→子,识别码:末笔横、上下型2→2横,编码: PBF;
沐:氵→木,识别码:末笔点、左右型1→1点,编码: ISY;
同:冂→一→口,识别码:末笔横、杂合型3→3横,编 码:MGKD。
五笔字型均直观,依照笔顺把码编; 键名汉字打四下,基本字根请照搬; 一二三末取四码,顺序拆分大优先; 不足四码要注意,交叉识别补后边。
表:末笔字型识别码表
字型
末笔型
横1 竖2 撇3 捺4 折5
பைடு நூலகம்
左右型 1
11 G 借 22 H 部 33 T 伐 44 Y 认 55 N 孔
上下型 2
12 F 全 22 J 章 32 R 笺 42 U 定 52 B 岂
杂合型 3
13 D 里 23 K 匠 33 E 必 43 I 叉 53 V 无
例如:
(2) 字根不足4个的一般汉字编码 输入时,按顺序取字根编码再补一个末笔字型交 叉识别码,若给出识别码还不足4码,则补空格结束。
末笔字型交叉识别码的确定:首先看组成该字的 末笔笔画,确定笔画代号(对应一,丨,丿,丶,乙 分别为1,2,3,4,5);其次再看该汉字的字型 (左右型、上下型、杂合型),确定字型代号(对应 左右、上下、杂合分别为1,2,3)。就很容易得到识 别码的区位。
关于末笔的几项说明: ① 对于带“框”的“国、团”等与带“走之”的 字:末笔一律取包围部分的末笔。例如,“进”的末 笔取“丨”;“团”的末笔取“丿”。 ② 九、刀、力、匕等末笔为折。例如,男、花等。 ③ 我、戋、成等字的末笔,按“从上到下”的原 则,一律规定末笔为撇。

一级GB汉字五笔字型编码

一级GB汉字五笔字型编码
队 bw
队 bwy
对 cf
对 cfy
多 qq
多 qqu
夺 df
夺 dfu
朵 ms
朵 msu
厄 dbv
儿 qt
儿 qtn
尔 qiu
洱 ibg
珥 gbg
铒 qbg
二 fg
二 fgg
佴 wbg
乏 tpi
伐 wat
罚 ly
法 if
凡 my
凡 myi
犭 qte
砬 dug
来 go
来 goi
兰 uff
仂 wln
叻 kln
乐 qi
乐 qii
了 bnh
雷 flf
耒 dii
肋 el
肋 eln
泪 ihg
类 od
类 odu
累 lx
楞 sl
离 yb
骊 cg
李 sb
李 sbf
里 jfd
理 gj
力 lt
力 ltn
历 dl
杩 scg
吗 kcg
嘛 ky
麦 gtu
慢 nj
冒 jhf
么 tc
么 tcu
没 im
玫 gt
玫 gty
枚 sty
眉 nhd
煤 oa
扪 run
钔 qun
闷 uni
们 wu
们 wun
孟 blf
咪 koy
眯 ho
眯 hoy
迷 op
迷 opi
米 oy
弭 xbg
北 uxn
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一级简码键盘图
我 35Q 人 34W 有 33E 的 32R 和 31T 主 41Y 产 42U 不 43I 为 44O 这 45P
工 15A
要 14S
在 13D
地 12F
一 11G
上 21H
是 22J
ቤተ መጻሕፍቲ ባይዱ中 23K
国 24L
经 55X
以 54C
发 53V
了 52B
民 51N
同 25M
兼顾直观 末 笔 型 划
汉字
键面无
依照
1
2 12F 22J 32R 42U 52B
3 13D 23K 33E 43I 53V
例:于 一十(正) 二丨(误)
能连不交
例:天
横 1G 11G 竖 2H 21H 撇 3T 31T 捺 4Y 41Y 折 5N 51N 一大(正) 二人(误)
末笔字型交叉识别码
当单字(键位表以外的汉字)拆分出的字根不足四个时需补入一个识别码。识别码 由两位组成,即末笔画的编号和字的类型。 注意:凡是包围型汉字的末笔规定取被包围那一部分的最后一笔为末笔。
五笔字型汉字编码流程图
键名字 键面有 成字字根
把所在键连打四次,例:王(GGGG) 字根所在键第一、二、末笔画(不足四码补空格) 例:西:西一丨一(SGHG) 十:十一丨(FGH) 取 1、2、3、末字根编码 书写顺序 超过四码 例:微 彳山一攵 例:键 (TMGT) 拆 金彐丨廴(正) 取 1、2、3、4 字根编码 刚好四码 金廴彐丨(误) 例:能 厶月匕匕 (CEXX) 取大优先 不足四码 字根键入完成后,补打 例:产 “末笔字型识别码” 立丿(正) (仍不足四码补空格) 六厂(误) 字 左右型 上下型 杂合型
相关文档
最新文档