五笔字型汉字编码流程
五笔打字的编码规则

五笔打字的编码规则一、键名字:每个键的最前面的一个字。
共25个(依次为:王土大木工目日口田山禾白月人金言立水火之已子女又纟)打法:连打四下。
如:王(G GGG)二、成字字根:本身是一个字的字根。
打法:先打它所在的键+第一笔+第二笔+未笔。
如:西(SGHG)车(LGNH)手(R TGH)四车力三、高频字(又叫一级简码)。
共25个(依次为:一地在要工上是中国同和的有人我主产不为这民了发以经)打法:必须记住所在的键。
打一下+空格。
如:一(G+空格)四、一般字的编码规则(按照书写顺序)1、超过四码的:打前三码+最后一码如:键(QVF P)2、刚好四码的:按照书写顺序依次输入:如:照(JVKO)3、不足四码的:有几码打几码+未笔识别码(注:再不足四码加空格)付(WFY+空格)注:重点难点,如何判断未笔识别码(1、未笔划2、结构)未(FII)点()未笔字型交叉识别码表结构未笔划左右1上下2 杂合3横1 11G 12F13 D竖2 21H 22J23K撇3 31T 32R33 E捺4 41Y42U43I折5 51N 52B53V注:半包围全包围的字的未笔划取被包围字的未笔划做为字的未笔划:连(LPK)这、边拆字规则:取大优先,兼顾直观,能散不连,能连不交词组的打法二字词组:取每个字的前两码。
例如:他们(WBWU)三字词组:取前两个的第一码+最后一个的前两码。
例如:计算机(Y TSM)四字词组:取每个字的第一码。
例如:弄虚作假(GHWW)多字词组:取前三个字第一码+最后一个字的第一码。
例如:中华人民共和国(KWWL)取大优先:尽可能取文字中最大的字根。
例1:世:第一种拆法:一、凵、乙(误)第二种拆法:廿、乙(正)显然,前者是错误的,因为其第二个码元“凵”,完全可以向前“凑”到“一”上,形成一个“更大”的已知码元“廿”。
五笔字型单字编码规则

五笔字型单字编码规则单字的五笔字型编码口诀是:五笔字型均直观,依照笔顺把码编;键名汉字打四下,基本字根请照搬;一二三末取四码,顺序拆分大优先;不足四码要注意,交叉识别补后边。
注意:五笔字型的编码最多取四个,且都用小写字母。
(1)键名汉字的输入规则在五笔字型的键盘图中,各字根键位左上角的第一个字叫键名字,共有25个:王土大木工,目日口田山,禾白月人金,言立水火之,已子女又纟键名汉字的输入方法:连击四下键名所在的键。
如:大:DDDD 口:KKKK 金:QQQQ 女:VVVV(2)成字字根汉字的输入规则在130个基本字根中,除键名字根外,本身就是汉字的字根,称为成字字根。
成字字根汉字的输入规则为:键名码(报户口)+首笔划代码+次笔划代码+末笔划代码当要输入一个成字字根时,首先把它所在的那个键打一下(俗称“报户口”),然后再依次打它的首笔划码、次笔划码、末笔划码。
注意:各个笔划代码一定是指单笔划,而不是字根,只能在“G、(横)H、(竖)T、(撇)Y、(捺)N(折)”范围内取码;如果成字字根只有两个笔划,即只能取出三个编码,则第四码以空格键结束。
如:贝:MHNY 车:LGNH 小:IHTY 戋:GGGT 马:CNNG 十:FGH※在五笔字型汉字编码中,横、竖、撇、捺、折五种单笔作为成字字根的特例,增加了两个“后缀”L码,其编码如下:一:GGLL 丨:HHLL 丿:TTLL 丶:YYLL 乙:NNLL键名汉字和成字字根汉字合称键面字。
(3)键外字的输入规则①含有四个及四个以上字根的汉字的输入其编码输入规则为:第一字根码+第二字根码+第三字根码+末字根码如:缩:纟宀亻XPWJ 型:一艹刂土GAJF②不足四个字根的汉字的输入当构成汉字的字根中只有二个字根或三个字根时,若按以上规则输入,就会造成许多重码。
如:“叭”与“只”对不足四个字根的汉字取码,应再加上一个补充代码,即:末笔字型交叉识别码。
末笔字型交叉识别码由汉字的末笔划代号和汉字的字型代号组成,共有两位数字。
五笔字型单字的编码

五笔字型单字的编码1、字根码:五笔字型输入法中的编码分为字根码和识别码。
前面已经介绍的汉字是由字根组成的,组成汉字的字根对应的键称为字根码。
位于同一个键位上的字根的字根码一样。
字根码是汉字拆分后字根的编码。
五笔字型输入的关键就是如何将汉字拆分成为字根,并将字根转换成键盘对应的字根码,然后通过键盘完成输入。
2、识别码:识别码一般是针对那些编码不足四码的汉字,最后补充一码作为识别码。
识别码的编码是由该汉字的最后一笔笔画对应的区号与该汉字的字型代号组成区位号来取码的。
五笔字型输入法中引入识别码后,大大减少了重码的输入。
输入编码相同而且编码不足三码的汉字时使用识别码,基本上不需要从输入提示框中去选择汉字。
不足三码的汉字的编码方法——字根编码+识别码补充识别码后不足四码的汉字编码方法——字根编码+识别码+空格3、编码原则汉字单字的取码原则是:按照汉字拆分的原则,取汉字的第一、二、三和最后一个字根进行编码。
由两个字根组成的汉字的编码——第一个字根码+第二个字根码+识别码+空格键由三个字根组成的汉字的编码——第一个字根码+第二个字根码+第三个字根码+识别码由四个字根组成的汉字的编码——第一个字根码+第二个字根码+第三个字根码+第四个字根码由四个以上字根组成的汉字的编码——第一个字根码+第二个字根码+第三个字根码+最后一个字根码汉字拆分的关键在于一是拆分的正确性,二是识别码的判断准确。
现在汉字编码中常见问题归纳如下。
字根形体相近,起笔不一样,区位不一样。
如,七、匕:七起笔为一(横),匕起笔为丿(撇)。
字根形体相近,第二笔画不同,区位不同。
如,戈、戋:戈位于15A,戋位于11G汉字最后一个字根不同。
如,茂、曳:茂最后一个字根为戈,曳最后一个字根为匕书写顺序与五笔字型拆分规定不一致。
如,成:最后一笔为:丶(撇),识别码为:Y字根变形,同属一区位。
如,心、 : 为心的变形,同属一区位4、重码处理在五笔字型输入法中,由于130个字根对应25个字母,因此难免会发生重码现象,有一部分可以通过识别码处理,但也有相当一部分编码为四位重码。
汉字五笔字型编码

编码流程图
键面 有的汉字 即为 成字根
键名,把所在的键连打四下,例“山”MMMM
汉字
成字根,先报户口(即字根所在的键位), 再取一、二、末笔画为字根,不足补空格 例 “西”SGHG;“方”YYGN;“厂”DGT空格
超过四码,取1、2、3、末字根 例 “攀” SQQR
键面上无
刚好四码 例 “到” GCFJ
不足四码,取完字根后,再补末笔识别码,仍不足,再补上空格 例 “会” WFCU ; “汉” ICY空格
能散不连 能连不交
• •
• 汉字结构分析。字根在组成汉字,可以根据它们的结构分为下面四种情况。 单,基本字根本身就是一个汉字,例如:王,木 散,组成汉字的字根间保持一定距离,例如:江,吕。散的关系,一般属于 左右型或是上下型 连,注意“连”不是指字根相连关系,如:充,首,右等都不作连的关系, 这里所指的连是下面两种情况,1、一个基本字根与一个单笔划相连,如:自, 久;2、带点结构,规定:一个基本字根之前或是之后的孤立点, 看成是与 基本字根相连,如:术,太,勺。连的关系组成的汉字均为杂合型 交,字根交叉重叠,字根间没有距离,如:串,里, 夷。交的关系组成的汉 字均为杂合型 了解以上所说的单散连交,拆字的时候,应该把该字尽量按散的字根关系来 拆,不行,则按连的关系,再不行,只好按交的关系。例,“午“能拆成” 十“散的关系,就不要拆成”丿干“连的关系;”于“能拆成”一十“连的 关系,就不要拆成”二丨“交的关系。
编码
• 人机对话有键盘、手写、语音输入法,键盘输入法是最主要也是最稳 定的输入方法,当然手写与语音输入是发展的方向,但从目前来看这 两种方法技术方面还没有突破,识别率还是比较低。 • 键盘上没有汉字键位,全是英文和数字及一些符号,通常将汉字按一 定的规则与键盘上的键位相对应,这就是编码。 • 编码方式有很多种,所谓的“万码奔腾”,不外可以分为两种编码方 式, 根椐字的发音来编叫音码,例“全拼输入法”,根据字的结构和形状 来编叫形码,例“五笔字型” 。 五笔字型的优点,五笔字型是目前速度最快的汉字输入法(超级打手 可以每分钟输入近200个汉字),出现近二十年来,从来没有被撼动 输入法老大的地位,速度快的原因有三,1、字和码基本上是一一对 应,重码率很低;2、有简码功能;3、支持词组输入。 五笔字型的缺点,记忆量大,拆字方法难以掌握,久不用容易忘记。 谁来学五笔:计算机从业人员;文秘人员;工作、学习中以计算机为 主要工具人员;发音不准,南腔北调,说话老走火人员;年青记忆力 强容易接受新知识的学生。
汉字五笔编码的表示方法

汉字五笔编码的表示方法汉字编码的表示方法在本话题中,将汉字的编码在第几位上标以大写字母,即表示其有几级简码。
该表示方法能把汉字编码是否有各级简码、其编码中有多少级简码以及在其全码时是否需选码的等情况表示得清清楚楚。
具体说明如下。
一、有一级简码时在某个汉字编码中若第1个编码字母大写,则表示在该汉字编码中有一级简码。
例如“中(KHk)、国(LgYi)、要(SVf)、民(NAv)、主(YGd)”这5个汉字。
输入方法是:敲了汉字第1个字根所属的码键后再敲一下空格键,即可输入。
二、有二级简码时在某个汉字编码中若第2个编码字母大写,则表示在该汉字编码中有二级简码。
例如上述的“中(KHk)、要(SVf)、民(NAv)、主(YGd)”这4个汉字,再如“学(iPBf)、术(sYi)、水(iIIi)、平(gUHk)、高(yMKf)”这5个汉字。
输入方法是:敲了汉字第1、2个字根所属的码键后再敲一下空格键,即可输入。
三、有三级简码时在某个汉字编码中若第3个编码字母大写,则表示在该汉字编码中有三级简码。
例如上述的“学(iPBf)、水(iIIi)、平(gUHk)、高(yMKf)”这4个汉字,再如“永(ynIi)、远(fqPv)、跟(khVe)、着(udHf)、党(ipKq)”这5个汉字。
输入方法是:敲了汉字第1、2、3个字根所属的码键后再敲一下空格键,即可输入。
四、是三码字时在五笔编码中有两种“三码字”:第一种是只有两个单笔画的字根汉字(加附),第二种是二根字。
“三码字”又分是否须选码两种情况。
1.无须选码的三码字在某个汉字编码中若只有3个编码字母而第3个字母小写,但不加以字符方框,则表示在该汉字是个无须选码的三码字,此时会有两种可能:或为无重码的三码字,或虽有重码但该字在提示屏中被排在第1位(这两种情况皆相当于该汉字有三级简码)。
例如“儿(qTn)、乃(etn)、十(fgh)、八(wty)、了(Bnh)”这5个属只有两个单笔画的字根汉字的汉字。
五笔字型输入方法

五笔字型输入方法五笔字型汉字编码是根据汉字字型结构和书写顺序实施的编码方案。
由于五笔字型输入速度快,效率高,容易实现盲打(即不看键盘操作),学习起来并不困难,因此五笔字型输入方法目前在我国拥有较多的装机机种和用户,获得了广泛的应用。
一、字根的概念汉字是一种象形文字,一个完整的汉字是由若干笔划复合交叉所形成的相对不变的结构所组成,而这些结构绝大多数都是由古汉字中的基本图形衍变而来,我们把这种图形称为“字根”,一般说来,字根是有形有义,在多数情况下还有称谓的基本构字单位,这些基本单位,经过拼形组合,就产生出众多的汉字。
字根是构成汉字的最重要的基本单位。
字根是汉字的灵魂。
汉字可划分为三个层次:笔划、字根、单字。
五笔字型编码方案是根据人们习惯的书写顺序,以字根为基本单位来组字编码的方案。
二、汉字的字型结构(一)五种笔划的定义五笔字型输入方法的发明者把汉字的字型定义为五种笔划。
所谓笔划是指书写汉字过程中,一次构成的一条可转向的连续线段。
应该指出的是所谓“书写”是必须按国家标准字形书写,必须是以楷体方式书写。
五种笔划定义为:横、竖、撇、捺、折。
相应编号分别为1、2、3、4、5。
前面四种笔划的运笔方法极易掌握,折是指除左竖钩(并入竖划类)之外的所有带转折的笔划。
一些特殊笔划的规定:1、“提笔”视为横。
如“现、场、特、扛、冲”各字左部末笔均为“提”,视之为横。
2、点均视为捺类。
如“学、永、寸、冗”各字中的点,包括“学”中的左点都视为捺类。
五种笔划组成字根时,笔划间的关系可分为以下四种情况:(1)单:即五笔划自身;(2)散:组成字根的笔划间有一定间距,如:三、八、氵等;(3)连:组成字根的笔划之间是相连接的,如:厂、人、尸、弓等;(4)交:组成字根的笔划之间是相互交叉的,如:十、力、又、车等。
当然还会有混合情况,一个字的各笔划间,可以又连又交或散,如禾、雨等,掌握笔划的概念和笔划间的关系,对非基本字根的拆分和“识别码”的取法是非常有用的。
五笔字型解码方法

五笔字型解码方法
五笔字型是一种基于笔画和字根的汉字输入法。
要解码一个汉字,需要遵循以下步骤:
1. 拆分原则:根据约定俗成的书写习惯进行拆分,即先上后下、先左后右、先外后内,将汉字拆分成字根表里已有的最大字根。
这里的最大字根是指该字根再增加一笔就不能形成已有字根。
2. 识别码:如果一个汉字被拆分成多个字根,还需要根据这些字根的排列顺序,通过识别码来进一步确定这个汉字的具体编码。
识别码是由该字根所在的键位和该字根的最后一笔划两部分组成的。
3. 编码规则:根据汉字拆分后的字根,按照五笔字型的编码规则,在键位表中找到相应的键位,组合起来就是该汉字的完整编码。
总的来说,五笔字型的解码方法需要综合考虑汉字的书写习惯、字根的拆分和识别码的确定等多个方面。
五笔字打字编排规律

五笔字打字编排规律分布横是在11——15中,“提”归在“横”里面,其中前面的1代表横,大约11代表一横,12代表二横,13代表三横。
竖是在21——25中,“竖钩”也被归在“竖”里面,其中前面的2代表竖,大约21代表一竖,22代表二竖,23代表三竖。
撇是在31——35中,其中前面的3代表撇,大约31代表一撇,32代表二撇,33代表三撇。
捺是在41——45中,其中前面的4代表捺,注意,此处点与捺是一样的,大约41代表一捺(点),42代表二捺(点),43代表三捺(点),44代表四捺(点)。
折是在51——55中,其中前面的5代表折,大约51代表一折,52代表二折,53代表三折。
注意:有相当多的简单的折、拐弯的笔划在五笔中都是等同“乙”都在N中(如横折、竖折、竖折弯钩等等)名词解释:字根: 在五笔中所有汉字的组成部位都称之为字根,每一个汉字都是由几个字根所组成。
键名字: 在五笔中有25个输入键(查询键Z除外)为了便于记忆,每一个键有一个主要的字。
通常键盘字根表会着重或分色表示的那一个就是,如11为王,12为土,13为大。
键面字: 在五笔中,有相当多的输入键里面,除了键名字,还有相当多的字根本来就是汉字。
它们可以理解为一个字根也可以理解为一个字,如11里面的五,22里面的虫,33里面的用。
一级简码: 通常为了加快输入速度,五笔将25个最常用的字编为一码输入,每一个字对应一个键,这样我们就只要输入一个键就可以打出原本要三到四下才可以打出来的字。
如:一级简码: 下面的每一个字只要在键盘上输入对应的键一下就可以打出前面的字来一(G)11、地(F)12 、在(D)13 、要(S)14 、工(A)15 、上(H)21、是(J)22、中(K)23、国(L)24、同(M)25 、和(T)31 、的(R)32 、有(E)33、人(W)34、我(Q)35、主(Y)41、产(U)42 、不(I)43、为(O)44 、这(P)45 、民(N)51 、了(B)52、发(V)53、以(C)54 、经(X)55。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
54 计算机基础与五笔字型教程
“识别码”是由“未笔”代号加“字型”代号,构成的一个复合附加码。
当单字(键位表以外的汉字)折分出的字根数不足四个时, 需要补入一个识别码。
识别码由两位组成, 即该字未笔划的编号和该字的字形编号。
1、丢失字形信息会引起重码
“识别码”的必要性
2、因同一个键们上有几个不同 的字根而引起重码
右图为末笔字型的表示方法:
末笔字型交叉识别码如下表所示。
末笔字型识别码表
五笔字型汉字编码流程图
将前面的内容归纳起来,就形成了《五笔字型汉字输入技术编码流程图》如下图所示。
这张一目了然的图表,是“五笔字型”编码的“总路线”,编码的方法和规则尽在其中。