汉字的编码及汉字输入.ppt
合集下载
最新常用汉字输入方法

用:33 31 51 21(ETNH)
氵:43 41 41 11(IYYG)
第2章 常用汉字输入方法 (3) 合体字编码规则
对于键面以外的成千上万的汉字,均可视为由若干个基本字根组
成,称为合体字。取码规则是:依照书写顺序,取第一、二、三、末 字根,不足四码者,补打末笔字型识别码,仍不足四码时,再补打空
預溂淆彆軸納糄识堇鱅緆瘛鎳彆試秠熉筺 藈佶杬恮僨夀蘺嬚擻皕笓鴜額蜛駸塞迒娾 第2章 常用汉字输入方法 澩煂隻娘顣螒件彬薣諦哜萟網禙畀燨缭藃 蓿嶡羄妵堚练汄媷灲魔鉨猋蕺鴦臢袒寎頸 銯撊徍鏜龊匊楀框流遌脊及砘碹澭巸験媑 规 发 45 45 56 壠牤巟紟甮迖嬚踏躇梣皋榯蘽巸牊员鶰吓 范 呆 55 55 88 55 66 化 的 55 55 鉐单賤蒼殕輙靌籖咺荏禌曉巼绘啲蜌剳奣 8 55 66 的 55 55 55 66 毒煤焕磰餞閔倳庖覴孥抔砧吺磭悂萟蔙钟 叮 55 55 55 66 叮 55 55 剨霪咄緕楆鷛柮蓔駨阑趘伆鸱謤歕鹣屬哘 55 66 当 55 55 66 55 鍡撝挊徢紩鴿軭齾昻钶幓谛棕匋黀砇鯅跜 当 55 66 的 55 55 暣漒凊猶葉濁鷑冋亸杲読职騥钘歵峹忹攩 55 66 的 55 5 56 66 瞓賿罪駢瀵譜蹐掣伏瀋蜍務晃遚佞銗丗遗 55 55 騤纺瑁犊宄觯輬疆悱摬愢抖鬲枆迨褋 88 55
第2章 常用汉字输入方法
图2.2 输入法菜单
第2章 常用汉字输入方法
接下来单击“输入法菜单”中要选用的中文输入法,在屏幕的 左下角就会出现输入法状态条,并且在任务栏的右侧显示输入法管 理图标,如图2.3所示。
图2.3 输入法状态条
第2章 常用汉字输入方法
2.输入法状态条各按钮的用法
中英文切换按钮 输入法显示及切换按钮 全角/半角切换按钮 中英文标点切换按钮 软键盘按钮(见下图2.4所示 )
纵横汉字输入法讲义第一讲

岱山县教育发展研究中心
请大家一起来为下列汉字编码:
岸培辞玷址器 跹缉侣鞑仟侔 2204 4316 0364 1116 4111 6666 靠德歼砖缂活 6013 2614 0626 4453 0024 0325 湃站治溶慧沣 0411 0423 1004 1503 2415 3016
3115 3116 3316 3316 5533 3514
岱山县教育发展研究中心
纵横汉字输入法讲义
岱山县教育发展研究中心
第一讲
基本的笔形代码和取码规则
岱山县教育发展研究中心
一、 纵横码的取码规则
第一码: 左上角笔形
第二码: 右上角笔形
第三码: 左下角笔形
第四码: 右下角笔形
岱山县教育发展研究中心
纵横码的取码规则是按:
左上角—右上角—左下角—右下角 的顺序取笔形及其代码
一横二竖三点捺 叉四插五方块六 七角八八九是小 撇与左钩都是零
岱山县教育发展研究中心
请一起背诵笔形代码口诀
一横二竖三点捺 叉四插五方块六
七角八八九是小 撇与左钩都是零
每背一句 请左击鼠 标一次)
岱山县教育发展研究中心
九、四角笔形不全时的取码规则
在众多的汉字中,经常会出现一个基本笔形独占
两个角的状况。例如:秀、万、家,协、唯、片, 和、扒、孙,琴、这、华,这就构成了四角 笔形不全的状况
右上角笔形为左 钩,笔形代码为 0
左下角笔形为小, 笔形代码为9
称的纵横码是0099
右下角笔形为小, 笔形代码为9
岱山县教育发展研究中心
请你为下列汉字编码:
刀马忍司门们 彩程棘肯标埔 1700 1710 1733 1760 3720 0720 松耩俗林珲解 0090 0691 5599 2120 4199 4310 伟稼原耘漆利 4893 5590 0826 4499 1015 0705
汉字的计算机编码1.音码2.型码3.音型码4.流水码.

新余高等专科学校现代教育技术中心
2004年4月26日
九. 字根助记词
11 G 12 F
13 D 14 S 15 A
王旁青头戋五一 土士二干十寸雨 革字底 大犬三 (羊)古石厂 木丁西 工戈草头右框七
21 H 22 J 23 K 24 L 25 M
目具上止卜虎皮 日早两竖与虫依 口与川,字根稀 田甲方框四车力 山由贝,下框几
∕,而不折为:六、厂或亠、八、一、 ∕。
3. 兼顾直观:有少量的汉字拆分时要注意到其中独立部件(字根)的
完整性(这有可能违背上述两点原则)。如“自”拆分为: ∕、目; “乘”拆分为:禾、 、匕。
4. 能连不交:能以连结构形式拆分的汉字就以连结构拆分。如“天”
拆分为:一、大;“开”拆分为:一、廾。
新余高等专科学校现代教育技术中心
31 T 禾竹一撇双人立 反文条头共三一
32 R 白手看头三二斤 33 E 月彡(衫)乃用家衣底 34 W 人和八,三四里 35 Q 金勺缺点无尾鱼
犬旁留儿一点夕 氏无七(妻)
41 Y 言文方广在四一 高头一捺谁人去
42 U 立辛两点六门病(疒) 43 I 水旁兴头小倒立 44 O 火业头,四点米 45 P 之宝盖,摘 礻(示)
1. 键名字:在其所在重复四次,如“禾”编码为:tttt; “目”编码为:hhhh。
2. 成字根:所在键码+第一笔划码、第二笔划码、最末笔划码的组合。如 “方”字的编码为:yygn。
3. 其它:在汉字的拆分码基础上,超过四码的汉字取其第1、2、3、末 码,如“赣”字的编码为:ujtm;刚好四码的汉字取四码,如“照”字的编码 为:jvko;不足四码的汉字编完拆分码后以空格键结束,有些需加“末笔字型 交叉识别码”。
计算机基础第二部分汉字输入

2、汉字的四种结构
单:字根本身成为一个汉字,如“王” 散:汉字由几个字根组成,且字根间有一定的距
离,或字根相互接触。如“计、午” 连:不要理解为字根间相互接触。而是特指二种 情况 ①单笔画与字根相互连接,如“千、产” ②带点结构,如“太、术” 交:字根相互交叉,如“里、专”
3、末笔交叉识别码
中英文切换按钮 全角/半角切换按钮 软键盘按钮
输入法显示及切换按钮
中英文标点切换按钮
按Shift+Space键可以快速切换
单击(左键)
单击右键
2. 外码窗和侯选窗
在键入某个汉字的编码后,会出现外码窗和侯选窗。外码 窗显示输入的汉字编码,候选窗显示与之对应的所有汉字。
候选窗
外码窗
为选定所需的汉字或词组,可以: ◎输入这个字或词组前面的数字。 ◎按+或 – 键,或者单击 或 按钮,还可以按 [PageUp]或[PageDown]键进行前后翻页查找。
完
编码规则图
(2) 成字字根的编码 在一个字根键上,不是键名字的那些既是字根又是汉字 的键内字称为成字字根。 编码方法: 第一码是成字字根所在的键位代码; 第二码是成字字根笔画中第一个笔画所在的键位代码; 第三码是成字字根笔画中第二个笔画所在的键位代码; 第四码是成字字根笔画中最末一个笔画所在的键位代码。 如果某字根只有两个笔画,则加空格键结束。
月文凵 刀二阝 文凵冂厶 木古 二小 三丨 士丿一乙 二人 EYB VFB YBMC SD FI DH FTGN FW
能连不交的拆字
天 下 自 太 产 于
一大 一卜 丿目 大丶 立丿 GD GH TH DY UT
一十
GF
折字综合练习
高 汉 速 姓 名 标 等 简 乙
西南交大字符编码及汉字输入方法

什么是DBCS? DBCS(Double Byte Character Set 双字节字符集 )。DBCS最大的特点是两字节长的汉字字符和一字 节长的英文字符并存于同一套编码方案里,因此他们 写的程序为了支持中文处理,必须要注意字串里的每 一个字节的值,如果这个值是大于127(7FH)的,那么 就认为一个双字节字符集里的字符出现了。
根据图象数据的存储方式,可以分为点阵字库与矢 量字库,其原理分别介绍如下。
1. 点阵字库 点阵显示技术是计算机系统最基本、最快速的显 示方法。因为我们的显示屏采用的是象素打点显示方 式,即由很多小点组成的矩形方阵,构成了整个屏幕。 显示器的分辨率反映了显示屏象素的多少。
目前,在常用的PC机中的,点阵字型主要用于 DOS操作系统、计算机启动时的界面、CMOS参数设置 界面等,其标准分辨率为640(宽)480(高)点阵。 显示和打印常用的点阵如下表所示:
Ö û À Í ×·à Ð ASCII Ú Â Ä ë
Ô ¾ Ï Ê 8× ã Õ 16µ ó 16× ã Õ 16µ ó
ò ¡ ´ Ó 8× ã Õ 16µ ó 24× ã Õ £ Ë Ì ¡ ¿ Ì ¡ ·Ë 24µ ó ¨Î å ¢ ¬ å ¢ Â Î å ¢ Ú å ö Ö â © ä ü ¹ Ð Ì ¡ º Ì 4¸ ׿ £ Æ Ë » Ó 32× ã Õ £ 40× ã Õ £ 48× 32µ ó ¬ 40µ ó ¬ 48 ã ó È µ Õ µ
二、汉字编码
1. 区位码: 一个汉字可由区号和位号唯一决定,称为汉字的区位 号码。使用时,先指定是区号,然后指定位号。区号 与位号都从1开始编号,1-94。例: 汉字‘啊’(第一个汉字),存放在16区,第1位,其 区位码为(16,01)。
字符编码

23
GB码区位示例
01区
78位
24
GB码区位示例(续)
16 区 1 2 3 4 5 6 7 8 9 0 啊 阿 埃 挨 哎 唉 哀 皑 癌 1 蔼 矮 艾 碍 爱 隘 鞍 氨 安 俺 2 按 暗 岸 胺 案 肮 昂 盎 凹 敖 3 熬 翱 袄 傲 奥 懊 澳 芭 捌 扒 4 叭 吧 笆 八 疤 巴 拔 跋 靶 把 5 耙 坝 霸 罢 爸 白 柏 百 摆 佰 6 败 拜 稗 斑 班 搬 扳 般 颁 板 7 版 扮 拌 伴 瓣 半 办 绊 邦 帮 8 梆 榜 膀 绑 棒 磅 蚌 镑 傍 谤 9 苞 胞 包 褒 剥 17 区 1 2 3 4 5 6 7 8 9 0 薄 雹 保 堡 饱 宝 抱 报 暴 1 豹 鲍 爆 杯 碑 悲 卑 北 辈 背 2 贝 钡 倍 狈 备 惫 焙 被 奔 苯 3 本 笨 崩 绷 甭 泵 蹦 迸 逼 鼻 4 比 鄙 笔 彼 碧 蓖 蔽 毕 毙 毖 5 币 庇 痹 闭 敝 弊 必 辟 壁 臂 6 避 陛 鞭 边 编 贬 扁 便 变 卞 7 辨 辩 辫 遍 标 彪 膘 表 鳖 憋 8 别 瘪 彬 斌 濒 滨 宾 摈 兵 冰 9 柄 丙 秉 饼 炳
19
二、计算机中中文字符的表示 汉字交换码
国家标准将每个汉字和图形符号的两个字节分 别用两位的十进制编码(不足补0),前字节的编 码称为区码,后字节的编码称为位码,排列在一个 94行94列的二维代码表中,形成区位码表。 如“保”字在二维代码表中处于17区第03位 ,区位码即为1703D 。 把区位码按一定的规则转换成的二进制代码叫 做信息交换码(简称国标码)。
字 符 编 码
1
提
纲
一 计算机中字符的表示(ASCII码) 二 计算机中中文字符的表示
2
概 述
汉字编码

12
例
56 区 1 2 3 4 5 6 7 8 9 0 亍 丌 兀 丐 廿 卅 丕 亘 丞 1 鬲 孬 噩 丨 禺 丿 匕 乇 夭 爻 2 卮 氐 囟 胤 馗 毓 睾 鼗 丶 亟 3 鼐 乜 乩 亓 芈 孛 啬 嘏 仄 厍 4 厝 厣 厥 厮 靥 赝 匚 叵 匦 匮 5 匾 赜 卦 卣 刂 刈 刎 刭 刳 刿 6 剀 剌 剞 剡 剜 蒯 剽 劂 劁 劐 7 劓 冂 罔 亻 仃 仉 仂 仨 仡 仫 8 仞 伛 仳 伢 佤 仵 伥 伧 伉 伫 9 佞 佧 攸 佚 佝
汉字编码
15
BIG5码
针对繁体汉字的编码,在台湾、香港的 电脑系统中得到普遍应用
第一字节 A1~A2 非汉字 A3 C6 C7~C8 一级汉字 二级汉字 A4~C5 C6 C9~F8 81~A0 第二字节 40~7E/A1~FE 40~7E/A1~E0 A1~FE 40~7E/A1~FE 40~7E/A1~FE 40~7E 40~7E/A1~FE 40~7E/A1~D5
汉字编码
87 区 1 2 3 4 5 6 7 8 9 0 鳌 鳍 鳎 鳏 鳐 鳓 鳔 鳕 鳗 1 鳘 鳙 鳜 鳝 鳟 鳢 靼 鞅 鞑 鞒 2 鞔 鞯 鞫 鞣 鞲 鞴 骱 骰 骷 鹘 3 骶 骺 骼 髁 髀 髅 髂 髋 髌 髑 4 魅 魃 魇 魉 魈 魍 魑 飨 餍 餮 5 饕 饔 髟 髡 髦 髯 髫 髻 髭 髹 6 鬈 鬏 鬓 鬟 鬣 麽 麾 縻 麂 麇 7 麈 麋 麒 鏖 麝 麟 黛 黜 黝 黠 8 黟 黢 黩 黧 黥 黪 黯 鼢 鼬 鼯 9 鼹 鼷 鼽 鼾 齄
汉字编码
55 区 1 2 3 4 5 6 7 8 9 0 住 注 祝 驻 抓 爪 拽 专 砖 1 转 撰 赚 篆 桩 庄 装 妆 撞 壮 2 状 椎 锥 追 赘 坠 缀 谆 准 捉 3 拙 卓 桌 琢 茁 酌 啄 着 灼 浊 4 兹 咨 资 姿 滋 淄 孜 紫 仔 籽 5 滓 子 自 渍 字 鬃 棕 踪 宗 综 6 总 纵 邹 走 奏 揍 租 足 卒 族 7 祖 诅 阻 组 钻 纂 嘴 醉 最 罪 8 尊 遵 昨 左 佐 柞 做 作 坐 座 9
例
56 区 1 2 3 4 5 6 7 8 9 0 亍 丌 兀 丐 廿 卅 丕 亘 丞 1 鬲 孬 噩 丨 禺 丿 匕 乇 夭 爻 2 卮 氐 囟 胤 馗 毓 睾 鼗 丶 亟 3 鼐 乜 乩 亓 芈 孛 啬 嘏 仄 厍 4 厝 厣 厥 厮 靥 赝 匚 叵 匦 匮 5 匾 赜 卦 卣 刂 刈 刎 刭 刳 刿 6 剀 剌 剞 剡 剜 蒯 剽 劂 劁 劐 7 劓 冂 罔 亻 仃 仉 仂 仨 仡 仫 8 仞 伛 仳 伢 佤 仵 伥 伧 伉 伫 9 佞 佧 攸 佚 佝
汉字编码
15
BIG5码
针对繁体汉字的编码,在台湾、香港的 电脑系统中得到普遍应用
第一字节 A1~A2 非汉字 A3 C6 C7~C8 一级汉字 二级汉字 A4~C5 C6 C9~F8 81~A0 第二字节 40~7E/A1~FE 40~7E/A1~E0 A1~FE 40~7E/A1~FE 40~7E/A1~FE 40~7E 40~7E/A1~FE 40~7E/A1~D5
汉字编码
87 区 1 2 3 4 5 6 7 8 9 0 鳌 鳍 鳎 鳏 鳐 鳓 鳔 鳕 鳗 1 鳘 鳙 鳜 鳝 鳟 鳢 靼 鞅 鞑 鞒 2 鞔 鞯 鞫 鞣 鞲 鞴 骱 骰 骷 鹘 3 骶 骺 骼 髁 髀 髅 髂 髋 髌 髑 4 魅 魃 魇 魉 魈 魍 魑 飨 餍 餮 5 饕 饔 髟 髡 髦 髯 髫 髻 髭 髹 6 鬈 鬏 鬓 鬟 鬣 麽 麾 縻 麂 麇 7 麈 麋 麒 鏖 麝 麟 黛 黜 黝 黠 8 黟 黢 黩 黧 黥 黪 黯 鼢 鼬 鼯 9 鼹 鼷 鼽 鼾 齄
汉字编码
55 区 1 2 3 4 5 6 7 8 9 0 住 注 祝 驻 抓 爪 拽 专 砖 1 转 撰 赚 篆 桩 庄 装 妆 撞 壮 2 状 椎 锥 追 赘 坠 缀 谆 准 捉 3 拙 卓 桌 琢 茁 酌 啄 着 灼 浊 4 兹 咨 资 姿 滋 淄 孜 紫 仔 籽 5 滓 子 自 渍 字 鬃 棕 踪 宗 综 6 总 纵 邹 走 奏 揍 租 足 卒 族 7 祖 诅 阻 组 钻 纂 嘴 醉 最 罪 8 尊 遵 昨 左 佐 柞 做 作 坐 座 9
汉字编码基础

汉字编码基础
一.在汉字的录入方面,音码很够解决许多速度 要求不高的录入问题,并且取得了很好的效果, 但再好的音码很难解决重码问题.
如:当双拼输入法的词语编码不断增加时,重码现象便会越 来越严得,而且随着新词的不断推出,重码现象还会加得重. 对于录入速度要求高的速记,排版和专业工作人员,重码会 限制其录入速度.自然地,另外一条出路便是形码.
五笔字型的拆字原则
• 在分析汉字的字型结构时,是把各个基本字根组成汉字,而在录入时要把已 有的汉字拆分成若干个基本字根.即”组字”的逆过程-“拆字”。拆字 的原则可归结为这样几点: • 1.取在优先:在拆分时,本着”再加一笔,便不再是最大笔划字根’的原则, 每次均选择拆出最大的、笔划数最多的字根。如:天(GD)而不是 (FW). • 2.兼顾直观:拆字的目的是为方便地输入汉字,如果拆分出的字根有较 好的直观性,可能牺牲“书写顺序”和“取大优先”的原则。而形成 “例外处理”情况。 • 3.能连不交:单体结构能按“连”关系拆分时的,则不要按“交”关系 拆分。因为“连”更能显示码元笔晓的结构特征。如:天(GD)而不是 (FW,否则二者相交)。 • 4.能散不连:如果一个单体结构可以视为几个基本字根的“散”关系, 则汪要视为“连”关系。有时候,治字的几个字根之间的关系在“散” 和“连”之间,难于确定,遇到这种情况时,处理的原则“只要不是单 笔划,则均按散关系处理”。如:占,都不是单笔划,应视为上下关系) 严(GOD),(后两笔非单笔划,应视为上下关系)而不是拆为“一横” 加上“业”再加上“厂”。
汉字的三种字型
• • • • • • • • 以用字根组成汉字,根据字要有之间在汉字中所处的位置关系,可把成千 上万的汉字分为三种类型,即左右型、上下型、杂合型,分别赋予代号1、 2、3。 左右型:包括双合字和三合字。 双合字:两个部分分列左右,整个汉字中有着明显的界线,字根间有距 离。如:灶、明、现、但、咽等。 三合字:整个字的三个部分从左至右排弄,或者单独占据一边的部分与 另外两部分按左右型式排列。如:例、别、说等。 上下型:也也括双合字和三合字。 双合字:上下型双合字中,两个部的按上下排列,并有着明显的界线, 各部分间有距离。如:军、字、晋等。 三合字:三合字中,三个部分也按上下排列,或同层的部分上下排列。 如:意、想、花等。 杂合型:指汉字的各个字根交叠在一起,不能明显地分成上下或左右部 分。这类字中多为单体、内外、包围等字型。如:司、周、区、天、飞、 本等。