国标码 区位码等的区别

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

即GB国标码:中文内码之一,代表中文简化字,在中国大陆广泛使用,影响所及,使用量渐见普及。“国家标准信息交换用汉字编码”(GB2312-80标准),简称国标码。国标码是指1980年中国制定的用于不同的具有汉字处理功能的计算机系统间交换汉字信息时使用的编码。国际码是二字节码, 用两个七位二进制数编码表示一个汉字。目前国标码收入6763个汉字, 其中一级汉字(最常用)3755个, 二级汉字3008个, 另外还包括682个西文字符、图符。例如“巧”字的代码是39H 41H, 在机内形式如下: 0 1 1 1 0 0 1 1 第一字节0 0 0 0 0 1第二字节在计算机内部,汉字编码和西文编码是共存的,如何区分它们是个很重要的问题,因为对不同的信息有不同的处理方式。方法之一是对于二字节的国标码,将二个字节的最高位都置成“1”, 而ASCII码所用字节最高位保持“0”,然后由软件(或硬件)根据字节最高位来作出判断。字符代码化是指用户从键盘上输入代表某个汉字的编码。我们把采用不同的编码系统以代表汉字进行输入的方案(如数字码、拼音码和字形码),称为汉字的输入法,区位码、五笔字型码、拼音码、智能ABC、微软拼音输入法等都是其中的具体代表。汉字通过编码输入计算机后,在其后的处理过程中,不同阶段使用不同的代码,首先通过键盘管理程序将接收到的输入编码转换为0和1构成的机内码,实现计算机的存储、加工和传输处理。同样,存储在计算机内部的机内码也必须经转换后才能恢复汉字的“本来面目”。这种转换通常是由计算机的输入/输出设备来实现的, 有时还需要软件来参与这种转换过程。这个阶段的汉字代码称为字形码,用以显示和打印输出。

区位码:

1980年,为了使每一个汉字有一个全国统一的代码,我国颁布了第一个汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。

国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码。

汉字库分布情况如下:

一级汉字16-55区

二级汉字56-87区

三级汉字1-9区

空闲未用10-15区

通常,在DOS下的各汉字系统中,同时按Alt键和F1键即可调用区位码输入方法。而在Windows中常用Ctrl+空格键和Ctrl+Shift键调出区位码。如“2901”代表“健”字,“4582”代表“万”字,“8150”代表“楮”字,这些都是汉字,用区位码还可以很轻松地输入特殊符号,比如,“0189”代表“※”(符号),“0528”代表“ゼ”(日本语),“0711”代表“Й”(俄文),“0949”代表“┭”(制表符)。

在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列),在区位码汉字输入方法中,汉字编码无重码,在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常使用于录入特殊符号,如制表符、希腊字母等,这里简单介绍几个区。

部分国际区位编码

区号:01 【各类符号】

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

0100、。· ˉ ˇ ¨ 〃々- ~‖ … ' ' " " 〔〕

0120 〈〉《》「」『』〖〗【】± × ÷∶∧∨∑ ∏

0140 ∪∩ ∈∷√ ⊥∥∠⌒⊙∫ ∮≡ ≌≈ ∽∝≠ ≮≯

0160 ≤ ≥ ∞ ∵∴♂♀° ′ ″ ℃$¤¢£‰ § № ☆★

0180 ○ ● ◎◇◆□ ■ △▲ ※→ ← ↑ ↓ 〓

区号:02 【各类数字】

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

0200 ⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ⒈⒉⒊

0220 ⒋⒌⒍⒎⒏⒐⒑⒒⒓⒔⒕⒖⒗⒘⒙⒚⒛⑴⑵⑶

0240 ⑷⑸⑹⑺⑻⑼⑽⑾⑿⒀⒁⒂⒃⒄⒅⒆⒇①②③

0260 ④⑤⑥⑦⑧⑨⑩一二三四五六七八九十

0280 ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅪⅫ

区号:03 【符号、字母】

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

0300 !"#¥%&'()*+,-./0123

0320 456789:;<=>?@ABCDEFG

0340 HIJKLMNOPQRSTUVWXYZ[

0360 \]^_`abcdefghijklmno

0380 pqrstuvwxyz{|} ̄

区号:06 【罗马字母】

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

0600 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ

0620Υ Φ Χ Ψ Ω α β γ δ ε ζ η

0640θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω

0660 0680

区号:08 【汉语拼音】

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

0800 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ ò ū ú ǔ

0820 ù ǖ ǘ ǚ ǜ ü ê ㄅㄆㄇ

0840 ㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒㄓㄔㄕㄖㄗㄘㄙㄚㄛ

0860 ㄜㄝㄞㄟㄠㄡㄢㄣㄤㄥㄦㄧㄨㄩ

0880

区号:09 【制表字符】

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

0900 ─ ━│ ┃┄┅┆┈┉┉┊┋┌ ┍┎┏

0920 ┐ ┑┒┓└ ┕┖┗┘ ┙┚┛├ ┝┞┟┠┡┢┣

0940 ┤ ┥┦┧┨┩┪┫┬ ┭┮┯┰┱┲┳┴ ┵┶┷

0960 ┸┹┺┻┼ ┽┾┿╀╁┃╃╄╅╆╇╈╉╊╋

0980

以国家标准局1980年颁布的《信息交换用汉字编码字符集》基本集(代号为GB2312-80)规定的汉字交换码作为国家标准汉字编码。GB2312-80中共有7445个字符符号:汉字符号6763个,一级汉字3755个(按汉语拼音字母顺序排列),二级汉字3008个(按部首笔划顺序排列),非汉字符号682个。GB2312-80规定,所有的国标码汉字及符号组成一个94×94的方阵。在此方阵中,每一行称为一个“区”,每一列称为一个“位”。这个方阵实际上组成一个有94个区(编号由01到94),每个区有94个位(编号由01到94)的汉字字符集。一个汉字所在的区号和位号的组合就构成了该汉字的“区位码”。其中,高两位为区号,低两位为位号。这样区位码可以惟一地确定某一汉字或字符;反之,任何一个汉字或符号都对应一个惟一的区位码,没有重码。

相关文档
最新文档