常用字符编码表.

常用字符编码表

常用字符编码表 (1)

第一部分:序号编码、标点符号、通用字符 (2)

1.正数上标 (2)

2.负数上标 (3)

3.下标 (3)

4. E的负n次方 (3)

5.圆圈符号 (4)

6.上标#号 (4)

7.字母标号 (5)

8.罗马数字 (5)

9.通用字符 (6)

第二部分:数学符号 (7)

第三部分:物理符号 (8)

1.长度单位 (8)

2.面积单位 (8)

3.体积单位 (8)

4.重量单位 (9)

5.电学单位 (9)

6.压力单位 (9)

7.速度单位 (10)

8.其它单位 (10)

第四部分:化学符号 (11)

1.化学元素 (11)

2.分子 (12)

3.离子 (12)

第五部分：环保专用字符 (13)

第六部分电脑网络专业常用字符 (15)

第七部分： (15)

第八部分:缩写词语 (16)

第九部分:外语字母 (16)

1.大写字母 (16)

2.小写字母 (17)

3.其它字母 (18)

qda

lmb

hcj jk jk

fe mi

平方毫米立方毫米

kgm 声级单

mgm

nos

离根离根离

vo dw

第七部分：年

lln lyn len lsn lsn lwn lln lqn lbn ljn yln

) ) )

ascii码对照表完整版doc

**ASCII 码对照表完整版信息在计算机上是用二进制表示的，这种表示法让人理解就很困难。因此计算机上都配有输入和输出设备，这些设备的主要目的就是，以一种人类可阅读的形式将信息在这些设备上显示出来供人阅读理解。为保证人类和设备，设备和计算机之间能进行正确的信息交换，人们编制的统一的信息交换代码，这就是ASCII码表，它的全称是“美国信息交换标准代码”。

ASCII 在Web开发时，如下的ASCII码只要加上&#和;就可以变成Web可以辨认的字符了在处理特殊字符的时候特别有用，如：' 单引号在数据库查询的时候是杀手，但是如果转换成'（注意：转换后的机构有：&# +字符的ASCII码值+; 三个部分组成）再来存数据库，就没有什么影响了。其他的字符与ASCII码的对照如下表 ASCII表

键盘常用ASCII码ESC键 VK_ESCAPE (27) 回车键： VK_RETURN (13) TAB键： VK_TAB (9) Caps Lock键： VK_CAPITAL (20) Shift键： VK_SHIFT ($10)

Ctrl键： VK_CONTROL (17) Alt键： VK_MENU (18) 空格键： VK_SPACE ($20/32) 退格键： VK_BACK (8) 左徽标键： VK_LWIN (91) 右徽标键： VK_LWIN (92) 鼠标右键快捷键：VK_APPS (93) Insert键： VK_INSERT (45) Home键： VK_HOME (36) Page Up： VK_PRIOR (33) PageDown： VK_NEXT (34) End键： VK_END (35) Delete键： VK_DELETE (46) 方向键(←)： VK_LEFT (37) 方向键(↑)： VK_UP (38) 方向键(→)： VK_RIGHT (39) 方向键(↓)： VK_DOWN (40) F1键： VK_F1 (112) F2键： VK_F2 (113) F3键： VK_F3 (114) F4键： VK_F4 (115) F5键： VK_F5 (116) F6键： VK_F6 (117) F7键： VK_F7 (118) F8键： VK_F8 (119) F9键： VK_F9 (120) F10键： VK_F10 (121) F11键： VK_F11 (122) F12键： VK_F12 (123) Num Lock键： VK_NUMLOCK (144) 小键盘0： VK_NUMPAD0 (96) 小键盘1： VK_NUMPAD0 (97) 小键盘2： VK_NUMPAD0 (98) 小键盘3： VK_NUMPAD0 (99) 小键盘4： VK_NUMPAD0 (100) 小键盘5： VK_NUMPAD0 (101) 小键盘6： VK_NUMPAD0 (102) 小键盘7： VK_NUMPAD0 (103) 小键盘8： VK_NUMPAD0 (104) 小键盘9： VK_NUMPAD0 (105) 小键盘.： VK_DECIMAL (110)

常用字符集编码详解：ASCII 、GB2312、GBK、GB18030、...

ASCII ASCII码是7位编码，编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。只支持ASCII码的系统会忽略每个字节的最高位，只认为低7位是有效位。HZ字符编码就是早期为了在只支持7位ASCII系统中传输中文而设计的编码。早期很多邮件系统也只支持ASCII编码，为了传输中文邮件必须使用BASE64或者其他编码方式。 GB2312 GB2312是基于区位码设计的，区位码把编码表分为94个区，每个区对应94个位，每个字符的区号和位号组合起来就是该汉字的区位码。区位码一般用10进制数来表示，如1601就表示16区1位，对应的字符是“啊”。在区位码的区号和位号上分别加上0xA0就得到了GB2312编码。区位码中01-09区是符号、数字区，16-87区是汉字区，10-15和88-94是未定义的空白区。它将收录的汉字分成两级：第一级是常用汉字计3755个，置于16-55区，按汉语拼音字母/笔形顺序排列；第二级汉字是次常用汉字计3008个，置于56-87区，按部首/笔画顺序排列。一级汉字是按照拼音排序的，这个就可以得到某个拼音在一级汉字区位中的范围，很多根据汉字可以得到拼音的程序就是根据这个原理编写的。 GB2312字符集中除常用简体汉字字符外还包括希腊字母、日文平假名及片假名字母、俄语西里尔字母等字符，未收录繁体中文汉字和一些生僻字。可以用繁体汉字测试某些系统是不是只支持GB2312编码。 GB2312的编码范围是0xA1A1-0x7E7E，去掉未定义的区域之后可以理解为实际编码范围是0xA1A1-0xF7FE。 EUC-CN可以理解为GB2312的别名，和GB2312完全相同。区位码更应该认为是字符集的定义，定义了所收录的字符和字符位置，而GB2312及EUC-CN是实际计算机环境中支持这种字符集的编码。HZ和ISO- 2022-CN是对应区位码字符集的另外两种编码，都是用7位编码空间来支持汉字。区位码和GB2312编码的关系有点像Unicode和UTF-8。 GBK GBK编码是GB2312编码的超集，向下完全兼容GB2312，同时GBK收录了Unicode基本多文种平面中的所有CJK汉字。同GB2312一样，GBK也支持希腊字母、日文假名字母、俄语字母等字符，但不支持韩语中的表音字符（非汉字字符）。GBK还收录了GB2312不包含的汉字部首符号、竖排标点符号等字符。 GBK的整体编码范围是为0x8140-0xFEFE，不包括低字节是0×7F的组合。高字节范围是0×81-0xFE，低字节范围是0x40-7E和0x80-0xFE。

Unicode汉字编码表

Unicode汉字编码表 1 unicode编码表 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97, 对于汉字的编码,事实上Unicode 对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用4个字节来编码字符,不过现在普遍采用的还是UCS-2，只用两个字节来编码,看一下Unicode对汉字的编码: ------------------------------------------------------------------------ 2 汉字编码表 U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F ----------------------------------------------------- 4e00 一丁丂七丄丅丆万丈三上下丌不与丏 4e10 丐丑丒专且丕世丗丘丙业丛东丝丞丟 4e20 丠両丢丣两严並丧丨丩个丫丬中丮丯

全国计算机一级考试汉字编码选择题复习

汉字编码选择题复习 1、一个汉字的内码长度为2个字节，其每个字节的最高二进制位的值依次分别是________。 A)0,0 B)0,1 C)1,0 D)1,1 【解析】国标码是汉字信息交换的标准编码，但因其前后字节的最高位为0，与ASCII码发生冲突，于是，汉字的机内码采用变形国标码，其变换方法为：将国标码的每个字节都加上128，即将两个字节的最高位由0改1，其余7位不变，因此机内码前后字节最高位都为1。 2、、一个汉字的16×16点阵字形码长度的字节数是________。 A)16 B)24 C)32 D)40 【解析】每个点阵用一个0或1代替，需要16*16个0或1，因为8位为一字节，换算成字节就是16*16/8. 3、根据汉字国标GB2312－80的规定，一个汉字的内码码长为________。 A)8bit B)12bit C)16bit D)24bit 【解析】一个汉字是两个字节，一字节是8bit，所以就是16bit。 4、下列4个4位十进制数中，属于正确的汉字区位码的是________。 A)5601 B)9596 C)9678 D)8799 【解析】区位码：94×94阵列，区号范围：1～94，位号范围：1～94。 5、存储1024个24×24点阵的汉字字形码需要的字节数是________。 A)720B B)72KB C)7000B D)7200B 【解析】在24×24的网格中描绘一个汉字，整个网格分为24行24列，每个小格用1位二进制编码表示，每一行需要24个二进制位，占3个字节，24行共占24×3＝72个字节。1024个需要1024×72＝73728字节。 6、在计算机中，对汉字进行传输、处理和存储时使用汉字的________。 A)字形码 B)国标码 C)输入码D)机内码【解析】显示或打印汉字时使用汉字的字形码，在计算机内部时使用汉字的机内码。 7、区位码输入法的最大优点是________。 A)只用数码输入，方法简单、容易记忆 B)易记易用 C)一字一码，无重码 D)编码有规律，不易忘记【解析】区位码输入是利用国标码作为汉字编码，每个国标码对应一个汉字或一个符号，没有重码。 8、下列关于汉字编码的叙述中，错误的是________。 A)BIG5码是通行于香港和台湾地区的繁体汉字编码 B)一个汉字的区位码就是它的国标码

ASCII码对照表 -

ASCII码对照表 ASCII码对照表 ASCII, American Standard Code for Information Interchange 念起来像是 "阿斯key"，定义从 0 到 127 的一百二十八个数字所代表的英文字母或一样的结果与意义。由于只使用7个位元(bit)就可以表示从0到127的数字，大部分的电脑都使用8个位元来存取字元集(character set)，所以从128到255之间的数字可以用来代表另一组一百二十八个符号，称为 extended ASCII。 ASCII码键盘ASCII 码键盘ASCII码键盘ASCII 码键盘 27ESC32SPACE33!34" 35#36$37%38& 39'40(41)42* 43+44'45-46. 47/480491502 513524535546 55756857958: 59;60<61=62> 63?64@65A66B 67C68D69E70F 71G72H73I74J 75K76L77M78N 79O80P81Q82R 83S84T85U86V 87W88X89Y90Z 91[92\93]94^ 95_96`97a98b 99c100d101e102f 103g104h105i106j 107k108l109m110n 111o112p113q114r 115s116t117u118v 119w120x121y122z 123{124|125}126~ 目前计算机中用得最广泛的字符集及其编码，是由美国国家标准局(ANSI)制定的ASCII码（American Standard Code for Information Interchange，美国标准信息交换码），它已被国际标准化组织（ISO）定为国际标准，称为ISO 646标准。适用于所有拉丁文字字母，ASCII码有7位码和8位码两种形式。因为1位二进制数可以表示（21=）2种状态：0、1；而2位二进制数可以表示（22）=4种状态：00、01、10、11；依次类推，7位二进制数可以表示（27=）128种状态，每种状态都唯一地编为一个7位的二进制码，对应一个字符（或控制码），这些码可以排列成一个十进制序号0～127。所以，7位ASCII码是用七位二进制数进行编码的，可以表示128个字符。

Unicode汉字编码表

Unicode汉字编码表 1 Unicode编码表 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97, 对于汉字的编码,事实上Unicode对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用 4个字节来编码字符,不过现在普遍采用的还是UCS-2，只用两个字节来编码,看一下Unicode对汉字的编码:

------------------------------------------------------------------------ 2 汉字编码表 U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F ----------------------------------------------------- 4e00 一丁丂七丄丅丆万丈三上下丌不与丏 4e10 丐丑丒专且丕世丗丘丙业丛东丝丞丟 4e20 丠両丢丣两严並丧丨丩个丫丬中丮丯 4e30 丰丱串丳临丵丶丷丸丹为主丼丽举丿 4e40 乀乁乂乃乄久乆乇么义乊之乌乍乎乏 4e50 乐乑乒乓乔乕乖乗乘乙乚乛乜九乞也 4e60 习乡乢乣乤乥书乧乨乩乪乫乬乭乮乯 4e70 买乱乲乳乴乵乶乷乸乹乺乻乼乽乾乿 4e80 亀亁亂亃亄亅了亇予争亊事二亍于亏 4e90 亐云互亓五井亖亗亘亙亚些亜亝亞亟 4ea0 亠亡亢亣交亥亦产亨亩亪享京亭亮亯 4eb0 亰亱亲亳亴亵亶亷亸亹人亻亼亽亾亿 4ec0 什仁仂仃仄仅仆仇仈仉今介仌仍从仏 4ed0 仐仑仒仓仔仕他仗付仙仚仛仜仝仞仟 4ee0 仠仡仢代令以仦仧仨仩仪仫们仭仮仯 4ef0 仰仱仲仳仴仵件价仸仹仺任仼份仾仿 4f00 伀企伂伃伄伅伆伇伈伉伊伋伌伍伎伏 4f10 伐休伒伓伔伕伖众优伙会伛伜伝伞伟 4f20 传伡伢伣伤伥伦伧伨伩伪伫伬伭伮伯

ASCII码对照表完整版

A S C I I码对照表完整版 Revised final draft November 26, 2020

好用的A S C I I码对照表完整版信息在计算机上是用二进制表示的，这种表示法让人理解就很困难。因此计算机上都配有输入和输出设备，这些设备的主要目的就是，以一种人类可阅读的形式将信息在这些设备上显示出来供人阅读理解。为保证人类和设备，设备和计算机之间能进行正确的信息交换，人们编制的统一的信息交换代码，这就是ASCII码表，

在Web开发时，如下的ASCII码只要加上&#和;就可以变成Web可以辨认的字符了在处理特殊字符的时候特别有用，如：'单引号在数据库查询的时候是杀手，但是如果转换成'（注意：转换后的机构有：&#+字符的ASCII码值+;三个部分组成）再来存数据库，就没有什么影响了。其他的字符与ASCII码的对照如下表 ASCII表

键盘常用ASCII码 ESC键VK_ESCAPE(27)回车键：VK_RETURN(13)TAB键：VK_TAB(9)CapsLock键： VK_CAPITAL(20)Shift键：VK_SHIFT($10)Ctrl键：VK_CONTROL(17)Alt键： VK_MENU(18)空格键：VK_SPACE($20/32)退格键：VK_BACK(8)左徽标键：VK_LWIN(91)右徽标键：VK_LWIN(92)鼠标右键快捷键：VK_APPS(93) Insert键：VK_INSERT(45)Home键：VK_HOME(36)PageUp：VK_PRIOR(33)PageDown：VK_NEXT(34)End键：VK_END(35)Delete键：VK_DELETE(46) 方向键(←)：VK_LEFT(37)方向键(↑)：VK_UP(38)方向键(→)：VK_RIGHT(39)方向键(↓)：VK_DOWN(40) F1键：VK_F1(112)F2键：VK_F2(113)F3键：VK_F3(114)F4键：VK_F4(115)F5键：

最全ASCII码对照表

最全ASCII码对照表 Bin Dec Hex 缩写/字符解释 0000 0000 0 00 NUL (null) 空字符0000 0001 1 01 SOH (start of handing) 标题开始0000 0010 2 02 STX (start of text) 正文开始0000 0011 3 03 ETX (end of text) 正文结束0000 0100 4 04 EOT (end of transmission) 传输结束0000 0101 5 05 ENQ (enquiry) 请求 0000 0110 6 06 ACK (acknowledge) 收到通知0000 0111 7 07 BEL (bell) 响铃 0000 1000 8 08 BS (backspace) 退格 0000 1001 9 09 HT (horizontal tab) 水平制表符0000 1010 10 0A LF (NL line feed, new line) 换行键 0000 1011 11 0B VT (vertical tab) 垂直制表符0000 1100 12 0C FF (NP form feed, new page) 换页键 0000 1101 13 0D CR (carriage return) 回车键0000 1110 14 0E SO (shift out) 不用切换0000 1111 15 0F SI (shift in) 启用切换0001 0000 16 10 DLE (data link escape) 数据链路转义0001 0001 17 11 DC1 (device control 1) 设备控制1 0001 0010 18 12 DC2 (device control 2) 设备控制2 0001 0011 19 13 DC3 (device control 3) 设备控制3 0001 0100 20 14 DC4 (device control 4) 设备控制4 0001 0101 21 15 NAK (negative acknowledge) 拒绝接收0001 0110 22 16 SYN (synchronous idle) 同步空闲0001 0111 23 17 ETB (end of trans. block) 传输块结束0001 1000 24 18 CAN (cancel) 取消 0001 1001 25 19 EM (end of medium) 介质中断0001 1010 26 1A SUB (substitute) 替补 0001 1011 27 1B ESC (escape) 溢出 0001 1100 28 1C FS (file separator) 文件分割符0001 1101 29 1D GS (group separator) 分组符0001 1110 30 1E RS (record separator) 记录分离符0001 1111 31 1F US (unit separator) 单元分隔符 0010 0000 32 20 空格 0010 0001 33 21 ! 0010 0010 34 22 " 0010 0011 35 23 # 0010 0100 36 24 $ 0010 0101 37 25 % 0010 0110 38 26 & 0010 0111 39 27 "

Unicode字符编码分布表――标点符号类

Unicode 5.1字符编码分布表——标点符号类标点符号数学符号专用符号通用标点符号数字和数字符号综合符号控制符集合： C0（U+00–U+001F，U+007F）、C1（U+0080–U+009F）ASCII标点符号（U+0020 –U+002F，U+003A– U+0040，U+005B–（相关查阅：专用文字） U+0060，U+007B– U+007E）xx盲文（U+2800 排版控制符（U+2000–U+206F）–U+28FF）拉丁文第一增补集标点符装饰符号（U+2700 - 号（U+00A0–ASCII数字（U+0030–U+0039）不可见操作符（U+2061–U+2064）U+27BF） U+00BF）通用标点符号（U+2000全角ASCII数字（U+FF11– –U+206F）U+FF19）增补标点符号（U+2E00数字形式符号（U+2150– –U+2E7F）U+218F）综合符号（U+2600– 专用符号（U+FFF0–U+FF）U+26FF）

综合符号和箭头（U+2B00– U+2BFF）《xx经》符号（U+1D300– U+1D35F）语言标签（U+E00–U+E007F）中日韩标点符号上标和下标符号（U+2070– U+209F）变体选择符（U+FE00–U+FE0F）中日韩标点符号类字母符号（U+3000–U+303F）《易经》两仪四象（U+268A– U+268F）增补变体选择符（U+E0100–U+E01EF）【译注】《xx》八卦（U+2630– U+2637）《xx》六十四卦象（U+4DC0– U+4DFF）全角ASCII标点符号（U+FF01–U+FF0F，

(国内标准)国标(GB)汉字编码对照表

汉字编码简明对照表说明： 1、下列汉字取自国标(GB 2312-80)中的分级与排列内容；包含所有的第一级汉字和第二级汉字中的常用部分。 2、第一级汉字（16—55区的汉字）以拼音字母为序进行排列，同音字以笔形顺序横、竖、撇、捺、折为序，起笔相同的按第二笔，依次类推；第二级汉字（56-87区的汉字）按部首为序进行排列。 3、对于多音字，仅在表中出现一次。如：柏，音(bai，bo)，表中仅出现在“bai”中。 4、汉字区位码用阿拉伯数字表示，每个汉字对应4个数字。 5、本汉字代码表摘自《字符集和信息编码国家标准汇编》，(中国标准出版社，1998年编)。ａ啊 1601 阿 1602 吖 6325 嗄 6436 腌 7571 锕 7925 ａｉ埃 1603 挨 1604 哎 1605 唉 1606 哀 1607 皑 1608 癌 1609 蔼 1610 矮 1611 艾 1612 碍 1613 爱 1614 隘 1615 捱 6263 嗳 6440 嗌 6441 嫒 7040 瑷 7208 暧 7451 砹 7733 锿 7945 霭 8616 ａｎ鞍 1616 氨 1617 安 1618 俺 1619 按 1620 暗 1621 岸 1622 胺 1623 案 1624 谙 5847 埯 5991 揞 6278 犴 6577 庵 6654 桉 7281 铵 7907 鹌 8038 黯 8786 ａｎｇ肮 1625 昂 1626 盎 1627 ａｏ

凹 1628 敖 1629 熬 1630 翱 1631 袄 1632 傲 1633 奥 1634 懊 1635 澳 1636 坳 5974 拗 6254 嗷 6427 岙 6514 廒 6658 遨 6959 媪 7033 骜 7081 獒 7365 聱 8190 螯 8292 鏊 8643 鳌 8701 鏖 8773 ｂａ芭 1637 捌 1638 扒 1639 叭 1640 吧 1641 笆 1642 八 1643 疤 1644 巴 1645 拔 1646 跋 1647 靶 1648 把 1649 耙 1650 坝 1651 霸 1652 罢 1653 爸 1654 茇 6056 菝 6135 岜 6517 灞 6917 钯 7857 粑 8446 鲅 8649 魃 8741 ｂａｉ白 1655 柏 1656 百 1657 摆 1658 佰 1659 败 1660 拜 1661 稗 1662 捭 6267 呗 6334 掰 7494 ｂａｎ斑 1663 班 1664 搬 1665 扳 1666 般 1667 颁 1668 板 1669 版 1670 扮 1671 拌 1672 伴 1673 瓣 1674 半 1675 办 1676 绊 1677 阪 5870 坂 5964 钣 7851 瘢 8103 癍 8113 舨 8418 ｂａｎｇ邦 1678 帮 1679 梆 1680 榜 1681 膀 1682 绑 1683 棒 1684 磅 1685 蚌 1686 镑 1687 傍 1688 谤 1689 蒡 6182 浜 6826 ｂａｏ苞 1690 胞 1691 包 1692 褒 1693 剥 1694 薄 1701 雹 1702 保 1703 堡 1704 饱 1705 宝 1706 抱 1707 报 1708 暴 1709 豹 1710 鲍 1711 爆 1712 葆 6165 孢 7063 煲 7650 鸨 8017 褓 8157 趵 8532 龅 8621 ｂｅｉ杯 1713 碑 1714 悲 1715 卑 1716 北 1717 辈 1718 背 1719 贝 1720 钡 1721 倍 1722 狈 1723 备 1724 惫 1725 焙 1726 被 1727 孛 5635 陂 5873 邶 5893 蓓 6177 悖 6703 碚 7753 鹎 8039 褙 8156 鐾 8645 鞴 8725 ｂｅｎ奔 1728 苯 1729 本 1730 笨 1731 畚 5946 坌 5948 贲 7458 锛 7928 ｂｅｎｇ崩 1732 绷 1733 甭 1734 泵 1735 蹦 1736 迸 1737 嘣 6452 甏 7420 ｂｉ

ASCII码对照表

适用于下列Microsoft Office 程序的2003 版本：Access 2003、 Excel 2003、FrontPage? 2003、InfoPath? 2003、OneNote? 2003、 Outlook? 2003、PowerPoint? 2003、Project 2003、Publisher 2003、 Visio? 2003 和Word 2003 下列Microsoft Office 程序的2002 版本：Access 2002、 Excel 2002、FrontPage? 2002、Outlook? 2002、PowerPoint? 2002、 Project 2002、Publisher 2002、Visio? 2002 和Word 2002 数字代表计算机的语言。您的计算机如何使用字母来与程序和其他计算机进行通信？一种方法是把字符集（字符集：一组共享一些关系的字母、数字和其他字符。例如，标准ASCII 字符集包括字母、数字、符号和组成ASCII 代码方案的控制代码。）转换为数字形式。在20 世纪60 年代，标准化的需要带来了美国标准信息交换码(ASCII)（ASCII：将英语中的字符表示为数字的代码。为每个字符分配一个介于0 到127 之间的数字。大多数计算机都使用ASCII 表示文本和在计算机之间传输数据。）（发音为ask-kee）。ASCII 表包含128 个数字，分配给了相应的字符（字符：字母、数字、标点或符号。）。ASCII 为计算机提供了一种存储数据和与其他计算机及程序交换数据的方式。 ASCII 格式的文本不包含像黑体、斜体或字体等格式信息。当您使用Microsoft 记事本或把文件作为纯文本保存在Microsoft Office Word 中时，就会使用ASCII。您可能读到过招聘广告，公司要求提供ASCII 格式的简历。这意味着无论您是用电子邮件、传真或打印文本发送简历，公司希望您的简历中不含任何特殊格式。大公司可能用光学字符识别(OCR)（OCR：将文本图像（如扫描的文档）转换为实际的文本字符。也称为文本识别。）扫描软件来扫描简历和ASCII 格式的文本。在文档中插入ASCII 字符注释该功能需要Excel、FrontPage、InfoPath、OneNote、Outlook、PowerPoint、Project、Publisher、Word 或V isio。除了在键盘上键入字符外，您也可以使用该符号的字符代码作为键盘快捷键。例如，要插入度数符号，在按住ALT 的同时在数字键盘上键入0176。要从下面的图表中插入ASCII 字符，在按住ALT 的同时键入等价的十进制数字。例如，要插入度数符号，在按住ALT 的同时在数字键盘上键入0176。注释必须使用数字键盘来键入数字，而不是键盘。如果您的键盘需要打开Num Lock 键才能在数字键盘上键入数字，请务必打开它。 ASCII 打印字符数字32–126 分配给了能在键盘上找到的字符，当您查看或打印文档时就会出现。数字127 代表DELETE 命令。 ASCII 打印字符表十进制字符十进制字符 32space80P 33!81Q 34"82R 35#83S 36$84T

字符编码之间的相互转换 UTF8与GBK

字符编码之间的相互转换UTF8与GBK C++ UTF8编码转换CChineseCode 一预备知识 1，字符：字符是抽象的最小文本单位。它没有固定的形状（可能是一个字形），而且没有值。“A”是一个字符，“€”（德国、法国和许多其他欧洲国家通用货币的标志）也是一个字符。“中”“国”这是两个汉字字符。字符仅仅代表一个符号，没有任何实际值的意义。 2，字符集：字符集是字符的集合。例如，汉字字符是中国人最先发明的字符，在中文、日文、韩文和越南文的书写中使用。这也说明了字符和字符集之间的关系，字符组成字符集（iso8859-1，GB2312/GBK，unicode）。 3，代码点：字符集中的每个字符都被分配到一个“代码点”。每个代码点都有一个特定的唯一数值，称为标值。该标量值通常用十六进制表示。 4，代码单元：在每种编码形式中，代码点被映射到一个或多个代码单元。“代码单元”是各个编码方式中的单个单元。代码单元的大小等效于特定编码方式的位数：UTF-8 ：UTF-8 中的代码单元由8 位组成；在UTF-8 中，因为代码单元较小的缘故，每个代码点常常被映射到多个代码单元。代码点将被映射到一个、两个、三个或四个代码单元；UTF-16 ：UTF-16 中的代码单元由16 位组成；UTF-16 的代码单元大小是8 位代码单元的两倍。所以，标量值小于U+10000 的代码点被编码到单个代码单元中；UTF-32：UTF-32 中的代码单元由32 位组成；UTF-32 中使用的32 位代码单元足够大，每个代码点都可编码为单个代码单元；GB18030：GB18030 中的代码单元由8 位组成；在GB18030 中，因为代码单元较小的缘故，每个代码点常常被映射到多个代码单元。代码点将被映射到一个、两个或四个代码单元。 5，举例：“中国北京香蕉是个大笨蛋”这是我定义的aka字符集；各字符对应代码点为：北00000001 京00000010 香10000001 蕉10000010 是10000100 个10001000 大10010000 笨10100000 蛋11000000 中00000100 国00001000 下面是我定义的zixia 编码方案（8位），可以看到它的编码中表示了aka字符集的所有字符对应的代码单元；北10000001 京10000010 香00000001 蕉00000010 是00000100 个00001000 大00010000 笨00100000 蛋01000000 中10000100 国10001000 所谓文本文件就是我们按一定编码方式将二进制数据表示为对应的文本如00000001000000100000010000001000000100000010000001000000这样的文件。我用一个支持zixia编码和aka字符集的记事本打开，它就按照编码方案显示为“香蕉是个大笨蛋” 如果我把这些字符按照GBK 另存一个文件，那么则肯定不是这个，而是1100111111100011 1011110110110110 1100101011000111 1011100011110110 1011010011110011 1011000110111111 1011010110110000 110100001010 二，字符集

中文字符集、编码

前言
由于工作的需要，参考了好多资料整理出来一份计算机汉字处理报告，不敢独享，希望与大家共享。Ziggler 现代计算机技术虽然先进，但大多数人只知录入 GB-2313 字符集内的 6763 个简体汉字，对包含 21003 个简繁体汉字的 GBK 字符集的文字录入、字体显示就已不甚了解（市面上绝大多数所谓的繁体字体，其实采用的是 GB2313 字符集简体字的编码，用字体显示为繁体字，而不是直接用 GBK 字符集中繁体字的编码，错误百出）。而汉字总数至少有近 10 万个，目前计算机能处理的，也有 70244 个，已非一般人所能知能用了。由于汉字总数非常庞大。汉字总共有多少字？到目前为止，恐怕没人能够答得上来精确的数字。据估计，汉字数量达到 11 万左右。这里所说的七万多汉字，是指 UNICODE 超大字集全部七万多中日韩汉字。（注： Unicode 是指用两个字节表示每个字符的字符编码方案。）那一般计算机能够显示多少个汉字呢？比如大陆这边普遍安装简体 Windows 系统，而简体 windows 以宋体为系统字型，宋体支持 GBK 编码，所以能显示 20902 个汉字。要显示 71564 个汉字，可以采取多种方案，如：宋体-方正超大字符集+新细明体 EXTB、宋体-方正超大字符集+中易宋体 EXTB、宋体 GB18030+新细明体 ExtB、宋体 18030+宋体 ExtB 等等。
中文字符集、编码
字符是各种文字和符号的总称，包括各国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合，字符集种类较多，每个字符集包含的字符个数不同。计算机要准确的处理各种字符集文字，需要进行字符编码，以便计算机能够识别和存储各种文字。中文文字数目大，而且还分为简体中文和繁体中文两种不同书写规则的文字，而计算机最初是按英语单字节字符设计的，因此，对中文字符进行编码，是中文信息交流的技术基础。以下是常见的一些字符集介绍，部分字符集中包括编码介绍。
GB2312 字符集
1．名称的由来 GB2312 又称为 GB2312-80 字符集，全称为《信息交换用汉字编码字符集·基本集》，由原中国国家标准总局发布，1981 年 5 月 1 日实施。 2．特点 GB2312 是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖 99.75%的使用频率，

Unicode字符列表

Unicode字符列表（超完整）Unicode, 字符, 列表代码显示描述 U+0020 空格 U+0021 ! 叹号 U+0022 " 双引号 U+0023 # 井号 U+0024 $ 价钱／货币符号 U+0025 % 百分比符号 U+0026 & 英文“and”的简写符号U+0027 ' 引号 U+0028 ( 开圆括号 U+0029 ) 关圆括号 U+002A * 星号 U+002B + 加号 U+002C , 逗号 U+002D - 连字号／减号 U+002E . 句号 U+002F / 由右上至左下的斜线 U+0030 0 数字 0 U+0031 1 数字 1 U+0032 2 数字 2 U+0033 3 数字 3 U+0034 4 数字 4 U+0035 5 数字 5 U+0036 6 数字 6 U+0037 7 数字 7 U+0038 8 数字 8 U+0039 9 数字 9 U+003A : 冒号 U+003B ; 分号 U+003C < 小于符号 U+003D = 等于号 U+003E > 大于符号 U+003F ? 问号 U+0040 @ 英文“at”的简写符号U+0041 A 拉丁字母 A U+0042 B 拉丁字母 B U+0043 C 拉丁字母 C U+0044 D 拉丁字母 D U+0045 E 拉丁字母 E U+0046 F 拉丁字母 F U+0047 G 拉丁字母 G

U+0049 I 拉丁字母 I U+004A J 拉丁字母 J U+004B K 拉丁字母 K U+004C L 拉丁字母 L U+004D M 拉丁字母 M U+004E N 拉丁字母 N U+004F O 拉丁字母 O U+0050 P 拉丁字母 P U+0051 Q 拉丁字母 Q U+0052 R 拉丁字母 R U+0053 S 拉丁字母 S U+0054 T 拉丁字母 T U+0055 U 拉丁字母 U U+0056 V 拉丁字母 V U+0057 W 拉丁字母 W U+0058 X 拉丁字母 X U+0059 Y 拉丁字母 Y U+005A Z 拉丁字母 Z U+005B [ 开方括号 U+005C \ 由左上至右下的斜线 U+005D ] 关方括号 U+005E ^ 抑扬（重音）符号 U+005F _ 底线 U+0060 ` 重音符 U+0061 a 拉丁字母 a U+0062 b 拉丁字母 b U+0063 c 拉丁字母 c U+0064 d 拉丁字母 d U+0065 e 拉丁字母 e U+0066 f 拉丁字母 f U+0067 g 拉丁字母 g U+0068 h 拉丁字母 h U+0069 i 拉丁字母 i U+006A j 拉丁字母 j U+006B k 拉丁字母 k U+006C l 拉丁字母 l（L的小写）U+006D m 拉丁字母 m U+006E n 拉丁字母 n U+006F o 拉丁字母 o U+0070 p 拉丁字母 p U+0071 q 拉丁字母 q U+0072 r 拉丁字母 r U+0073 s 拉丁字母 s

编码问题

字符编码问题编码方式：一．iso8859-1(latin1) a)一个字节一个字符英文字母二．gb2312 - gbk a)2个字节一个字符 gbk原生的兼容iso8859-1 三．Utf-8 - unicode字符集 3个字节一个字符兼容iso8859-1，不兼容其他码表四．乱码：编码和解码用的码表不一样，也就是编码解码方式不一样 1.基础知识计算机中储存的信息都是用二进制数表示的；而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。通俗的说，按照何种规则将字符存储在计算机中，如'a'用什么表示，称为"编码"；反之，将存储在计算机中的二进制数解析显示出来，称为"解码"，如同密码学中的加密和解密。在解码过程中，如果使用了错误的解码规则，则导致'a'解析成'b'或者乱码。字符集（Charset）：是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称，包括各国家文字、标点符号、图形符号、数字等。字符编码（Character Encoding）：是一套法则，使用该法则能够对自然语言的字符的一个集合（如字母表或音节表），与其他东西的一个集合（如号码或电脉冲）进行配对。即在符号集合与数字系统之间建立对应关系，它是信息处理的一项基本技术。通常人们用符号集合（一般情况下就是文字）来表达信息。而以计算机为基础的信息处理系统则是利用元件（硬件）不同状态的组合来存储和处理信息的。元件不同状态的组合能代表数字系

统的数字，因此字符编码就是将符号转换为计算机可以接受的数字系统的数，称为数字代码。 2.常用字符集和字符编码常见字符集名称：ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字，需要进行字符编码，以便计算机能够识别和存储各种文字。 2.1. ASCII字符集&编码 ASCII（A merican S tandard C ode for I nformation I nterchange，美国信息交换标准代码）是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语，而其扩展版本EASCII 则可以勉强显示其他西欧语言。它是现今最通用的单字节编码系统（但是有被Unicode追上的迹象），并等同于国际标准ISO/IEC 646。 ASCII字符集：主要包括控制字符（回车键、退格、换行键等）；可显示字符（英文大小写字符、阿拉伯数字和西文符号）。 ASCII编码：将ASCII字符集转换为计算机可以接受的数字系统的数的规则。使用7位（bits）表示一个字符，共128字符；但是7位编码的字符集只能支持128个字符，为了表示更多的欧洲常用字符对ASCII进行了扩展，ASCII扩展字符集使用8位（bits）表示一个字符，共256字符。ASCII字符集映射到数字编码规则如下图所示：图1 ASCII编码表图2 扩展ASCII编码表 ASCII的最大缺点是只能显示26个基本拉丁字母、阿拉伯数目字和英式标点符号，因此只能用于显示现代美国英语（而且在处理英语当中的外来词如na?ve、café、élite等等时，所有重音符号都不得不去掉，即使这样做会违反拼写规则）。而EASCII虽然解决了部份西

ASCII 表(字符与编码对照表)

ASCII 表（字符与编码对照表） Decimal Octal Hex Character Description 1 1 01 SOH start of header 3 3 03 ETX end of text 5 5 05 ENQ enquiry 7 7 07 BEL bell 9 11 09 HT horizontal tab 11 13 0B VT vertical tab 13 15 0D CR carriage return 15 17 0F SI shift in 17 21 11 DC1 no assignment, but usually XON 19 23 13 DC3 no assignment, but usually XOFF 21 25 15 NAK negative acknowledge 23 27 17 ETB end of transmission block 25 31 19 EM end of medium 27 33 1B ESC escape 29 35 1D GS group seperator 31 37 1F US unit seperator 33 41 21 !

35 43 23 # 37 45 25 % 39 47 27 ' 41 51 29 ) 43 53 2B + 45 55 2D - 47 57 2F / 49 61 31 1 51 63 33 3 53 65 35 5 55 67 37 7 57 71 39 9 59 73 3B ; 61 75 3D = 63 77 3F ? 65 101 41 A 67 103 43 C 69 105 45 E 71 107 47 G