信息技术 通用编码字符集(基本多文种平面) 汉字24点阵字型 第2

信息技术 通用编码字符集(基本多文种平面) 汉字24点阵字型 第2
信息技术 通用编码字符集(基本多文种平面) 汉字24点阵字型 第2

I C S35.040

L71

中华人民共和国国家标准

G B/T19967.2 2019

代替G B/T19967.2 2010

信息技术通用编码字符集(基本

多文种平面)汉字24点阵字型

第2部分:黑体

I n f o r m a t i o n t e c h n o l o g y U n i v e r s a l c o d e d c h a r a c t e r s e t(b a s i cm u l t i l i n g u a l p l a n e)

24d o tm a t r i x f o n t o fC h i n e s e i d e o g r a m P a r t2:H e i t i

2019-08-30发布2020-03-01实施

国家市场监督管理总局

目 次

前言Ⅲ

1 范围1

2 规范性引用文件1

3 术语和定义1

4 字型和字序1

5 标准数据的管理2

6 点阵字型的表示方法2

7 汉字点阵字型3 附录A (规范性附录) 汉字24点阵字型数据77 附录B (规范性附录) 减省笔画处理的汉字79 参考文献80

前言

G B/T19967‘信息技术通用编码字符集(基本多文种平面)汉字24点阵字型“分为2个部分:

第1部分:宋体;

第2部分:黑体三

本部分为G B/T19967的第2部分三

本部分按照G B/T1.1 2009给出的规则起草三

本部分代替G B/T19967.2 2010‘信息技术通用多八位编码字符集(基本多文种平面)汉字24点阵字型第2部分:黑体“三与G B/T19967.2 2010相比,除编辑性修改外主要技术变化如下: 对原文件的个别汉字字型错误进行了修正;

增加了基本多文种平面0x9F A6~0x9F E D代码段的72个汉字的24点阵黑体字型;

增加了基本多文种平面之外的196个‘通用规范汉字表“中汉字的24点阵黑体字型三

本部分由全国信息技术标准化技术委员会(S A C/T C28)提出并归口三

本部分起草单位:中国电子技术标准化研究院二北京仓颉博雅信息技术有限公司二火箭军装备研究院第四研究所二潍坊北大青鸟华光照排有限公司三

本部分主要起草人:代红二熊涛二卿上伟二相海霞二曹颖二吕建春二周济萍二翟广臣二徐志强二李卫国三本部分所代替标准的历次版本发布情况为:

G B/T19967.2 2010三

信息技术通用编码字符集(基本

多文种平面)汉字24点阵字型

第2部分:黑体

1范围

G B/T19967的本部分规定了G B/T13000基本多文种平面中C J K统一汉字及其扩充集A和G B18030汉字强制部分的24点阵黑体字型三

本部分还规定了G B/T13000基本多文种平面之外的196个‘通用规范汉字表“中汉字的24点阵黑体字型三

本部分适用于各种电子信息技术产品二数字化产品,也可用于其他有关设备三

2规范性引用文件

下列文件对于本文件的应用是必不可少的三凡是注日期的引用文件,仅注日期的版本适用于本文件三凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件三

G B/T13000信息技术通用多八位编码字符集(U C S)

G B18030信息技术中文编码字符集

3术语和定义

下列术语和定义适用于本文件三

3.1

字形g l y p h

一种可辨认的抽象的图形符号,它不依赖于任何特定的设计三

3.2

字型f o n t

具有同一基本设计的字形图像的集合,如:黑体三

3.3

点阵字型d o tm a t r i x f o n t

以点的集合来表现图形字符的型(形)三

3.4

字序c h a r a c t e r o r d e r

图形字符在集合中按一定规则排列的次序三

4字型和字序

本部分以我国现行规范汉字字形为基础,依据现行规范汉字字形整理的原则(参见参考文献)进行字型设计三

汉字编码

编码定义 用预先规定的方法将文字、数字或其他对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。 编码是根据一定的协议或格式把模拟信息转换成比特流的过程。 在计算机硬件中,编码(coding)是在一个主题或单元上为数据存储,管理和分析的目的而转换信息为编码值(典型地如数字)的过程。在软件中,编码意味着逻辑地使用一个特定的语言如C或C++来执行一个程序。在密码学中,编码是指在编码或密码中写的行为。 将数据转换为代码或编码字符,并能译为原数据形式。是计算机书写指令的过程,程序设计中的一部分。在地图自动制图中,按一定规则用数字与字母表示地图内容的过程,通过编码,使计算机能识别地图的各地理要素。 n位二进制数可以组合成2的n次方个不同的信息,给每个信息规定一个具体码组,这种过程也叫编码。数字系统中常用的编码有两类,一类是二进制编码,另一类是二—十进制编码。 为什么要进行汉字编码 汉字编码Chinese character encoding为汉字设计的一种便于输入计算机的代码。由于电子计算机现有的输入键盘与英文打字机键盘完全兼容。因而如何输入非拉丁字母的文字(包括汉字)便成了多年来人们研究的课题。汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输。编码是关键。不解决这个问题,汉字就不能进入计算机。中国人本来是用一只手执笔杆,一笔一画写字的,现在却要统统改为用两只手十个指头击键写字。键符越过笔画,代表部件写字,在键盘上使用编码检出汉字,就是用编码写字,键盘就成为我们的笔杆了。这种以检字来使用汉字,提高信息交换速度,对中华民族的汉字来说,这是几千年来前所未有的一次翻天覆地的大变革。回顾汉字发展的历史,从甲骨文、金文、大篆、小篆、隶书,到现代汉字,它的变革,都只是笔势上的变革,而没有牵涉到它的结构。而这一次,却牵涉到它的结构——把汉字拆分为部件。因此,这次变革,不仅给我国人民将带来巨大的好处,还将使蒙辱一百多年的、背上“落后”黑锅的汉字,重新展现它的光辉。 途径 汉字进入计算机的三种途径分别为:

汉字编码

汉字编码 上海市洋泾中学沈文艳 一、教学目标: 1.知识与技能: (1)理解汉字字形码、机内码及输入码的作用及特点 (2)了解计算机处理汉字的一般过程 2.过程与方法: (1)通过ViewChr软件观察汉字点阵图,探究汉字在屏幕上的显示方式,认识字形码。(2)通过WinHex软件观察汉字内码,探究汉字在计算机内部的存储方式,认识机内码。3.情感、态度与价值观: 通过简介我国科学家王选及汉字全息编码发明少年杜冰蟾的事例,弘扬爱国主义精神及民族自豪感,激发创新意识。认识取得成功必须要有坚韧不拔的毅力和科学严谨的治学态度。 二、教学重点难点 教学重点:汉字输入码、机内码及字形码的作用及特点 教学难点: (1)对汉字三种编码作用及相互关系的理解 (2)汉字字形码存储容量的计算方法。 三、教学过程:

《汉字编码》导学案 班级:姓名:学号: 【学习目标】 1.学习目标 (1)理解汉字字形码、机内码及输入码的作用及特点 (2)了解计算机处理汉字的一般过程 2.重点难点 (1)对汉字三种编码作用及相互关系的理解 (2)汉字字形码存储容量的计算方法。 【活动探究】 活动1:汉字在屏幕上是怎样显示的 步骤: (1)打开ViewChr软件,输入不同的汉字,观察汉字的显示方式, 通过观察,可以很容易地看出,每个汉字是通过一些点的组合来显示的。汉字中有笔画的部分,点是_____(有/无)颜色的,没笔画的部分,点是_____(有/无)颜色的。也就是说屏幕上的每个点既可以有颜色,也可以无颜色,所以,每个点在颜色的显示上最多有_____种状态。 (2)在ViewChr软件中输入汉字“上”,你能否根据软件的显示结果,在下面的16×16的方格图内用二进制数码来描述这个汉字 因为每一个点有两种颜色状态,又因为一个二进制位 可以表示_____种信息,所以,要表示图中的每一个点需要

汉字信息编码标准

1.国家标准汉字代码体系 ??汉字字数繁多,属性丰富,因而汉字代码体系也较复杂,包括: ??(1)汉字机内码。它们是汉字在计算机汉字系统内部的表示方法,是计算机汉字系统 的基础代码。 ??(2)汉字交换码。它们是国标汉字(如机内码)进行信息交换的代码标准。 ??(3)汉字输入码。它们是在计算机标准键盘上输入汉字用到的各种代码体系。 ??(4)汉字点阵码。它们是在计算机屏幕上显示和在打印机上打印输出汉字的代码体系。??(5)汉字字形控制码。为了打印各种风格的字体和字形所制定的代码。 ??这些代码系统有的必须有统一的国家标准,有的则不要求统一。近年来我国已经制定 系列汉字信息处理方面的国家标准,今后将继续完善,并与国际上求得统一。 2. 国家标准汉字交换码 ??我国制定了“中华人民共和国国家标准信息交换汉字编码”,标准代号为GB2312—80,这种编码又称为国标码。在国标码的字符集中共收录了一级汉字3755个,二级汉字3008 个,图形符号682个,三项字符总计7445个。 ??在国标GD2312—80中规定,所有的国标汉字及符号分配在一个94行、94列的方阵中,方阵的每一行称为一个“区”,编号为01区到94区,每一列称为一个“位”,编号为01 位到94位,方阵中的每一个汉字和符号所在的区号和位号组合在一起形成的四个阿拉伯数字就是它们的“区位码”。区位码的前两位是它的区号,后两位是它的位号。用区位码就可以唯一地确定一个汉字或符号,反过来说,任何一个汉字或符号也都对应着一个唯一的区位码。汉字“母”字的区位码是3624,表明它在方阵的36区24位,问号“?”的区位码为0331,则它在03区3l位。 ??所有的汉字和符号所在的区分为以下四个组: ? ? (1)01区到15区。图形符号区,其中01区到09区为标准符号区,10区到15区为 自定义符号区。 ??01区到09区的具体内容如下; ??1)01区。一般符号202个,如间隔符、标点、运算符、单位符号及制表符; ??2)02区。序号60个,如1.~20.、(1)~(20)、①~⑩及(一)~(十); ??3)03区。数字22个,如0—9及X一XII,英文字母52个,其中大写A—Z、小写 a—z各26个; ??4)04区。日文平假名83个; ??5)05区。日文片假名86个; ??6)06区。希腊字母48个; ??7)07区。俄文字母66个; ??8)08区。汉语拼音符号a—z26个; ??9)09区。汉语拼音字母37个。 ? ? (2)16区到55区。一级常用汉字区,包括了3755个一统汉字。这40个区中的汉字是按汉语拼音排序的,同音字按笔划顺序排序。其中55区的90一94位未定义汉字。 ? ? (3)56区到87区。二级汉字区,包括了3008个二级汉字,按部首排序。 ? ? (4)88区到94区。自定义汉字区。 ? ? 第10区到第15区的自定义符号区和第88区到第94区的自定义汉字区可由用户自行??定义国标码中未定义的符号和汉字。 3. 国家标准汉字机内码

6汉字的编码

汉字的编码学习任务单 【知识和技能】 1、能够列举常见的几种输入码,能有选择地应用目前主流的汉字输入码来提高自己的输入能力; 2、了解汉字机内码的作用,能说出机内码GB和GBK的区别; 3、了解汉字字型码的作用,能计算汉字点阵需占的字节数,并能认识到字型码和字库的联系; 4、能表述汉字输入码、内码、字型码(输出码)之间的关系; 5、能初步使用TrueType造字程序。 【过程和方法】 1、教师提出问题或实践任务引导学生开展讨论,逐步解决; 2、学生自主或小组协作探索实践; 3、学生在实践中发现问题、思考问题、解决问题。 【情感态度与价值观】 1、通过任务的驱动提高学生分析、解决问题的能力; 2、学生通过协作学习,提高交流、合作能力; 3、通过对实际问题的解决,让学生认识到信息技术的重要性,激发他们对信息技术强烈的求知欲。 复习回顾 ASCII码的编码特点:用()位二进制数表示,存储一个ASCII码要占用()个字节,最高位是()。 汉字在计算机内部的存储 任务1.体验活动:观察字符、汉字在计算机内部的编码 安装ultraedit内码查看工具,查看下列字符(探究1中的字符)的内码,填表,并思考:西文字符和中文字符占用的存储空间分别是多少

操作提示:安装完成后,双击桌面快捷方式,运行软件。打开软件后,单击左上角的UE图标,从下拉菜单中选择“打开”,打开资料包中的“探究1.txt”,就看到了要查看的字符。然后单击“编辑”菜单,选择“十六进制模式”(如图中红圈),即可显示字符的编码,右边选中符号,左边选中的即是其十六进制编码。 结论:计算机存储1个英文字母或英文标点占用()个字节,存储1个汉字或中文标点占用()个字节。 任务2.微视频学习:GB2312-80汉字编码方案思考完成下列题目(1)根据GB2312-80编码方案,把汉字放入94*94的表中,用行标、列标表示即可得到汉字的()码,将十进制行标、列标分别加32,将得到汉字的()码。 (2)区码、位码最大是(),分别加上32后是(),将其转换成二进制是一个()位二进制数。国标码的每个字节首位是()。西文字符的编码(ASCII编码)首位也是(),所以国标码不能直接做汉字在计算机内部的编码。 (3)由国标码怎样得到汉字的机内码? 如:汉字“包”的区位码是1692,用16进制表示就是105C H ,经过(下图所示)变换,得到其机内码每个字节首位是(),共()个字节。

输入码国标码机内码字型码

输入码、国标码、机内码、字型码 西文是拼音文字,基本符号比较少,编码比较容易,因此,在一个计算机系统中,输入、内部处理、存储和输出都可以使用同一代码。汉字种类繁多,编码比拼音文字困难,因此在不同的场合要使用不同的编码。通常有4种类型的编码,即输入码、国标码、内码、字形码。 ①输入码 输入码所解决的问题是如何使用西文标准键盘把汉字输入到计算机内。有各种不同的输入码,主要可以分为三类:数字编码、拼音编码和字编型码。 ●数字编码。就是用数字串代表一个汉字,常用的是国标区位码。它将国家标准局公布的6763个两级汉字分成94个区,每个区分94位。实际上是把汉字表示成二维数组,区码、位码各用两位十进制数表示,输入一个汉字需要按4次键。数字编码是惟一的,但很难记住。比如“中”字,它的区位码以十进制表示为5448(54是区码,48是位码),以十六进制表示为3630(36是区码,30是位码)。以十六进制表示的区位码不是用来输入汉字的。 ●拼音编码。是以汉字读音为基础的输入方法。由于汉字同音字太多,输入后一般要进行选择,影响了输入速度。 ●字型编码。是以汉字的形状确定的编码,即按汉字的笔画部件用字母或数字进行编码。如五笔字型、表形码,便属此类编码,其难点在于如何拆分一个汉字。 ②国标码 又称为汉字交换码,在计算机之间交换信息用。用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为214=16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。例如“中”字的国标码为8680(十进制)或7468(十六进制)。这就是国家标准局规定的GB2312—80信息交换用汉字编码集。 ③内码 汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128 为了统一表示世界各国的文字,1993年国际标准化组织公布了“通用多八位编码字符集”的国际标准ISO/IEC 10646,简称UCS(Universal Code Set),它为包括汉字在内的各种正在使用的文字规定了统一的编码方法。该标准使用4个字节来表示一个字符。其中,一个字节用来编码组,因为最高位不用,故总共表示128个组。一个字节编码平面,总共有256个平面,这样,每一组都包含256个平面。在一个平面内,用一个字节来编码行,因而总共有256行。再用一个字节

相关主题
相关文档
最新文档