国家标准信息技术汉字编码字符集基本集-全国信息技术标准化

合集下载

我国汉字编码标准

我国汉字编码标准

我国汉字编码标准首先,我国的汉字编码标准在不同阶段都遵循了统一性、规范性和适用性的原则。

在GB2312-80发布之后,我国的计算机领域得到了长足的发展,但是随着信息化建设的深入,GB2312-80已经不能满足当今社会对汉字编码的需求。

因此,1995年发布了GBK编码,它在GB2312-80的基础上增加了对繁体字和少数民族文字的支持。

而随着国际化的发展,GB18030-2005标准的发布则进一步完善了我国汉字编码标准,使其更加符合国际标准。

其次,我国汉字编码标准的发展也受益于技术的进步和应用的需求。

随着计算机技术的不断发展,对于汉字编码的要求也越来越高。

GB18030-2005标准的发布,不仅支持了Unicode标准,还对繁体字和少数民族文字进行了更好的支持,使得我国的汉字编码标准更加符合当今信息化建设的需要。

再者,我国汉字编码标准的发展也受益于国际化的趋势。

随着我国在国际上的地位不断提升,对于国际标准的遵循和应用也越来越重要。

GB18030-2005标准的发布,使得我国的汉字编码标准更加符合国际标准,为我国在国际上的信息交流和合作提供了更好的支持。

最后,我国汉字编码标准的发展也为我国的信息化建设和文化传承提供了更好的支持。

汉字是我国的传统文化符号,对于汉字的数字化编码,不仅可以更好地保护和传承我国的传统文化,还可以更好地适应当今信息化建设的需要。

因此,我国汉字编码标准的不断完善和发展,为我国的信息化建设和文化传承提供了更好的基础和保障。

总之,我国汉字编码标准的发展经历了多个阶段,每一次的更新都是为了更好地适应当代社会的需求。

随着技术的进步、国际化的趋势以及信息化建设的需求,我国汉字编码标准将会不断完善和发展,为我国的信息化建设和文化传承提供更好的支持和保障。

国家标准化管理委员会公告2011年第1号――批准发布410项国家标准目录

国家标准化管理委员会公告2011年第1号――批准发布410项国家标准目录

国家标准化管理委员会公告2011年第1号――批准发
布410项国家标准目录
文章属性
•【制定机关】国家标准化管理委员会
•【公布日期】2011.01.10
•【文号】国家标准化管理委员会公告2011年第1号
•【施行日期】2011.01.10
•【效力等级】部门规范性文件
•【时效性】现行有效
•【主题分类】标准化
正文
国家标准化管理委员会公告
(2011年第1号)
关于批准发布《紧固件质量保证体系》等410项国家标准的公告国家质量监督检验检疫总局、国家标准化管理委员会批准《紧固件质量保证体系》等410项国家标准,现予以公布。

二〇一一年一月十日附件:。

中文信息处理重点题目及解答

中文信息处理重点题目及解答

中文信息处理①信息:是物质世界存在的形式、状态及各种关系,是与物质、能量共同构成世界的三大要素之一。

具有主观和客观双重属性。

中文信息,是特指以汉语言文字为载体形式的信息。

从宏观角度看,一类是自然性信息,一类是社会性信息。

②信息处理:就是用计算机对各种信息符号进行输入、转换、存储、传输、分类、排序、统计、分析、重组等加工过程。

③中文信息处理:是利用计算机对中文(包括口语和书面语)进行输入、转换、传输、存储、分析、加工的科学。

中文信息处理技术已到社会生活的各个方面,汉字/汉语信息处理。

④代码:汉字的代码有:汉字输入码、汉字内部码、汉字交换码、汉字地址码、汉字字形码和汉字控制功能码。

从汉字代码的角度看,一个汉字信息处理系统,就是一个进行汉字代码转换的过程。

中文代码包括内部码和外部码两大类,内部码是中文在计算机系统内部进行处理和传输的代码,外部码作为人机接口由用户给计算机输入信息时使用的代码。

*中文计算机操作系统使用的代码系列一共三种,七位代码系列,八位代码系列和双八位代码系列。

中文信息内部处理代码包括存储码、运算码、传输码。

(是程序员用开发工具所支持的语言写出来的源文件,是一组由字符、符号或信号码元以离散形式表示信息的明确的规则体系。

)⑤编码:是以固定的顺序排列字符,并以此做记录、存贮、传递、交换的统一内部特征,这个字符排列顺序被称为“编码”。

A.计算机通讯技术领域对所处理信息的字符集序号序列的排序原则和代码赋值方式,也是“机内码”的编码。

B.专指计算机键盘输入汉字的代码设计与实现,简称外码或人机界面编码。

汉字编码:广义的汉字编码就是汉字排检法,即确定一个排序规则使全部汉字成为有序的集合,以便能按照排序规则检索到所需要的汉字。

狭义的汉字编码特指采用通用键盘上的字母数字为汉字编制代码,以便实现汉字的计算机输入。

*静态编码:指把汉字作为等概率的离散字符进行的编码,不考虑汉字的使用频率。

动态编码:是根据汉字的使用频率进行信息编码,如传输码、处理吗都采用动态编码。

全国信息技术标准化技术委员会简介20131030

全国信息技术标准化技术委员会简介20131030
9
中文平台分技术委员会 负责全国信息技术领域与中文信息处理有关的输入 法、字库和中文操作系统的 API 标准化工作。 自动识别与数据采集分技术委员会 负责全国信息技术领域条码、射频等自动识别与数据 采集技术、应用等专业领域标准化工作。 教育技术分技术委员会 负责教育领域信息技术标准化及远程教育应用技术 的标准化(不包括教学设备和仪器)。
13
试、集成测试和应用测试,有效地解决了基础软件之间的 兼容性、适配性等问题。
电子文件 电子文件是重要信息载体,直接关系国家信息安全。 为确保电子文件安全交换和长期保存,打破国外对电子文 件处理软件的垄断,急需制定拥有自主知识产权统一格式 的电子文件标准。从 2010 年起,在中办、国办、工信部 支持下,承担电子文件存储交换格式、党政机关电子公文、 电子文件管理装备等相关标准研制工作。 组织国内主要厂商自主研制了办公软件文档格式标 准 UOF 和版式文档格式标准 OFD。 支撑国家标准《党政机关公文格式》(GB/T 9704-2012)标准应用实施,组织软件厂商开发符合标准 的工具软件。 物联网 承担国家物联网应用示范工程“物联网标准体系建设 及关键技术标准研制”建设工作。 提出我国物联网标准体系架构,开展了 47 项物联网 和 16 项传感网标准研制工作,为物联网产业快速健康发
截至 2013 年 10 月,信标委共归口国家标准 740 项, 国家标准制、修订项目计划 447 项,涉及词汇、编码字符 集和字型、数据通信、软件和系统工程、卡和身份识别、 程序设计语言、图形图像表示、信息技术设备、多媒体、 自动识别和数据采集技术、数据管理、文件描述与处理语 言、用户接口、信息技术教育、生物特征识别、分布应用 平台与服务、信息技术可持续发展等领域。
10
附录一

全国信息技术标准化技术委员会工作交流

全国信息技术标准化技术委员会工作交流
• 基本原则 – 鼓励自主知识产权纳入标准 – 鼓励优惠许可的技术 – 坚持公开、公正、透明的工作程序 – 与国家政策保持一致,便于专项标准化成果顺利转 化为国家标准
• 要点 – 合理无歧视(RAND)/专利池/免费 – 互惠性和防御性 – 早期披露 – 默认许可义务 – 开放性(引用标准、参考实现、测试套件)
SVG VML
中间件
行业中间件
数据 集成 中间 件
流程
中间 件
服务 集成 中间 件
门户 中间 件

应用服务器 消息中间件 事务中间件
嵌入式系统
• 《信息技术 词汇 嵌入式系统》
• 《嵌入式Linux平台规范》 • 《手持电子产品嵌入式软件API》 • 《移动终端浏览器技术规范》 • 《嵌入式软件质量保证要求》 • 《嵌入式软件质量度量》 • 《嵌入式软件编码规范要求》 • 《嵌入式软件可靠性测试规范》 • 《嵌入式系统 系统工程应用及管理》 • 《车用软件开发指南》
SC36
SC1 SC5 SC10 SC11 SC12 SC14 SC21 SC30
WG WG WG WG WG WG WG WG WG WG
词汇
非建盘输入 磁盘 柔性磁媒体 微处理机 数据元表示 连开放系统互连 中文平台
藏文 维、哈、柯文 蒙文 云南少数民族文字 无线传感器网络 IT服务 SOA 通用 布缆 基于射频技术的电子支付技术 实时定位系统技术
少数民族语言文字信息技术标准化
1、中国少数民族文字信息技术标准体系已初步建立

覆盖文种包括蒙古文、藏文、彝文、维哈柯文、朝鲜文等

标准类型包括编码、字型、键盘布局

标准数量目前已达到23项
2、构建和完善中国少数民族文字信息技术标准体系意义重大

各类内码详细解析

各类内码详细解析

转换内码gb2312为utf-8各类内码详细解析[日期:2009-04-29] 来源: 作者:sdiel 阅读:3706 次 [字体:大中小]GB2312 字符集GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施,是中国国家标准的简体中文字符集。

它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。

在中国大陆和新加坡获广泛使用。

powered by GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共7445 个图形字符。

其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。

GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。

这种表示方式也称为区位码。

它是用双字节表示的,两个字节中前面的字节为第一字节,后面的字节为第二字节。

习惯上称第一字节为“高字节” ,而称第二字节为“低字节”。

“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。

以GB2312字符集的第一个汉字“啊”字为例,它的区号16,位号01,则区位码是1601,在大多数计算机程序中,高字节和低字节分别加0xA0得到程序的汉字处理编码0xB0A1。

计算公式是:0xB0=0xA0+16, 0xA1=0xA0+1。

GBK字符集GBK字符集是GB2312的扩展(K),GBK1.0收录了21886个符号,它分为汉字区和图形符号区,汉字区包括21003个字符。

GBK字符集主要扩展了繁体中文字的支持。

BIG5 字符集BIG5又称大五码或五大码,1984年由台湾财团法人信息工业策进会和五间软件公司宏碁(Acer)、神通(MiTAC)、佳佳、零壹(Zero One)、大众(FIC)创立,故称大五码。

信息技术习题(题目)

信息技术习题(题目)

答案自己做的1.在下列有关不同进位制系统的叙述中,错误的是___________。

A.在计算机中所有的信息均以二进制编码存储B.任何进位制的整数均可精确地用其它任一进位制表示C.任何进位制的小数均可精确地用其它任一进位制表示D.十进制小数转换成二进制小数,可以采取“乘以2取整法"2.在下列有关汉字编码字符集的叙述中,错误的是 ___________。

A.GB2312—80是我国颁布最早的汉字编码字符集标准,它包含6000多个汉字B.UCS-2(Unicode)编码标准,西文字符采用单字节编码,汉字用双字节或四字节编码C.汉字扩展内码规范(GBK)保持与GB2312-80字符集的汉字编码完全兼容D.BIG5字符集是一种繁体汉字字符集,它包含10000多个汉字3.在下列有关PC机物理组成的叙述中,错误的是____________。

A.通常所说的主机空机箱,一般包含电源盒B.系统板也称为主板或大底板,一般包含BIOS和CMOS集成电路芯片C.系统板上的内存插槽一般只有一个,扩展内存只能通过更换内存条进行D.一块系统板上通常包含多种类型的I/O接口4.为了使计算机有较高的性能/价格比,现代计算机均采用多种存储器组成的层次式结构体系。

在下列存储器中。

其存取周期一般为毫秒级的是____________.A.Cache存储器B.主存储器C.硬盘D.磁带(库)5.1991年Intel公司提出的PCI局部总线标准(工作频率为33MHz),因其高性能、低成本,目前仍广泛使用。

当数据线宽度为64位时,其传输速率约为 __________ 。

A.33MB/s B.66MB/s C.133MB/s D.266MB/s6.构建不同的网络需要选择不同的网络设备.在构建局域网时,一般不需要__________ 。

A.路由器B.集线器C.网卡D.中继器7.下列关于Internet网中主机、IP地址和域名的叙述中,错误的是___________。

国家标准《信息技术汉字编码字符集(基本集)-全国信息技术标准化

国家标准《信息技术汉字编码字符集(基本集)-全国信息技术标准化
《信息技术通用多八位编码字符集(基本多文种平面)汉字64点阵字型第1部分:宋体》(征求意见稿)编制说明
1.工作简况
随着信息技术的不断发展,中文信息技术产品所使用硬件设备得到提升,中文信息系统及办公自动化设备对点阵字型出现了新的需求,为了满足中文信息系统对64点阵宋体的需求,根据工业和信息化部“2012年电子行业标准项目计划”的安排,对SJ 11242.1-2001进行修订,项目计划代号为2012-0526Q-SJ,标准名称为《信息技术通用多八位编码字符集(I区)汉字64点阵字型第1部分:宋体》。
本标准由中国电子技术标准化研究院,北京仓颉博雅信息技术有限公司等单位负责修订,标准主要起草人有代红、熊涛等。
根据上级主管部门下达的标准计划任务,由中国电子技术标准化研究院牵头成立了标准编制组和专家组,并制定了详细的标准研究实施方案。中国电子技术标准化研究院主要负责组织协调和标准文本起草,北京仓颉博雅信息技术有限公司负责字型设计,专家组负责字型审查工作。
为适应中文信息处理的发展和国际信息交换及汉字的规范化、标准化需求,在研制汉字字型的过程中,考虑到本标准的使用范围、时间和影响等因素,重点做了以下几个方面的工作:
(1)字形的正确性
常用字以《现代汉语常用字表》和《简化字总表》为依据容易确定,而超出规范字表的一些字在不同的字典里列出的字形不一致,因此,在字形整理时,不仅根据整理汉字字形的规则,还参考已有的标准及《康熙字典》、《汉语大字典》、《中华字海》等工具书,本着不放过任何一个疑问的原则,经过专家组的反复逐字审查讨论确定。
准确:字的笔划规范、偏旁规范、字形规范。
清楚:黑白适中、笔划清晰。
美观:字的结构要端正、大小匀称、组合比例协调,充分体现我国传统汉字各种字体的独特风格,做到“神、形”兼顾。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《信息技术通用编码字符集(基本多文种平面)汉字15×16点阵字型》(征求意见稿)编制说明
一、工作简况
1、任务来源
随着信息技术的不断发展,中文信息技术产品所使用硬件设备得到提升,中文信息处理设备对点阵字型出现了新的需求,为了满足信息处理设备对15×16点阵的需求,国家标准化管理委员会在2015年第三批“制、修订国家标准项目计划”中安排了本标准的制定工作,计划代号为20153659-T-469,标准名称为《信息技术通用编码字符集(基本多文种平面)汉字15×16点阵字型》。

本标准由中国电子技术标准化研究院、北京仓颉博雅信息技术有限公司等单位负责起草,标准主要起草人有代红、熊涛等。

2、主要工作过程
标准计划任务下达后,由中国电子技术标准化研究院牵头成立了标准编制组和专家组,并制定了详细的标准研究实施方案。

中国电子技术标准化研究院主要负责字型设计、组织协调和标准文本起草,北京仓颉博雅信息技术有限公司负责字型设计,火箭军装备研究院第四研究所和潍坊北大青鸟华光照排有限公司负责字型纠错修改,专家组负责字型审查工作。

按照标准实施方案的要求,标准编制组于2016年6月底,分批提供了15×16点阵字型的设计初稿,并将字型设计初稿提供给字型专家审查,在设计点阵字型时对有疑问的字进行查证讨论,做到每个字的修改确定有据可查。

根据字型专家提出的修改意见,标准编制组对字型设计初稿进行修改,于2017年7月底前完成了对字型设计初稿的修改整理。

在对字型设计稿修改的同时,标准编制组还进行了标准文本的起草工作,2017年10月完成了标准草案。

2017年11月标准草案提交中国电子技术标准化研究院进行标准专家内审,标准起草组根据标准内审专家提出的意见对草案进行修改,形成了标准的征求意见稿,现向各位征求意见。

3、标准编制的主要成员单位及其所做的工作
本标准由中国电子技术标准化研究院、北京仓颉博雅信息技术有限公司、火箭军装备研究院第四研究所等单位负责起草。

中国电子技术标准化研究院主要负责标准文本的起草、标准研究的组织协调,北京仓颉博雅信息技术有限公司负责
标准字型数据的制作和修改,火箭军装备研究院第四研究所负责标准字型数据的审查,其他单位参与标准起草工作。

二、标准编制原则和确定主要内容的论据及解决的主要问题
本标准依据编码字符集国家标准GB/T 13000中基本多文种平面中CJK统一汉字、CJK统一汉字扩充A及《通用规范汉字表》中其余汉字的内容和编码顺序制定,汉字的位置与GB/T 13000中的编码位置相对应。

字形依照1965年1月30日中华人民共和国文化部、中国文字改革委员会发布的《印刷通用汉字字形表》、1988年3月25日国家语言文字工作委员会、中华人民共和国新闻出版署发布的《现代汉语通用字表》和2013年6月18日中华人民共和国国务院发布的《通用规范汉字表》而设计,以确保字形的准确性与规范化。

本标准以GB/T 13000编码字符集基本多文种平面中CJK统一汉字、CJK统一汉字扩充A规定的27558个汉字及《通用规范汉字表》中的其余196个汉字为依据设计了15×16点阵字型。

本标准编制的原则是充分利用15×16点阵栅格进行设计,要求足格、清晰、准确。

对点阵字的设计满足如下要求:
●准确:字形正确,笔形规范;
●清楚:黑白适中,笔画清晰;
●美观:字的结构端正,大小匀称,组合比例协调,充分体现汉字字体风格。

为适应中文信息处理的发展和国际信息交换及汉字的规范化、标准化需求,在研制汉字字型的过程中,考虑到本标准的使用范围、时间和影响等因素,重点做了以下几个方面的工作:
(1)字形的正确性
常用字以《通用规范汉字表》为依据容易确定,而超出规范字表的一些字在不同的字典里列出的字形不一致,因此,在字形整理时,不仅根据整理汉字字形的规则,还参考已有的标准及《康熙字典》、《汉语大字典》、《中华字海》等工具书,本着不放过任何一个疑问的原则,经过专家组的反复逐字审查讨论确定。

(2)规范性
虽然国家早已公布了规范字表,但是实际应用中,如报刊、杂志、书籍,甚至个别字典中,仍然有不规范的字出现。

在设计和整理字形时,为保证每个字在字形结构、笔画数、笔形等方面做到准确、规范,编制组查证了大量的资料,并
进行了多次研究,特别对那些笔形容易出错的字进行了重点检查。

在保证每个字形正确的前提下,整个字库要做到相同的部件尽量统一,防止出现前后矛盾。

(3)美观性
由于本标准所收的汉字数量多、字形结构复杂,笔画多的字占比大,受点阵字型像素空间的限制,给字型设计增加了难度。

为了保证整副字的质量,在字形设计时,对字的结构特征做了分类,结合人的视觉因素和阅读效果,在进行实验对比的基础上,使整副字达到结构端正、大小一致、排列整齐、字形清晰。

三、主要试验[或验证]情况分析

四、知识产权情况说明
本标准不涉及知识产权及专利内容。

五、产业化情况、推广应用论证和预期达到的经济效果

六、采用国际标准和国外先进标准情况
目前暂无与本标准相对应的国际标准。

七、与现行相关法律、法规、规章及相关标准的协调性
本标准是为配合编码字符集国家标准GB/T 13000《信息技术通用编码字符集(UCS)》的使用而制定的,本标准依据GB/T 13000编码字符集基本多文种平面中CJK统一汉字、CJK统一汉字扩充A规定的27558个汉字及《通用规范汉字表》中其余196个汉字设计了15×16点阵字型,字汇和字序与GB/T 13000的相关规定保持一致。

九、标准性质的建议
建议本标准作为强制性标准发布实施。

十、贯彻标准的要求和措施建议
建议本标准发布后,实施过渡期半年。

十一、替代或废止现行相关标准的建议
本标准替代GB 19966-2005。

十二、其它应予说明的事项
在本标准编制过程中,有许多有关汉字字形共性的问题和一些字的个性问题需要一一解决。

(1)汉字的正形
根据GB/T 13000中所提供的CJK统一汉字扩充A的汉字有6582个,其中G列的汉字是由我国提出。

为了适应信息处理的发展和国际交流的需要,对G 列空缺汉字采用了其他国家和地区相应的字形,并按照字形规范化的要求适当进行了整理和设计。

(2)重码字的处理
本标准对重码的汉字字形进行处理,原则上保留原字形,对有些字的笔形与旧笔形不同的地方做了部分修改。

标准编制组
2018年4月。

相关文档
最新文档