计算机中的信息表示

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 进位计数制

1. 常见的进位计数制

Bi nary 二进制 O ctonary 八进制 D ecimalism 十进制 H exadecimal 十六进制 进位计数制:利用固定的数字符号和统一的规则来计数的方法。有3个基本要素: 基数->

进位规则->R 位权->2. 1.

多项式展开直接求和 2.十进制转换成二进制整数部分:除基到零,反向写余 小数部分:乘基到精,正向写整 3. 二进制转成八、十六进制

小数点为界,向两边分组。八进制3个一组,十六进制4个一组,不足添0。各组二进制转成十进制再转成八(十六)进制即可。

2.计算机中的数据

1.二进制与计算机

位(bit):计算机中最基本的单位,一个二进制数字0/1。

字节(Byte):8个位。

字:字节的集合。

字长:一个字中二进制的位数。字长是计算机一次能同时进行运算的二进制位数。现在一般为32bit、64bit。

一般来说,n位的二进制数字能够表示种状态。

2.模拟数据和数字数据

模拟数据:一种连续表示法,模拟它表示的真实信息。

数字数据:一种离散表示法,把信息分割成了独立的元素。

阈值:大于阈值的电压看成高电压,小于阈值的电压看成低电压。

计算机不能处理模拟数据,要对模拟数据进行数字化。

3.数据及其分类

数值、文本、音频、视频、图像、图形。

4.数值型数据的表示

机器数:一个数在计算机中的表示形式。机器数有位数限制,多余的位数将

被截断,少的位数将被填充。 (机器数的)真值:带有正负号的数。

1. 数值型数据的分类

根据是否带小数点分为实数和整数。

按照是否带有符号,整数分为带符号和无符号。对于带符号的整数要对符号进行编码。数值数据可以用原码和补码表示。

为了表示实数中的小数点的位置,可以表示为定点数或浮点数。

2. 整数的表示

无符号整数表示:转成二进制数,对不足机器字长的在前面补0。最小值全是0,最大值全是1。

带符号整数表示:0表示正,1表示负。符号位占用一位二进制数位。 原码

符号位

补码:正数同原码,负数补码除符号位外其他位取反,末尾位加1。 +、-0的补码一致。

3. 实数的表示

定点数的表示

:定点数就是在运算过程中小数点的位置固定不变。小数点位置不一定是明确指定的。由于小数点位置固定,计算时可以直接进行加减运算。

浮点数的表示:任何一个数都可以用科学计数法来表示,这种表示方法称为浮点表示法。浮点数的一般表示形式:

IEEE 754

规定单精度浮点数(32b )双精度浮点数(64b )。

对于二进制实数,现将其写成尾数是定点小数的科学计数法的形式。再将其尾数扩充为23位,阶码扩充为8位,再把尾数转换成补码形式。

假想的小数点

数值位

=

=

单精度(32b )

4. 溢出

计算机中n 位有符号数的表示范围(1

2~2

-11

---n n )。

超出范围会产生溢出。

5. 文本表示

一个文本是由一系列字符构成的。要处理一个文本,必须表示和存储每个可能出现的字符。

内码:字符在计算机中存储和处理时的编码。

1. 文本类型

1. 简单文本:仅由一串字符代码组成,没有字体字号的变化和其他媒体。文件扩展名为txt 。

2. 丰富格式文本:允许在文档中设置格式(字体、颜色、页边距、自选图形、公式等)的文本。

3. 超文本(HTML 文本):有声音、视频等多媒体信息,还有链接。 不管是哪种类型,核心问题是要表示字符本身,格式符号需要单独表示。最早也是最常用的方法是列出所有字符,给每个字符编一个二进制位串。 要表示的符号数决定了需要多少二进制位数来表示。 西文字符——>ASCII 码 汉字字符——>GB 2312-1980 全世界所有字符——>Unicode 码

2. 文本内码

1. ASCII 码

美国标准信息互换标准代码。最初,ASCII 字符集中每个字符由7个二进制位表示,总共有128个不同字符。用一个字节存储,第8位用作校验位。ASCII 码表中特殊的33个字符(0~31和127)是不可显示和打印的控制码。比如CR (回车)。 2. Unicode 编码

表示世界上使用的所有语言的所有字符。Unicode 使用16位表示每个字符,能够表示162个字符。Unicode 字符集是ASCII 字符集的超集。Unicode 常用的两种编码方案如下:

1)UTF-8单字节可变长编码:每个字符占1~4个字节。有单、双、三、四字节。

2)UTF-16双字节可变长编码:每个字符占2或4个字节。 3. 汉字编码

汉字内码是计算机内部使用的用二进制表示的汉字编码。 i)

区位码

94x94个ASCII 字符为基础构成二维平面,行为区,列为位。每一个汉字/字符都对应唯一一个区(左)位(右)号。每个汉字用2个字节表示。 ii)

汉字内码GB2312标准

ASCII 码用1个字节表示,最高位为0。汉字内码用2个字节来表示,每个字节最高位是1。为了与ASCII

码的可打印字符位置一致,在区号和

位号上分别加上20H(32),称为国标码。

区位码转换成机内码的方法是:将十进制的区码和位码转成十六进制的,将他们分别加上20H得到国际码。再在高低字节上加上80H。

Ex:中国OK! 占

2+2+1+1+1=7个字节

iii)

汉字内码GBK标准编码

1995年汉字内码扩充标准。要求双字节最高位为1。

iv)汉字内码GB18030汉字编码标准

国家发布过GB 18030-2000和GB 18030-2005,现已强制贯彻执行。

4.文本输入

1.键盘输入

2.联机手写输入

3.语音输入

4.印刷体识别

5.文本输出

1.字符点阵描述

每个字符按照图形符号设计成点阵图,用一位二进制对应屏幕上的一个点,亮为1暗为0,就得到相应的点阵代码(字形码)。

2.字符轮廓描述

以字符轮廓的转折点为特征来描述字符,又称矢量字体。用一组直线

相关文档
最新文档