浮点数的编码表示

合集下载

浮点数在计算机中是如何表示的

浮点数在计算机中是如何表⽰的话题：浮点数在计算机中是如何表⽰的？回答：浮点数浮点数是属于有理数中某特定⼦集的数的数字表⽰，在计算机中⽤以近似表⽰任意某个实数。

具体的说，这个实数由⼀个整数或定点数（即尾数）乘以某个基数（计算机中通常是2）话题：浮点数的解释回答：浮点数是属于有理数中某特定⼦集的数的数字表⽰，在计算机中⽤以近似表⽰任意某个实数。

具体的说，这个实数由⼀个整数或定点数（即尾数）乘以某个基数（计算机中通常是2）的整数次幂得到，这种表⽰⽅法类似于基数为10的科学记数法。

浮点计算是指浮点数参与的运算，这种运算通常伴随着因为⽆法精确表⽰⽽进⾏的近似或舍⼊。

⼀个浮点数a由两个数m和e来表⽰：a = m * b^e。

在任意⼀个这样的系统中，我们选择⼀个基数b（记数系统的基）和精度p（即使⽤多少位来存储）。

m（即尾数）是形如±d.dddddd的p位数（每⼀位是⼀个介于0到b-1之间的整数，包括0和b-1）。

如果m的第⼀位是⾮0整数，m称作格化的。

有⼀些描述使⽤⼀个单独的符号位（s +或者-）来表⽰正负，这样m必须是正的。

e是指数。

这种设计可以在某个固定长度的存储空间内表⽰定点数⽆法表⽰的更⼤范围的数。

例如，⼀个指数范围为±4的4位⼗进制浮点数可以⽤来表⽰43210,4.321或0.0004321，但是没有⾜够的精度来表⽰432.123和43212.3（必须近似为432.1和43210）。

当然，实际使⽤的位数通常远⼤于4。

此外，浮点数表⽰法通常还包括⼀些特别的数值：+∞和−∞（正负⽆穷⼤）以及NaN('Not a Number')。

⽆穷⼤⽤于数太⼤⽽⽆法表⽰的时候，NaN则指⽰作或者⽆法定义的结果。

众所知，计算机中的所有数据都是以⼆进制表⽰的，浮点数也不例外。

然⽽浮点数的⼆进制表⽰法却不像定点数那么简单了。

先澄清⼀个概念，浮点数并不⼀定等于⼩数，定点数也并不⼀定就是整数。

浮点数汇编指令集

fsub st(num),st ;计算st(num)减st的值；用差值替换st(num)
fsub st,st(num) ;计算st减st(num)的值；用差值来替换st
fsub memory(real) ;计算st减存储器中的实型数的值；用差值来替换st
fidivr memory(integer);计算存储器中的整型数/st；用商来替换st
fdivrp st(num),st ;计算st/st(num)的值，用商来替换st(num)；并将st出栈
;//////////////////////////////////////////////////////////////////////////////
fmul st(num),st ;将st(num)和st相乘；用乘积来替换st(num)
fmul st,st(num) ;将st和st(num)相乘；用乘积来替换st
fmul memory(real) ;将st和存储器中的实型数相乘；用乘积来替换st
fstp memory(real) ;复制st的值为实型数，存入存储器；st出栈
fist memory(integer) ;复制st的值，并转换为整型数存入存储器
fistp memory(integer) ;复制st的值，并转换为整型数存入存储器;st出栈
fbstp memory(BCD) ;复制st的值，并转换为BCD码存入存储器；st出栈
fimul memory(integer) ;将st和存储器中的整型数相乘，用乘积来替换st
fmulp st(num),st ;将st(num)和st相乘；乘积来替换st(num);并将st出栈
;助记符操作数功能

Lecture 3 浮点数的表示

相当于此时移码的计算不是加 128，而是加 127
IEEE754标准浮点数表示

几个特殊数值：

当E的二进制位全为1时为特殊数值：此时，

若M的二进制位全为0，则n表示无穷大。若S为1则为负无穷大，若S为0则为正无穷大; 若M的二进制位不全为0时，表示NaN(Not a Number)，表示这不是一个合法实数。
浮点数在计算机中的表示格式如下：
MS E 数符阶码定点整数移码表示
或
M 尾数值定点小数补码表示
ES E MS M 阶符阶码数符尾数值定点整数补码表示定点小数补码表示
浮点数的表示格式
E 阶码 Es Ek-1 … E1E0 Ms Mn-1
阶符阶码的数值部分数符小数点位置
M 尾数
IEEE754标准浮点数表示
例将十进制数9和5/32转换为IEEE754标准的单精度数, 并用8位十六进制表示

解答(1)
9= (-1)0×1001=(-1)0×23 ×1.001 =(-1)0×2130-127 ×1.001
二进制代码为：
0 10000010
00100000000000000000000
即：41100000H

解答(2)
5/32= (-1)0×0101×2-5
=(-1)0×2-5×22×1.01
=(-1)0×2124-127 ×1.01
二进制代码为： 0 01111100 01000000000000000000000 即：3E200000H
IEEE754标准浮点数表示

例
将IEEE754单精度数(8位十六进制表示)转换为十进制数

计算机组成原理：浮点数表示及运算

正数 0.1xxxxxx 负数 1.1xxxxxx 补码尾数的规格化的表现形式：尾数的最高位与符号位相反。正数 0.1xxxxxx 负数 1.0xxxxxx
6
计算机组成原理
例：对数据12310作规格化浮点数的编码，假定1位符号位，基数为2，阶码5位，采用移码，尾数10位，采用补码。
解：12310=11110112= 0.11110110002×27 [7]移=10000+00111 = 10111 [0.1111011000]补=0.1111011000 [123]浮= 1011 1 0 11 1101 1000 = BBD8H
对阶： [△E]补= [ Ex]补－[Ey]补=00 10+ 11 11= 00 01
y向x对齐，将y的尾数右移一位，阶码加1。 [y]补=00 10，00.0101 求和： 00.1101 + 00.0101 01.0010 [x+y]补=00 10，01.0010 右归：运算结果两符号位不同，其绝对值大于1，右归。 [x+y]补= 00 11，00.1001
0.0000001 --- 0.1111111 1/128 --- 127/128 可表示2-11*0.0001 --- 211*0.1111

设阶码2位，尾数4位

0.0000001 --- 111.1
可表示2-111*0.001 --- 2111*0.111

设阶码3位，尾数3位

0.0000000001 --- 1110000
19
(4) 结果规格化求和之后得到的数可能不是规格化了的数 , 为了增加有效数字的位数, 提高运算精度,必须将求和的结果规格化。 ①规格化的定义:

IEEE 754 规定的双精度浮点数表示

IEEE 754 规定的双精度浮点数表示(来自中文wikipedia):sign bit(符号): 用来表示正负号exponent(指数): 用来表示次方数mantissa(尾数): 用来表示精确度摘要浮点数的表示和存储直接影响计算机的结构和性能，IEEE 754是浮点运算部件事实上的工业标准，是计算机上使用最为广泛的浮点标准。

文章在阐述了浮点数的基本概念和IEEE 754浮点数的表示形式及其格式的基础上，比较深入的比较、分析和研究了Intel x86和SPARC结构计算机上使用的三种IEEE浮点数的存储格式。

关键词IEEE 754；浮点数；浮点格式；浮点存储格式；规格化0引言IEEE（Institute of Electrical and Electronics Engineers，电子电气工程师协会）在I985年制定的IEEE 754（IEEE Standard for Binary Floating-Point Arithmetic, ANSI/IEEE Std 754-1985 ）二进制浮点运算规范，是浮点运算部件事实上的工业标准。

许多计算机用户有机会在Intel x86和SPARC 或Power PC机之间交换二进制数据，所以对照Intel x86和SPARC结构计算机的数据表示及相关程序设计语言，讨论IEEE 754浮点数存储格式的细节是有意义的。

本文对浮点数、IEEE 754浮点数的表示方法、规格化处理等进行了分析，重点分析、比较了Intel x86和SPARC结构计算机IEEE 754浮点数的存储格式。

1 浮点数在计算机系统的发展过程中，曾经提出过多种方法表示实数，但是到目前为止使用最广泛的是浮点表示法。

相对于定点数而言，浮点数利用指数使小数点的位置可以根据需要而上下浮动，从而可以灵活地表达更大范围的实数。

浮点数表示法利用科学计数法来表达实数。

通常，将浮点数表示为± d.dd…d ×βe，其中d.dd… d 称为有效数字（significand），它具有p 个数字（称p位有效数字精度），β为基数（Base），e为指数（Exponent），±表示实数的正负[1,2]。

计算机浮点数编码实验

浮点数编码实验总体要求，只能使用局部变量，最多只能使用有限个运算符(等于号,括号不计),禁止定义或者使用任何宏和函数，禁止使用类型转换，禁止定义或者使用任何浮点常量，浮点编码原理阅读附录部分。

实验1：编写unsigned float_neg(unsigned uf)返回-uf的位级表示，最多使用10个操作符，实现原理：只需将符号位取反，另外还要对非数进行处理，如果是非数，就直接返回。

实现代码：unsigned float_neg(unsigned uf){unsigned r=uf;unsigned t;//符号取反r = r^0x80000000;t = (uf>>23)&0xff;//非数if (t == 0xFF && (uf&0x7FFFFF)>0)r = uf;return r;}实验2：编写函数unsigned float_i2f(int x)函数，实现由int到float的类型转换，最多使用操作数量位30。

实现原理：输入的数是个整型数，将整型数转换成浮点数表示，需要掌握浮点编码格式，以及浮点的精度表示问题。

具体看实现代码的注释。

实现代码：unsigned float_i2f(int x){unsigned s = 0;unsigned r = 0;unsigned e = 0, flag = 0, t;int c = 0;//0非规格化表示，直接返回0即可if (x == 0)return 0;if (x < 0){//转换成正整数//并设置符号位s = 0x80000000;r = -x;}else r = x; //符号位为0//确定尾数M，并记录左移的次数为计算阶码做准备while(!(r&0x80000000)){r = r<<1;c = c+1;}//此处是进位处理此时r包含尾数的隐含位因此舍弃的正好//是r的末尾8位，先得到末尾8位的值，如果大于0.5直接进//位,小于0.5直接舍弃，等于0.5时判断前面一位是0还是1，//来决定是否进位t = r&0xFF;if (t > 0x80)flag = 1;else if (t < 0x80)flag = 0;else if (t == 0x80)if (r&0x100)flag = 1;else flag = 0;//得到尾数，注意包含隐含位r = r>>8;//确定阶码为得到尾数将r左右成第31位为1，可以认为小数//点的位置在31位，输入的是整数，小数点在0的位置，而原来//小数点的位置就是31-c就是指数,e = 31-c+127;//进位r = r+flag;//考虑进位后是否会造成r最高位向左扩展if(r&0x1000000){r = r>>1;e = e+1;}//舍掉隐含位r = r&0x7fffff;r = r|(e<<23)|s;return r;}实验3：编写函数unsigned float_twice(unsigned uf)，返回2倍uf的浮点型位级表示，最多可使用30个操作符，实现原理：要考虑浮点数的非规格化和规格化表示，首先要处理正负无穷的情况，正负无穷要原封返回。

ieee754标准的32位规格化浮点数,所能表达的最大正数为

ieee754标准的32位规格化浮点数,所能表达的最大正数为IEEE 754是一种标准，用于表示和计算浮点数。

在32位标准化浮点数中，有1位符号位，8位指数位，以及23位尾数位。

这种格式允许我们表达范围很广的数字，从负无穷到正无穷，包括零、无穷和NaN （非数字）。

在32位标准化浮点数中，最大的正数可以通过以下方式来计算：将所有的指数位都设置为1，然后将尾数位设置为全1，符号位设置为0，即正数。

根据IEEE 754的规定，指数位中全为1的情况是保留给特殊数值的，即无穷和NaN，所以32位浮点数中没有正无穷，只能表示一个比较接近的数。

根据IEEE 754标准，指数位的最大值为255。

在32位浮点数中，指数位的编码是用阶码表示，阶码是指数位减去偏移值（127），所以最大的指数位编码是255-127=128。

这意味着最大的指数位是128，对应的指数为2^128。

尾数位中的全1表达的是(1-2^(-23))，所以最大正数可以表示为(2-2^(-23)) * 2^128。

将(2-2^(-23)) * 2^128转换为十进制数，我们可以得到一个非常大的数字。

接下来，我将逐步进行计算：(2-2^(-23)) * 2^128 ≈ (2 * 2^23 - 1) * 2^128= (2^24 - 1) * 2^128≈ 1.6777216 * 10^7 * 2^128现在，我们需要找到2^128的近似值。

由于2^10 ≈ 10^3，我们可以通过对指数值进行适当的调整来近似计算2^128。

2^128 ≈ 10^(128 * log10(2))≈ 10^(128 * 0.301)≈ 10^(38.528)≈ 10^39所以，(2-2^(-23)) * 2^128 ≈ 1.6777216 * 10^7 * 10^39≈ 1.6777216 * 10^(7+39)≈ 1.6777216 * 10^46因此，32位标准化浮点数可以表示的最大正数约为1.6777216 * 10^46。

数值数据和文本数据的编码

数值数据和文本数据的编码数值数据和文本数据是计算机表示和处理信息的两种基本形式。

数值数据是指由数字组成的数据，用于表示数量、大小、度量等，通常用于进行数值计算和统计分析。

而文本数据是指由字符和字符串组成的数据，用于表示语言文字、描述、评论等，通常用于文本挖掘、自然语言处理等任务。

编码是将数据转换为计算机可以理解和处理的形式的过程，主要包括数据的存储、传输和表示方式等。

下面将分别介绍数值数据和文本数据的编码方式及其相关参考内容。

数值数据的编码方式：1. 二进制编码：将数值数据转换为二进制形式进行存储和处理。

常用的二进制编码方式有原码、反码和补码等。

参考内容：《计算机组成原理》（教材）。

2. BCD编码：二进制编码的十进制表示，将每个十进制数转换为对应的4位二进制数。

参考内容：《数字逻辑与计算机设计基础》（教材）。

3. 浮点数编码：用于表示小数或大数的一种表示方法，包括单精度浮点数和双精度浮点数等。

参考内容：《深入理解计算机系统》（书籍）。

文本数据的编码方式：1. ASCII编码：使用7位二进制数表示128个字符，包括英文字母、数字和常用符号等。

参考内容：《编码：隐匿在计算机软硬件背后的语言》（书籍）。

2. Unicode编码：用于表示全世界范围内的字符集，包括各种语言文字、符号、表情等。

参考内容：《Unicode字符集术语与定义》（国际标准）。

3. UTF-8编码：一种变长的Unicode编码，用于在计算机中存储和传输Unicode字符。

参考内容：《The Unicode Standard》（官方文档）。

4. 自然语言处理编码：用于对文本进行特定任务的编码方式，如词袋模型、Word2Vec、BERT等。

参考内容：《Deep Learning for Natural Language Processing》（学术论文）。

总结：数值数据和文本数据的编码方式有很多种，每一种编码方式都有其适用的场景和特点。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2
阶——移码(增码)
8位机器数，移码表示：真值在数轴上向右平移了27(128)个位置移码。
负数
正数 +127
0 机器数 -128 用0~255表示-128~127。
3
阶——移码(增码)
[x]移=2n-1+x (-2n-1x2n-1-1) 讨论： 1. 表示范围：-2n-1x2n-1-1，与补码相同。 2. [-2n-1]移=00…0， [-2n-1]补=1？0…0 3. 零的移码表示唯一：
浮点数的编码表示
阶码一般用移码表示，便于比较大小——通过机器数比较真值。
1
n-1 n-2
………
210
阶——移码(增码)
定义：设阶为x，阶码E位数为n，则： [x]移=2n-1+x (-2n-1 x 2n-1-1)
X1 = 0101 0101 [X1]补 = 0101 0101 [X1]移 = 1101 0101 X2 = -0101 0101 [X2]补= 1010 1011 [X2]移= 0010 1011
=-0.100000000129
浮
8位阶码为：[9]补=0000 1001
点
24位尾数为：[-0.100 0000 001]补
表
=1.011 1111 1110 0000 0000 0000
示
-256.5的浮点表示格式为：
0000 1001 1011 1111 1110 0000 0000 0000
原码规格化后：正数0.1…，负数1.1… 补码规格化后：正数0.1…，负数1.0… 一般机器规定，若底为2并用调补整码为表-1示尾数，
则规格化数的标志为：尾数的符号位和数值部分最高位具有
不同的代码。
11
浮点数的规格化处理
非规格化的尾数规格化通过尾数移位和修改阶码实现。
如R=2时：
0.0101123= 0.101122
0
n
2xn
4xn
浮点数的密度
21
为了便于软件移植，使用 IEEE(电气和电子
工程师协会)标准。
浮 IEEE754标准：尾数用原码；阶码用移码；
点
底为2。规格化，隐藏位。
数单精度和双精度两种浮点数格式：
的 1. 单精度格式(32位)
标
1位 8位
阶码
准
符号位
格 2. 双精度格式(64位)
式
1位 11位
3. 已知原码，求补码、反码
[x]原=1.00111 6. 已知补码，求真值
[x]原=110100
[x]补=10000000 [x]补=11010011
7. 已知下列字符编码，求e,f,7,G,Z,5的7位 ASCII码。
A=100 0001 a=110 0001 0=011 0000
8. 在第七题的各个编码的高位前，加入奇校验位
2. 写出这种格式所能表示的范围，并与12 位定点补码整数和定点补码小数的表示范围进行比较。
27
阶码
23位
尾数
52位
尾数
符号位
规格化：个位为1，隐藏个位。
偏置常数：2n-1-1
浮例：将100.25转换成短浮点格式。
点 (1) 将十进制转换为二进制数
Байду номын сангаас
数 (100.25)10 =(1100100.01)2
(2) 规格化
的
1100100.01 = 1.100 1000 126
标 (3) 阶码=0000 0110+0111 1111=1000 0101
01
78
31
尾数规格化
一个浮点数有不同的表示： 0.101120 =0.0101121=0.00101122 规格化的目的： 1. 为了充分利用尾数的有效位数，提高表
示精度； 2. 为了数据表示的唯一性。避免浪费编码规格化的尾数：绝对值大于或等于1/R，R
为尾数的底。
10
尾数规格化
非0浮点数，尾数规格化后满足条件： |M|1/2(R=2时)
左规：尾数左移 1 位，阶码减 1
右规：尾数右移 1 位，阶码加 1
1.01123= 0.101124
12
例：设某机器用32位表示一个实数，阶码部
浮
分8位(含1位阶符)，用定点整数补码表
点
示；尾数部分24位(含数符1位)，用规格
表
化定点小数补码表示，底为2。
示
求y=-256.5的浮点表示格式。
y = -(256.5)10 = -(1 0000 0000.1)2
1) 一些机器中，数值用补码存储、补码运算。 2) 有些机器中，数值用原码进行存储和传送，
运算时改用补码。 3) 有些机器在做加减运算时用补码表示，在做
乘除运算时用原码表示。
8
例1 将十进制数65798转换为下述浮点数格式(32位)
01
78
31
数符阶码
尾数
0位：数符S
浮
1-7位：7位阶码E，移码表示(偏置常数=26 ) 8-31位：24位尾数M，原码定点小数
示
尾数：M=1000 0000 1000 0011 0000 0000
浮点数表示为：
0 10010001 00000001000001100000000
01
89
31
16进制表示：48808300H
例：若浮点数x的二进制存储格式为(41360000)16，求其32位浮点数的十进制真值。
解：
0100 0001 0011 0110 0000 0000 0000 0000
编码的16进制表示为：09BFE000H
浮点数的溢出判断
判断规格化后的阶码：
x = M×RE
上溢：浮点数阶码大于机器最大阶码
处理方法——中断。下溢：浮点数阶码小于机器最小阶码
处理方法——零处理。
上溢区负数区下溢正数区上溢区 0
15
隐藏位技术
原码规格化后：正数0.1…，负数1.1… 数值最高位必定为1。隐藏位技术：
2. 将下列十进制数表示成浮点规格化数，阶码4位（包括1位阶符），用补码表示；尾数10位（包括1位尾符），用补码表示，底R=2。
（1） 27/64 （2） -27/64
26
浮点作业
3．设浮点数的格式为：
数符
1位
阶码
5位移码
尾数
6位补码
1. 设阶码的底为4，要求用这种格式表示下列十进制数：+19，-1/8；
示
规格化尾数的第一位总是1，故不保存。
即虽只有23位，但可表示24位数据。
阶码的底：R=2。
01
89
31
数符阶码
尾数
解：
浮
(65798)10=(10106)16=(1 0000 0001 0000 0110)2
点
= (0.1000 0000 1000 0011)2×217
数符： S=0
表
阶码：E= (128+17)10=(1001 0001)2
准 (4) 浮点编码
格
0 1000 0101 100 1000 1000 0000 0000 0000
式
浮点编码：42C88000H
1位 8位
23位
阶码
尾数
符号位
作业
1. 实现下列各数的转换
(101101.011)2=( )10=( )8=( )16=( )8421
2. 机器字长8位，1位符号位，求原码、反码、补码。-0.010100
在保存浮点数到内存前，通过尾数左移，强行把最高位去掉；
用同样多的尾数位可多存一位二进制数；有利于提高数据表示精度。
说明：在取回浮点数到运算器执行运算时，必须先恢复隐藏位。
16
例将十进制数65798转换为下述典型的32位浮点数格式。
01
89
31
数符阶码
尾数
浮
点
0位：数符S
表
1-8位：8位阶码E,移码表示(偏置常数=128) 9-31位：23位尾数M,原码定点小数。
[+0]移 = [-0]移 = 2n-1 = 10…0
4
真值x (十进制)
真值x (二进制)
x移 (+27)
x补 (+28)
-128 -1000 0000 0000 0000 1000 0000
-127 -0111 1111 0000 0001 1000 0001
-1
-0000 0001 0111 1111 1111 1111
31
数符阶码
尾数
同样字长的定点、浮点表示，浮点数的表示范围和精度都要高得多。
说明：表示范围：取决于阶码位数。
浮
精度：取决于尾数位数。
点
表
示
定点表示与浮点表示
讨论： 1. 相同字长(如32位)的定点数与浮点数(规
格化)能表示数的个数是相同的； 2. 定点数分布是等距且紧密的，而浮点数
分布是不等距且稀疏的，越远离原点越稀疏。
24
浮点作业
1. 有一个字长为32位的浮点数，阶码10位（包括1位阶符），用移码表示；尾数22 位（包括1位尾符）用补码表示，基数 R=2。请写出：
(1) 最大数的二进制表示； (2) 最小数的二进制表示； (3) 规格化数所能表示的数的范围； (4) 最接近于零的正规格化数与负规格化数。
25
浮点作业
移
0
0000 0000 1000 0000 0000 0000
+1
0000 0001 1000 0001 0000 0001
码
+127 0111 1111 1111 1111 0111 1111