浮点数存储

合集下载

浮点数单精度浮点数与双精度浮点数在计算机中的存储

浮点数单精度浮点数与双精度浮点数在计算机中的存储

浮点数单精度浮点数与双精度浮点数在计算机中的存储浮点数是一种用于表示实数的数学概念,在计算机中以不同的精度进行存储。

单精度浮点数和双精度浮点数分别以32位和64位的二进制格式来表示实数。

单精度浮点数是按照IEEE754标准规定的,它使用32位来存储一个浮点数。

它将这32位划分为三个部分:符号位、指数位和尾数位。

具体来说,其中1位用于表示符号位(0表示正数,1表示负数),8位用于表示指数位,23位用于表示尾数位。

指数位用于表示浮点数的大小范围,尾数位用于表示浮点数的精度。

单精度浮点数可以表示的范围是从2的-126次方到2的127次方之间。

双精度浮点数也遵循IEEE754标准,它使用64位来存储一个浮点数。

它将这64位划分为三个部分:符号位、指数位和尾数位。

其中1位用于表示符号位,11位用于表示指数位,52位用于表示尾数位。

双精度浮点数的指数位和尾数位比单精度浮点数更长,因此双精度浮点数的精度更高。

双精度浮点数可以表示的范围是从2的-1022次方到2的1023次方之间。

在计算机中,浮点数的存储会存在一定的舍入误差。

这是因为浮点数的二进制表示是有限的,无法准确表示一些实数。

舍入误差会在浮点数的运算和比较中产生影响,可能导致计算的结果和预期不一致。

因此,在使用浮点数进行计算时,需要注意舍入误差的问题,并采取相应的处理措施,如四舍五入或使用更高精度的类型来存储浮点数。

总之,浮点数的存储以单精度和双精度形式存在于计算机中。

单精度浮点数以32位二进制格式存储,双精度浮点数以64位二进制格式存储。

浮点数的存储使用二进制科学计数法,其中包括符号位、指数位和尾数位。

在计算机中存储浮点数会存在一定的舍入误差,需要注意处理。

float存储原理

float存储原理

float存储原理Float是一种数据类型,它在计算机中的存储方式与整数等其他数据类型略有不同。

在本文中,我们将探讨Float的存储原理以及其中的细节。

1. Float数据类型Float是一种浮点数数据类型。

浮点数的含义是,在一个数中,小数点的位置可以“漂浮”不固定,这就使得浮点数的表示范围更广泛。

而Float则是专门用于表示单精度浮点数。

2. 存储方式Float类型是基于IEEE 754标准而设计的。

这个标准规定了不同精度的浮点数的二进制表示方式。

对于Float类型,它采用了32位二进制编码来存储。

Float数据类型的二进制编码包括3个部分:符号位、指数和尾数。

符号位用来表示这个浮点数是正数还是负数。

指数用来表示小数点的位置。

而尾数则是浮点数的小数部分,也就是有效数字。

3. 符号位Float类型的符号位由1个二进制位来表示。

如果这个二进制位为0,那么这个浮点数就是正数;如果为1,就是负数。

4. 指数Float类型的指数用8个二进制位来表示。

这8个位可以用2的补码来表示,其范围从-127到+128。

其中,-127表示最小的指数,而+128表示最大的指数。

我们可以通过这个指数来控制浮点数的大小范围。

5. 尾数Float类型的尾数占用23个二进制位。

这23个二进制位表示浮点数小数部分的有效数字。

尾数的最高位是1,因为所有的浮点数都是1.xxxxxx…的形式。

因此,在存储时,最高位可以忽略不计。

6. 存储细节对于Float类型的存储,需要注意以下几点细节:1) 对于所有的指数位为0的浮点数,它们的值都是0,不论尾数为何。

2) 不能存储所有的实数,因为尾数只有23位,而实数具有无限位。

因此,当尾数无法存储所有有效数字时,就会产生舍入误差。

3) 对于Float类型的最大值和最小值,可以通过指数来计算。

最大值为(1-2^(-23))x2^127,最小值为-最大值。

4) Float类型的精度是有限的。

它在表示小数时会产生精度误差。

浮点数在内存中的存储方式

浮点数在内存中的存储方式

浮点数在内存中的存储方式
浮点数是存储浮点计算结果的一种常见数据类型,可以用来表示介于有理数和无理数
之间的数值。

在内存中,浮点数通常以“浮点编码”形式进行存储,其表示方法有IEEE-754标准,按照该标准,浮点数可以用32位或64位表示。

IEEE-754标准,32位浮点编码的存储格式如下:首先用一位来表示有效数字的符号,即正数时为0,负数时为1,后面接8位无符号表示指数域,再接23位有符号表示尾数域。

一般来说,在当前系统中,IEEE-754标准可以分为单精度浮点数(32位)和双精度
浮点数(64位)。

单精度浮点数的存储格式如上所述:第一位为符号位,接下来的八位位指数域,然后是尾数域。

指数域是由八位“2的次幂”组合而成的,尾数域是有效数字的
连续序列。

而双精度格式(64位)的存储形式同样遵循IEEE754标准,区别在于:双精度格式符号位和指数域都是一位,而且指数域长度为11位;尾数域长度则增加到52位。

其存储格
式如下:第一位为符号位,接着是11位指数域,最后跟着52位尾数域。

指数域仍不变,根据尾数域存储了更多的有效数字,因此可以储存较大的数,这就是
双精度格式的优势。

另外,因为双精度格式能够存储更多的位数,可以更为精确地存储我
们的数据,因此,在数值计算中,双精度浮点数常常被使用。

浮点数存储方式

浮点数存储方式

浮点数存储⽅式|--浮点数怎么存储在计算机中 浮点型变量是由符号位+阶码位+尾数位组成。

float型数据⼆进制为32位,符号位1位,阶码8位,尾数23位 double型数据⼆进制为64位,符号位1位,阶码11位,尾数52位|--单精度32位存储 1bit 8bit 23bit|--双精度64位存储 1bit 11bit 52bit 浮点数⼆进制存储形式,是符号位+阶码位+尾数位(针对有符号数) 浮点数没有⽆符号数(c语⾔)|--阶码: 这⾥阶码采⽤移码表⽰,对于float型数据其规定偏置量为127,阶码有正有负, 对于8位⼆进制,则其表⽰范围为-128-127,double型规定为1023,其表⽰范围为-1024-1023 ⽐如对于float型数据,若阶码的真实值为2,则加上127后为129,其阶码表⽰形式为10000010|--尾数: 有效数字位,即部分⼆进制位(⼩数点后⾯的⼆进制位), 因为规定M的整数部分恒为1(有效数字位从左边不是0的第⼀位算起),所以这个1就不进⾏存储|--具体步骤: 把浮点数先化为科学计数法表⽰形式,eg:1.1111011*2^6,然后取阶码(6)的值加上127(对于float) 计算出阶码,尾数是处⼩数点后的位数(1111011),如果不够23位,则在后⾯补0⾄23位。

最后,符号位+阶码位+尾数位就是其内存中⼆进制的存储形式1 eg:2 #include <stdio.h>3 #include <stdlib.h>4 int main(int argc, char *argv[])5 {6 int x = 12;7 char *q = (char *)&x;8 float a=125.5;9 char *p=(char *)&a;1011 printf("%d\n", *q);1213 printf("%d\n",*p);14 printf("%d\n",*(p+1));15 printf("%d\n",*(p+2));16 printf("%d\n",*(p+3));17return 0;18 }1920 output:21 1222 023 024 -525 66|--对于float型: 125.5⼆进制表⽰为1111101.1,由于规定尾数的整数部分恒为1, 则表⽰为1.1111011*2^6,阶码为6,加上127为133,则表⽰为10000101 ⽽对于尾数将整数部分1去掉,为1111011,在其后⾯补0使其位数达到23位, 则为11110110000000000000000 内存中的表现形式为: 00000000 低地址 00000000 11111011 01000010 ⾼地址 存储形式为: 00 00 fb 42 依次打印为: 0 0 -5 66 解释下-5,内存中是:11111011,因为是有符号变量所以符号位为1是负数, 所以其真值为符号位不变取反加⼀,变为:10000101化为⼗进制为-5.。

浮点数的存储格式

浮点数的存储格式

浮点数的存储格式C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= 2.25f的时候,是如何分配内存的呢?如果胡乱分配,那世界岂不是乱套了么,其实不论是f loat还是double在存储方式上都是遵从IEEE的规范的,float遵从的是IEEE R32.24 ,而double 遵从的是R64.53。

无论是单精度还是双精度在存储中都分为三个部分:∙符号位(Sign) : 0代表正,1代表为负∙指数位(Exponent):用于存储科学计数法中的指数数据,并且采用移位存储∙尾数部分(Mantissa):尾数部分其中float的存储方式如下图所示:而双精度的存储方式为:R32.24和R64.53的存储方式都是用科学计数法来存储数据的,比如8.25用十进制的科学计数法表示就为:8.25*,而120.5可以表示为:1.205*,这些小学的知识就不用多说了吧。

而我们傻蛋计算机根本不认识十进制的数据,他只认识0,1,所以在计算机存储中,首先要将上面的数更改为二进制的科学计数法表示,8.25用二进制表示可表示为1000.01,我靠,不会连这都不会转换吧?那我估计要没辙了。

120.5用二进制表示为:1110110.1用二进制的科学计数法表示1000.01可以表示为1.0001*,1110110.1可以表示为1.1101101*,任何一个数都的科学计数法表示都为1.xxx*,尾数部分就可以表示为xxxx,第一位都是1嘛,干嘛还要表示呀?可以将小数点前面的1省略,所以2 3bit的尾数部分,可以表示的精度却变成了24bit,道理就是在这里,那24bit能精确到小数点后几位呢,我们知道9的二进制表示为1001,所以4bit能精确十进制中的1位小数点,24bit就能使float能精确到小数点后6位,而对于指数部分,因为指数可正可负,8位的指数位能表示的指数范围就应该为:-127-128了,所以指数部分的存储采用移位存储,存储的数据为元数据+127,下面就看看8.25和120.5在内存中真正的存储方式。

float数

float数

float数float数,又称单精度浮点数,是一种浮点数格式,在计算机语言中常用作数据类型。

下面就float数的概念和特点进行详细介绍:一、float数的概念1. float数的定义:float数是指由浮点数格式进行存储的数据类型。

浮点数格式去描述实数,它有两个组成部分——符号位和有效系数,其中有效系数可以被表示为有效数字序列。

2. float数的特点:float数以二进制方式表示,它只能精确表示有限长度的实数值,该值保留固定长度的有效位,长度的值取决于程序设计时所定义的参数。

二、float数的存储1. 存储形式:float数通常使用二进制存储,一般以32位或 64位的二进制串的形式进行存储。

而其中的每一位都有其特定的含义,首先它的正负号位表示数的符号,之后就是它的实部了,最后则是它的小数部分。

2. 存储原理:float数通常是以浮点形式表示其内容,由实部和虚部组成,即使用以下方程来表示:float(x)=s·E·B^e,其中s为符号位,E为有效位,B^e表示由指数E和基数B决定的倍率。

三、float数的应用1. 经常使用float数来表示有理数,因为它可以使用最少的二进制位表示出有理数的值。

2. 它可以用来处理非常大的和非常小的数值,这使它成为抽象数据类型的实现非常有效的工具。

3. 同时,由float数来存储有重要的科学计算,比如天文学、物理学等,都可以更加精确地处理。

总结:float数是由浮点数格式进行表示的数据类型,其存储形式为32位或64位的二进制串,可以有效地表示有理数,并且它可以用来处理有非常大和非常小的数值,应用范围广泛,精确度高。

浮点数在内存中的存储方式

浮点数在内存中的存储方式

浮点数在内存中的存储⽅式1、在使⽤switch(value)时,value的类型可以是浮点吗?2、判断浮点数是否相等时,可以⽤float f1,f2; if(fi==f2){do something;}吗?都不可以。

这涉及浮点数在内存中的存储⽅式。

⼀、float型在内存中占4字节,double占8字节。

单精度float在内存中的存储格式如下图(1位符号位S,8位指数位E,23位有效数字M):双精度double在内存中的存储格式如下图(1位符号位S,11位指数位E,52位有效数字M):本⽂主要说单精度浮点型float,double类似。

(-1)^S * M * 2^E(-1)^S表⽰正负,S=1时为负,S=0时为正;M表⽰有效数字,1<=M<2;2^(E-127)表⽰指数位。

如⼗进制8.125,将其转化成⼆进制形式:对于整数部分8:8/2 商:4 余:04/2 商:2 余:02/2 商:1 余:01/2 商:0 余:1余数逆序,所以8的⼆进制为:1000对于⼩数部分0.125,:0.125*2 整数:0 ⼩数:0.250.25*2 整数:0 ⼩数:0.50.5*2 整数:1 ⼩数:0整数部分正序,所以0.125的⼆进制为:001所以8.125的⼆进制形式为:1000.001,即1.000001 * 2^3。

因是正数,所以,S=0;因M表⽰有效数字,1<=M<2,所以M=1.xxxxxxx,其中⼩数点前的1是固定的,可省略,则M只需要表⽰⼩数点后的数即可,故可⽤23位有效数字表⽰M部分,则8.125的M部分为 000 0010 0000 0000 0000 0000;⽽E部分8位是unsigned char,范围为0~255,但科学计数法的指数部分有正有负,故整体偏移127,⽤0~255来表⽰-127~128,所以8.125的指数E部分,实际写的是E:3+127=130=1000 0010,综上:8.125在内存中的存放bit为 0 1000 0010 000 0010 0000 0000 0000 0000 0000 ,即0x41020000程序验证⼀下:float f=8.125f;unsigned char *p = (unsigned char *)&f;printf("%x %x %x %x\n",p[0], p[1], p[2], p[3]);结果:0 0 2 41⼩端存储模式,低字节在前,⾼字节在后。

计算机内浮点数的储存格式

计算机内浮点数的储存格式

计算机内浮点数的储存格式通常采用IEEE 754标准,这是一种广泛使用的浮点数表示方法。

在IEEE 754标准中,浮点数由三个部分组成:符号位、指数位和尾数位。

1. 符号位:符号位用于表示浮点数的正负。

对于每个浮点数,符号位为0表示正数,符号位为1表示负数。

2. 指数位:指数位用于表示浮点数的幂。

在IEEE 754标准中,指数位采用偏移二进制指数表示法,即先将指数值进行偏移,然后转换为二进制形式。

偏移量取决于浮点数的类型(单精度或双精度)。

3. 尾数位:尾数位用于表示浮点数的有效数字。

在IEEE 754标准中,尾数位采用二进制小数表示法,即先将浮点数乘以一个常数,然后舍入到最接近的二进制小数。

尾数的位数取决于浮点数的类型(单精度或双精度)。

在单精度浮点数中,符号位占1位,指数位占8位,尾数位占23位。

在双精度浮点数中,符号位占1位,指数位占11位,尾数位占52位。

除了IEEE 754标准之外,还有一些其他的浮点数表示方法,例如Microsoft的COM类型(使用二进制补码表示法)和Java的double 类型(使用二进制补码表示法)。

但是,IEEE 754标准是最广泛使用的浮点数表示方法之一。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浮点数存储.txt世上最珍贵的不是永远得不到或已经得到的,而是你已经得到并且随时都有可能失去的东西!爱情是灯,友情是影子。

灯灭时,你会发现周围都是影子。

朋友,是在最后可以给你力量的人。

浮点数:浮点型变量在计算机内存中占用4字节(Byte),即32-bit。

遵循IEEE-754格式标准。

一个浮点数由2部分组成:底数m 和指数e。

±mantissa × 2exponent(注意,公式中的mantissa 和 exponent使用二进制表示)底数部分使用2进制数来表示此浮点数的实际值。

指数部分占用8-bit的二进制数,可表示数值范围为0-255。

指数应可正可负,所以IEEE规定,此处算出的次方须减去127才是真正的指数。

所以float 的指数可从 -126到128底数部分实际是占用24-bit的一个值,由于其最高位始终为 1 ,所以最高位省去不存储,在存储中只有23-bit。

到目前为止,底数部分 23位加上指数部分 8位使用了31位。

那么前面说过,float是占用4个字节即32-bit,那么还有一位是干嘛用的呢?还有一位,其实就是4字节中的最高位,用来指示浮点数的正负,当最高位是1时,为负数,最高位是0时,为正数。

浮点数据就是按下表的格式存储在4个字节中:Address+0 Address+1 Address+2 Address+3Contents SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMMS: 表示浮点数正负,1为负数,0为正数E: 指数加上127后的值的二进制数M: 24-bit的底数(只存储23-bit)注意:这里有个特例,浮点数为0时,指数和底数都为0,但此前的公式不成立。

因为2的0次方为1,所以,0是个特例。

当然,这个特例也不用认为去干扰,编译器会自动去识别。

举例1:计算机存储中的二进制数如何转换成实际浮点数通过上面的格式,我们下面举例看下-12.5在计算机中存储的具体数据:Address+0 Address+1 Address+2 Address+3Contents 0xC1 0x48 0x00 0x00接下来我们验证下上面的数据表示的到底是不是-12.5,从而也看下它的转换过程。

由于浮点数不是以直接格式存储,他有几部分组成,所以要转换浮点数,首先要把各部分的值分离出来。

Address+0 Address+1 Address+2 Address+3格式 SEEEEEEE EMMMMMMM MMMMMMMM MMMMMMMM二进制 11000001 01001000 00000000 0000000016进制 C1 48 00 00可见:S: 为1,是个负数。

E:为 10000010 转为10进制为130,130-127=3,即实际指数部分为3.M:为 10010000000000000000000。

这里,在底数左边省略存储了一个1,使用实际底数表示为 1.10010000000000000000000到此,我们吧三个部分的值都拎出来了,现在,我们通过指数部分E的值来调整底数部分M的值。

调整方法为:如果指数E为负数,底数的小数点向左移,如果指数E为正数,底数的小数点向右移。

小数点移动的位数由指数E的绝对值决定。

这里,E为正3,使用向右移3为即得: 1100.10000000000000000000 至次,这个结果就是12.5的二进制浮点数,将他换算成10进制数就看到12.5了,如何转换,看下面:小数点左边的1100 表示为 (1 × 23) + (1 × 22) + (0 × 21) + (0 × 20), 其结果为 12 。

小数点右边的 .100…表示为 (1 × 2-1) + (0 × 2-2) + (0 × 2-3) + ... ,其结果为.5 。

以上二值的和为12.5,由于S 为1,使用为负数,即-12.5 。

所以,16进制 0XC1480000 是浮点数 -12.5 。

举例2:浮点数装换成计算机存储格式中的二进制数。

举例将 17.625换算成 float型。

首先,将17.625换算成二进制位:10001.101 ( 0.625 = 0.5+0.125, 0.5即 1/2, 0.125即1/8 如果不会将小数部分转换成二进制,请参考其他书籍)再将 10001.101 向左移,直到小数点前只剩一位成了 1.0001101 x 2的4次方(因为左移了4位)。

此时我们的底数M和指数E就出来了:底数部分M,因为小数点前必为1,所以IEEE规定只记录小数点后的就好,所以此处底数为 0001101 。

指数部分E,实际为4,但须加上127,固为131,即二进制数 10000011 符号部分S,由于是正数,所以S为0.综上所述,17.625的 float 存储格式就是: 0 10000011 00011010000000000000000 转换成16进制:0x41 8D 00 00 所以,一看,还是占用了4个字节。

本文来自CSDN博客,转载请标明出处:/xiaozhi_su/archive/2009/04/25/4123430.aspx大家都知道任何数据在内存中都是以二进制(1或着0)顺序存储的,每一个1或着0被称为1位,而在x86CPU上一个字节是8位。

比如一个16位(2字节)的short int型变量的值是1156,那么它的二进制表达就是:00000100 10000100。

由于Intel CPU的架构是Little Endian (请参数机算机原理相关知识),所以它是按字节倒序存储的,那么就因该是这样:10000100 00000100,这就是定点数1156在内存中的结构。

那么浮点数是如何存储的呢?目前已知的所有的C/C++编译器都是按照IEEE(国际电子电器工程师协会)制定的IEEE 浮点数表示法来进行运算的。

这种结构是一种科学表示法,用符号(正或负)、指数和尾数来表示,底数被确定为2,也就是说是把一个浮点数表示为尾数乘以2的指数次方再加上符号。

下面来看一下具体的float的规格:float共计32位,折合4字节由最高到最低位分别是第31、30、29、 031位是符号位,1表示该数为负,0反之。

30-23位,一共8位是指数位。

22-0位,一共23位是尾数位。

每8位分为一组,分成4组,分别是A组、B组、C组、D组。

每一组是一个字节,在内存中逆序存储,即:DCBA我们先不考虑逆序存储的问题,因为那样会把读者彻底搞晕,所以我先按照顺序的来讲,最后再把他们翻过来就行了。

现在让我们按照IEEE浮点数表示法,一步步的将float型浮点数12345.0f转换为十六进制代码。

在处理这种不带小数的浮点数时,直接将整数部转化为二进制表示:1 11100010 01000000也可以这样表示:11110001001000000.0然后将小数点向左移,一直移到离最高位只有1位,就是最高位的1:1.11100010010000000一共移动了16位,在布耳运算中小数点每向左移一位就等于在以2为底的科学计算法表示中指数+1,所以原数就等于这样:1.11100010010000000 * ( 2 ^ 16 )好了,现在我们要的尾数和指数都出来了。

显而易见,最高位永远是1,因为你不可能把买了16个鸡蛋说成是买了0016个鸡蛋吧?(呵呵,可别拿你买的臭鸡蛋甩我~),所以这个1我们还有必要保留他吗?(众:没有!)好的,我们删掉他。

这样尾数的二进制就变成了:11100010010000000最后在尾数的后面补0,一直到补够23位:11100010010000000000000(MD,这些个0差点没把我数的背过气去~)再回来看指数,一共8位,可以表示范围是0 - 255的无符号整数,也可以表示-128 - 127的有符号整数。

但因为指数是可以为负的,所以为了统一把十进制的整数化为二进制时,都先加上127,在这里,我们的16加上127后就变成了143,二进制表示为:10001111 12345.0f这个数是正的,所以符号位是0,那么我们按照前面讲的格式把它拼起来:0 10001111 1110001001000000000000001000111 11110001 00100000 00000000再转化为16进制为:47 F1 20 00,最后把它翻过来,就成了:00 20 F1 47。

现在你自己把54321.0f转为二进制表示,自己动手练一下!有了上面的基础后,下面我再举一个带小数的例子来看一下为什么会出现精度问题。

按照IEEE浮点数表示法,将float型浮点数123.456f转换为十六进制代码。

对于这种带小数的就需要把整数部和小数部分开处理。

整数部直接化二进制:100100011。

小数部的处理比较麻烦一些,也不太好讲,可能反着讲效果好一点,比如有一个十进制纯小数0.57826,那么5是十分位,位阶是1/10;7是百分位,位阶是1/100;8是千分位,位阶是1/1000……,这些位阶分母的关系是10^1、10^2、10^3……,现假设每一位的序列是{S1、S2、S3、……、Sn},在这里就是5、7、8、2、6,而这个纯小数就可以这样表示:n = S1 * ( 1 / ( 10 ^ 1 ) ) + S2 * ( 1 / ( 10 ^ 2 ) ) + S3 * ( 1 / ( 10 ^ 3 ) ) + …… + Sn * ( 1 / ( 10 ^ n ) )。

把这个公式推广到b进制纯小数中就是这样:n = S1 * ( 1 / ( b ^ 1 ) ) + S2 * ( 1 / ( b ^ 2 ) ) + S3 * ( 1 / ( b ^ 3 ) ) + ……+ Sn * ( 1 / ( b ^ n ) )天哪,可恶的数学,我怎么快成了数学老师了!没办法,为了广大编程爱好者的切身利益,喝口水继续!现在一个二进制纯小数比如0.100101011就应该比较好理解了,这个数的位阶序列就因该是1/(2^1)、1/(2^2)、1/(2^3)、1/(2^4),即0.5、0.25、0.125、0.0625……。

乘以S序列中的1或着0算出每一项再相加就可以得出原数了。

现在你的基础知识因该足够了,再回过头来看0.45这个十进制纯小数,化为该如何表示呢?现在你动手算一下,最好不要先看到答案,这样对你理解有好处。

我想你已经迫不及待的想要看答案了,因为你发现这跟本算不出来!来看一下步骤:1 / 2 ^1位(为了方便,下面仅用2的指数来表示位),0.456小于位阶值0.5故为0;2位,0.456大于位阶值0.25,该位为1,并将0.45减去0.25得0.206进下一位;3位,0.206大于位阶值0.125,该位为1,并将0.206减去0.125得0.081进下一位;4位,0.081大于0.0625,为1,并将0.081减去0.0625得0.0185进下一位;5位0.0185小于0.03125,为0……问题出来了,即使超过尾数的最大长度23位也除不尽!这就是著名的浮点数精度问题了。

相关文档
最新文档