大家在日常开发中,必然使用过浮点数,也会发现浮点数不是精确的,那究竟是什么原因造成的呢?
奇怪的结果
var_dump((1-0.9) == 0.1);
//输出:bool(false)
很奇怪吧!1-0.9怎么能不等于0.1呢?这是为什么呢?这要从浮点数的储存标准开始说。
IEEE 754
浮点数在计算机中是根据IEEE 754
(二进制浮点数算数标准)储存的。
计算公式为: (-1)^S x M x 2^E
32位单精度储存结构(对应占位)
符号(S) | 阶码(E) | 尾数(M) |
---|---|---|
1 | 8 | 23 |
64位双精度储存结构(对应占位)
符号(S) | 阶码(E) | 尾数(M) |
---|---|---|
1 | 11 | 52 |
解释:
- S: 符号(0正,1负)
- E: 阶码(指数)
- M: 尾数(二进制小数,数字的实体部分)
M(尾数)和E(阶码)不同情况需要分别对待
E(阶码)的三种状态及对应的M表示
从图中(截图于深入理解计算机系统)我们可以分为三种情况(第三种又分为两种特殊情况)
规格化
E既不等于0也不等于255(将S按十进制计算),这个时候的E=E-127
,M的二进制小数默认省略了1.
,也就是M=1.M(二进制小数)
我们做一个简单的测试看一下二进制00111110001000000000000000000000
(32位)表示的对应的浮点数为多少?
- 首先拆分二进制:
0
01111100
01000000000000000000000
- E = 124 = 124 - 127 = -3
- M = 1.01000000000000000000000
- 套公式: 1 x 1.01000000000000000000000 x 2^-3 = 0.00101000000000000000000000 = 2^-3 + 2^-5 = 0.15625
使用PHP验证一下结果:
var_dump(unpack('f', pack('l', bindec('00111110001000000000000000000000')))[1]);
//输出: float(0.15625)
上面的例子没有丢失精度,下面看一个丢失精度的例子:
printf('%032s', decbin(unpack('l', pack('f', 1/3))[1]));
//输出: 00111110101010101010101010101011
var_dump(unpack('f', pack('l', bindec('00111110101010101010101010101011')))[1]);
float(0.33333334326744)
丢失精度最主要原因就在于M(二进制小数),我们只能精确的表示2^n倍数的数(2^-1(0.5),2^-2(0.25),2^-3(0.125)...),丢了在所难免。
非规格化
E等于0,这个时候E=-126
,M的二进制小数前缀为0.
,也就是M=0.M(二进制小数)
,具体过程就不写了,和上面类似
特殊情况
E等于255(全部位都为1),如果M全部为0,那么表示为无穷大,否则表示为NaN(不是一个数)
var_dump(unpack('f', pack('l', bindec('01111111100000000000000000000000')))[1]);
//输出: float(INF)
var_dump(unpack('f', pack('l', bindec('01111111100000000000000000000110')))[1]);
//输出: float(NAN)
不要比较浮点数
总之,浮点数是不准确的。尤其在我们日常工作中,不要比较浮点数的大小,如果需要精确的比较计算,请使用bc*
系列函数。
还有一点,浮点数不准确和PHP没有任何关系,PHP不背这个锅。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。