我在用pandas 处理数据的时候遇到个奇怪问题。
我原本试用Dataframe的两列做加法运算,然后与其另外一列作比较,再过滤不相等的数据,结果集集很奇怪,明明相等的计算结果,判断结果就是不相等。
后来我进行验证,发现个python加法运算的奇怪问题,例如:
print(17.432+0.909)
输出结果却是18.340999999999998,百思不得其解!求高人指点!
原因解释:
浮点数(小数)在计算机中实际是以二进制存储的,并不精确。
比如0.1是十进制,转换为二进制后就是一个无限循环的数:
0.00011001100110011001100110011001100110011001100110011001100
python是以双精度(64bit)来保存浮点数的,后面多余的会被砍掉,所以在电脑上实际保存的已经小于0.1的值了,后面拿来参与运算就产生了误差。
解决办法:
使用decimal库
from decimal import *
In [17]: 6.6*3
Out[17]: 19.799999999999997
In [18]: Decimal('6.6')*3
Out[18]: Decimal('19.8')
当精度提升的同时,也必然牺牲性能。有时候是值得的,比如在财务对数据精度要求比较高的情况下。
正常,小数都不是绝对精确的小数。