关于float类型在计算机中的表示形式,我参照link1和link2
之后有了一个大概的了解。
4字节的浮点数float在正数部分的表示范围为1*2^(-126) ~ 2*2^127,但是当我将2^60赋值给一个float类型的变量的时候,我得到的输出的后几位为0,代码如下:
#include <iostream>
#include <math.h>
#include <bitset>
using namespace std;
int main()
{
float data = pow(2, 60);
cout.precision(20);
cout << data << endl;
printf("%f", data);
}
输出为:
1152921504606847000
1152921504606847000.000000请按任意键继续. . .
很明显,最后的几位为0,无法表示,但是这和上面的“4字节的浮点数float在正数部分的表示范围为1*2^(-126) ~ 2*2^127”是矛盾的。
我进一步使用bitset将float变量对应的4字节的二进制位输出,代码如下:
#include <iostream>
#include <math.h>
#include <bitset>
using namespace std;
int main()
{
union
{
float input; // assumes sizeof(float) == sizeof(int)
int output;
} data;
data.input = pow(2, 60);
std::bitset<sizeof(float) * CHAR_BIT> bits(data.output);
std::cout << "Total: " << bits << std::endl;
cout << "S: " << bits[31] << endl << "E: ";
for (int i = 30; i > 22; i--)
{
cout << bits[i];
}
cout << endl << "M: ";
for (int i = 22; i >= 0; i--)
{
cout << bits[i];
}
cout << endl;
cout.precision(20);
cout << data.input << endl;
printf("%f", data.input);
}
最后的输出结果如下:
Total: 01011101100000000000000000000000
S: 0
E: 10111011
M: 00000000000000000000000
1152921504606847000
1152921504606847000.000000请按任意键继续. . .
从输出结果看出,指数位的二进制表示为10111011相当于十进制的187,187-127=60,确实能表示2^60,但是为什么输出之后就出错了呢?
我在stack overflow上找到了比较合理的回答: link
这不是32-bit float精度的问题,而是visual studio软件本身对十进制数显示的机制造成的。
没有毛病
表示范围说的是近似值的表示范围,而不是可以精确表示的范围。
实际上,如果要精确表示,浮点数别说那么大的数字,就是普普通通的 0.1 它都表示不了。
因为二进制的 0.1 是一个无穷循环小数,无论尾数有多少位,都不够
我的理解是:pow调用了int参数的形式,所以越界了。(int最大是2^31-1,而long long最大是2^63-1,是可以的)