今天看了下UTF-8与GBK编码,UTF8占用的字节是变化的,而GBK固定的占用2个字节。
我就想问了,像 byte int float 等这些数据类型,都说了占用固定的字节,那它们到底
是在哪个编码规范下定义的占用这么多字节数?
自己给自己顶一下,哪位大牛帮我看一下
byte就是字节的意思,float的规范是ieee754定义的。而int则没有统一的定义,但是现代主流语言/编译器视作4字节,32bit。但是一些早期的C编译器,也有视作2字节/16位的。
int 是由 (CPU寄存器,和操作系统),编译器 决定的
byte C,C++不是内置的
float IEEE 浮点数,其实 也有其他编码的
UTF-8 是字符集再编码,是一种二次编码
ASCII,GBK 是字符集 编码,是原始编码
ASCII是美国字符集编码,只有128个字符
UNICODE 是试图 统一全球字符集的字符编码。有UNICODE16,UNICODE32 两种编码。