最近在网上发现有人说GB2312编码格式可能一些繁体或生辟字无法显示,但是为什么浏览器里可以用GB2312正常显示呢,譬如:囧这个字,还有,我发现在日文系统下使用java socket请求中文网页,譬如www.qq.com,取到的内容转成GB2312编码格式后,有好小部分的中文
无法正常显示,都是显示的?号,但是到中文系统下,却能正常显示,这是为什么呢?请大侠们解答
你看下浏览器用的字体跟你软件显示用的字体是不是一种。
我记得是不一样的,日文系统默认是MS Gothic吧。
IE有自己的一套字体的。Firefox好像 也是用系统字体。
gb2312之上还有个gbk大字符集,支持1万多字。
gb2312是标准中文字符集。所以在日文系统有小部分中文无法显示很正常!
1. gb2312只能处理各自语言范围之内的 UNICODE 字符。
2. 现在都推荐使用UTF-8,能够处理所有的 UNICODE 字符。
UTF-8 是 UNICODE 的一种变长字符编码,即 RFC 3629。简单的说——大字符集。可以解决多种语言文本显示问题,从而实现应用国际化和本地化。对系统来讲,UTF-8 编码可以通过屏蔽位和移位操作快速读写,排序更加容易。UTF-8 是字节顺序无关的,它的字节顺序在所有系统中都是一样的。因此 UTF-8 具有更高的性能。
GB2312是GBK的子集,GBK是GB18030的子集。
GBK是包括中日韩字符的大字符集合。
如果是中文的网站 推荐GB2312,GBK有时还是有点问题。
为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便,UTF-8可以看作是大字符集,它包含了大部分文字的编码。
使用UTF-8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看你的文字而不会出现乱码。
还有个字体支持的字符集的问题。
日文字体里包含部分中文,但是,不是全部包含,有些字符代码找不到对应的字而己
你把Eclipse的字体换成跟IE用的一样试试。
Firefox好像 也是用系统字体,也有部分不能正常显示。