utf8编码方式下, 一个汉字, 可能2字节, 可能3字节, 可能4字节
现有一个字节数组, 里面是utf8编码的汉字
现在,要统计汉字的个数
咋整?
把utf8编码转换成unicode16。然后就所有汉字都变成双字节了。这个长度字节数除以二就是汉字个数l
还有别的方法吗
如果需求改变, 要统计出现过的每个汉字, 各出现过几次, 又该如何做呢
在java中, 如何表示一个汉字, 有没有别人已经封装好的现成的类?
我不想用字节字节数组或者char数组来表示汉字
如果用Java,直接解析后用string.getLength就可以得到长度了,按照字符而不是字节计算的