工作需要,想要实现一个可以产生随机数据的小程序。目前必须实现的是ASCII,GBK,UTF8这三种字符集的数据。
请教诸位大神,UTF8编码的数据如何随机产生?
目前我找到的说法是UTF-8编码规则中说的,于是想法是通过一个长度为7的unsigned char数组存储UTF8编码某个字符的每个字节。通过取余后再加上某值的方法保证每个字节都在范围内,可是生成的数据输出到文件后,用UE打开非ASCII字符总会乱码,应该是数据有问题。
请教诸位大神,有什么更好的方法么?
什么叫乱码。如果你从utf8字符集中随机取字符,那么得到的文本必然都是“乱码”,因为这个字符集光汉字就有十多万,而一般人认识的汉字不足一万。
建议你先从5000或者8000常用汉字表中随机取字符,得到字符串,最后再转码为utf8。