怎么区分gbk编码里的中文和英文?判断方式是什么?

英文字节范围是0-127,中文首字节是81-fe,尾字节是40-fe,但是中文首字节和尾字节没办法区分谁在前面谁在后面,如果是一串汉字从中间截取SIZE个字节写进buffer数组的话读的时候可能会乱码,怎么才能按照原来的首字节和尾字节切分开?不出现乱码呢?

这是什么鬼,为什么会有人把汉字转的byte数组中间截取出一部分?
那如果某个汉字刚好被从低字节截取了,肯定只剩下半个字了,那怎么可能不乱码呢