使用qrcode.js生成二维码,内容含中文时扫描结果会出现BOM头,阅读源码发现文件中第一个方法QR8bitByte,在处理中文字符之后,判断了处理结果的ASCII码数量是否与原字符串的长度相等,不相等则插入BOM头,实在想不通插入BOM头是什么用意,是故意的还是不小心?求解惑
function QR8bitByte(data) {
this.mode = QRMode.MODE_8BIT_BYTE;
this.data = data;
this.parsedData = [];
// Added to support UTF-8 Characters
for (var i = 0, l = this.data.length; i < l; i++) {
var byteArray = [];
var code = this.data.charCodeAt(i);
if (code > 0x10000) {
byteArray[0] = 0xF0 | ((code & 0x1C0000) >>> 18);
byteArray[1] = 0x80 | ((code & 0x3F000) >>> 12);
byteArray[2] = 0x80 | ((code & 0xFC0) >>> 6);
byteArray[3] = 0x80 | (code & 0x3F);
} else if (code > 0x800) {
byteArray[0] = 0xE0 | ((code & 0xF000) >>> 12);
byteArray[1] = 0x80 | ((code & 0xFC0) >>> 6);
byteArray[2] = 0x80 | (code & 0x3F);
} else if (code > 0x80) {
byteArray[0] = 0xC0 | ((code & 0x7C0) >>> 6);
byteArray[1] = 0x80 | (code & 0x3F);
} else {
byteArray[0] = code;
}
this.parsedData.push(byteArray);
}
this.parsedData = Array.prototype.concat.apply([], this.parsedData);
if (this.parsedData.length != this.data.length) {
this.parsedData.unshift(191);
this.parsedData.unshift(187);
this.parsedData.unshift(239);
}
}
最后一段的 239 187 191 拼接成了 utf-8 bom头
不小心。
这是一段错误的代码,由于第一次没有正确处理中文,于是在ASCII码不等于字符串长度的 地方插入了一个 BOM 头来修补。BOM 全写是 Byte order make 又叫 Unicode 文件头,用来标识文件的编码,由于插入 BOM 头后会影响到原有数据流,所以会出现上述扫描结果中有BOM头的情况,在qrcode.js更新一个版本之后就将这段错误代码修改掉了。