我们进行文本文字的复制粘贴时复制的到底是什么?

复制的是文字所处文本文件的编码方案下的编码值吗?

比如文本文件采用UTF-8编码,复制文件中的“中文”两字时,复制的是这两个字的UTF-8编码值(即 E4 B8 AD E6 96 87)共 6 个字节的二进制数据吗?

如果是这样,那我粘贴到 GBK 编码的记事本中时,为什么没有出现乱码现象呢?

难道是粘贴时对编码进行了调整,调整为了 GBK 这种编码方案下的“中文”这两字的编码值了吗?可是记事本又怎么知道这 6 个字节的二进制数据是 UTF-8 编码方案下的“中文”这两字,而不是别的什么编码方案(比如 Big5, Shift-JIS等)下的别的什么字呢?

对于纯文本,其实是不知道编码,编码是编辑器(包括文本框)作为软件猜测的。别的格式,比如ole或者自定义格式,那另当别论。

看下面的图
图片说明