我们进行文本文字的复制粘贴时复制的到底是什么？

复制的是文字所处文本文件的编码方案下的编码值吗？

比如文本文件采用UTF-8编码，复制文件中的“中文”两字时，复制的是这两个字的UTF-8编码值（即 E4 B8 AD E6 96 87）共 6 个字节的二进制数据吗？

如果是这样，那我粘贴到 GBK 编码的记事本中时，为什么没有出现乱码现象呢？

难道是粘贴时对编码进行了调整，调整为了 GBK 这种编码方案下的“中文”这两字的编码值了吗？可是记事本又怎么知道这 6 个字节的二进制数据是 UTF-8 编码方案下的“中文”这两字，而不是别的什么编码方案（比如 Big5, Shift-JIS等）下的别的什么字呢？

对于纯文本，其实是不知道编码，编码是编辑器（包括文本框）作为软件猜测的。别的格式，比如ole或者自定义格式，那另当别论。

看下面的图