爬取百度文库出现编码错误

问题遇到的现象和发生背景

输入txt然后复制地址进去点击回车,然后报错

问题相关代码,请勿粘贴截图

用的您发的代码

运行结果及报错内容

'gbk' codec can't decode byte 0xae in position 228: illegal multibyte sequence

我的解答思路和尝试过的方法

我有用过‘gb18030’替换‘gbk’和‘utf-8’尝试,但是结果是'gb18030' codec can't decode byte 0xa8 in position 220: illegal multibyte sequence

我想要达到的结果

不清楚问题在哪里,希望得到解答