如下图,novel中是我爬取网站中小说的内容,这个字符串我在写入txt文件和重新编码之后都能正常看到,但是我直接打印它就什么也没有。
注:这里有两行print(), 但只有第一行重新编码之后才能有结果,重点是第二行print()没有结果;重新编码解码已尝试,结果和直接打印一样。数据抓取使用的是re中的findall()。
不编码直接打印,或者在编码后再解码,然后打印。str.encode().decode(),最好的解决中文显示乱码的办法是,在对页面请求后,使用按页面内容获取编码格式,省去后面再对文本进行编解码。response.encoding=response.apparent_encoding
编码问题吧好像?这是二进制编码吗?
前面有b' 表示下面这段是字节码形式,需要提出来,然后解码。才能显示出内容