这个网页:https://www.readawrite.com/c/0df2a73fb@b879081be72249bc8913c24%EF%BC%88%E5%8E%BB%E6%8E%89%E4%B8%AD%E9%97%B4%E7%9A%84@%EF%BC%89@b879081be72249bc8913c24(去掉中间的@)
检查元素时,正文显示:
用urllib和requests获取到的源码里并没有正文,用selenium能获取到正文,但编解码出来的也是一堆乱码……
请问这种怎么获取正确的正文呀?
设置一下编码格式为UTF-8试试