htmlContent = urllib2.urlopen().read().decode('utf-8')
请问用python,要怎么获取完整的文本?
谢谢!
网页可能用了ajax等异步技术来显示页面内容urllib等获取的时候只能取到当时页面内容,可能页面内容还没有加载完成这种情况需要用selenium等webdriver机制模拟浏览器来获取所有的页面内容
用fiddler这个软件抓浏览器和服务器的通讯数据,看是什么请求包含了完整的文本。然后用python直接模拟。