最近有需求,需要从抓取到的html页面中提取出某些内容想问一下大家,python有没有什么比较成熟的库,可以实现类似的功能:比如配置好xpath之后,可以从流中提取内容?
http://www.crifan.com/python_third_party_lib_html_parser_beautifulsoup/
Beautiful SoupHTMLParser