请教大神,在Python中利用正则爬取用js生成的数据,爬取网易新闻中的评论
你用python 网络包,多次请求,然后再 解析源码
例如:
网易评论页:
http://comment.news.163.com/news2_bbs/C4IUUH5K000189FH.html
网易返回
jsonp0iuwlr2n2 =[{"TITLE":"Crocs\u5b98\u65b9\u65d7\u8230\u5e97!\u5e03\u9a86\u683c\u9c7c\u5634\u978b\u5761
\u8ddf\u51c9\u978b","RESOURCEID":"44846141610","GOODSPRICE":49900,"LOCATION":"\u4e0a\u6d77","TBGOODSLINK"
:"https:\/\/asearch.alicdn.com\/bao\/uploaded\/i1\/199250309690686146\/TB2.WiYbmiK.eBjSZFsXXbxZpXa_!
!0-saturn_solar.jpg_sum.jpg","WANGWANGID":"crocs\u5b98\u65b9\u65d7\u8230","EURL":"https:\/\/srd.simba
对应中文
官方旗舰店!布骆格鱼嘴鞋坡
你要做的就是 模拟这两次请求