如何用webMagic爬取中国理财网所有理财产品信息

在爬取中国理财网所有理财产品数据,首页理财产品列表每一款产品的详情链接都在
onclick方法的参数中,一直获取不到,求大神指导,这里如何获取每一个理财产品的详情链接。

你可以在先在列表里找到产品的ID号,(在网页的源码里搜索checkoption,可以看到后面有ID=xxxxxxxx),然后利用这个ID进行POST就可以得到目标数据了,
POST的URL:

https://www.chinawealth.com.cn/lccpAllProJzyServlet.go

POST 的headers:

 headers={
        'Accept':'application/json, text/javascript, */*; q=0.01',
        'Accept-Encoding':'gzip, deflate, br',
        'Accept-Language':'zh-CN,zh;q=0.9',
        'Connection':'keep-alive',
        'Content-Length':'107',
        'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',
        'Cookie':'JSESSIONID=00003hA3ooAlynv6nObPIuBaw4I:-1; BIGipServerPool_licai_webapp=44373258.31011.0000; _pk_ses.3.8bc7=*; count=3; _pk_id.3.8bc7=80dd387d22008cb9.1540951424.1.1540951453.1540951424.',
        'Host':'www.chinawealth.com.cn',
        'Origin':'https://www.chinawealth.com.cn',
        'Referer':'https://www.chinawealth.com.cn/zzlc/jsp/lccpDetail.jsp',
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.15 Safari/537.36',
        'X-Requested-With':'XMLHttpRequest',
    }

post的data数据:

 data={
        'tzzlxdm':'03',
        'cpid':'1774849',
        'pagenum':'1',

    }

data里的cpid就是前面列表的ID号