目前试过用截图方式来获取网页,然后转化成pdf的方式来获取信息,但是碰到了文本域中文字多了就显示不全了。
直接把网页的内容存储成文本多好。
动态生成的页面去抓包分析它的接口呗,都是现成的json,都不用你清洗