各位 遇到个问题, 谁能帮我解决一下
我举个例子 现在要抓取 http://www.xxx.com/123/123/321/xxx.html 下的一篇文章,其中连图片也要一起抓
所以我抓到这个页面后需要根据img 元素里的url再单独抓图片。问题来了,img给的url很多都是 像../../图片.jpg 或者 ./img/图片.jpg 等格式的相对路径,整的我没办法正常抓取,有没有什么办法
URI base=new URI(baseURI);//基本网页URI
URI abs=base.resolve(relativePath);//解析于上述网页的相对URL,得到绝对URI
URL absURL=abs.toURL();//转成URL