要爬取网页一部分内容,那部分内容是url+文字的形式,如下图
想要写一个正则,把爬到的网页里的这样形式的内容给打印出来,请问要怎么写正则去匹配呢?
可以匹配http:// 加空格。http://(.*)[\s]