T<=>103[=]P<=>iexplore.exe[=]I<=>2808[=]U<=>http://t.iloveyouxi.com/game/krtc5822.php[=]A<=>1045e[=]B<=>1048a[=]V<=>8.00.6001.18702
各位大神,这种格式的txt文档如何提取url,并得到网页文本数据呢?
看你这个格式,可以搜索http开头,这比较容易。
然后就看如何结束了,看你这个格式,只能以<来作为结束符,或者你再分析一下有没有更好的方案。
截取http到<之间的为url
希望能帮到你。
先将txt内容读到内存中,然后遍历字符串查找url表示的开头和结束部分,也就是做一个截取字符串的工作