我在研究蜘蛛程序,遇到个疑问。蜘蛛爬行网页时,是将爬行的网页作为镜像保存下来,再做分析还是边爬行边分析页面,保存为指定格式的文件(如:TXT格式的)??
请教高手,谢谢
肯定是先爬下来再解析,否则你的爬行速度还不是龟速阿。