怎么设计网络爬虫,来获取网页的一些信息?

现在正在学习一些Python语言,请问一下,如何用python来构造一些框架,来实现爬虫的效果?

如果刚开始学python 的话,可以现用最简单的正则表达式来爬取自己需要的信息。python最厉害的方面就是爬虫的框架,用起来非常的方便。对于初学者最主要的是学会python当中被称为鸡肋的多线程,是爬虫所必须的。可以先尝试一些简单的信息爬取来练习正则和多线程。然后去找框架来用。

刚开始学Python,可以从简单的爬虫入手,比如:http://blog.csdn.net/mulangren1988/article/details/60322538,想深入了解爬虫的话,可以研究下scrapy。