求问一个分布式入门的问题?

假如目前是一台机器,工作是不停地向一个url发送请求,抓取返回的数据保存入数据库。
如果需要拓展成两台机器做这一件事,基本思路是什么?

看你的瓶颈是什么,一般来说瓶颈在抓取数据,而不是存入数据库,所以可以做成主从结构,主计算机上实现调度器、以及数据库服务器,主计算机调用从计算机,从计算机抓取数据,并且存入主机上的数据库。不用使用很高深的知识。

url传一参数,用来区分抓取单数还是复数。
查询的时候根据主键的单复数,一半一半分工就行了。
其他方式也可以,只要能区分,不重复。