java淘宝新开店铺数据采集

请教诸位大神:
公司需求,要求每天定时采集淘宝上 新入驻(新开张)店铺的信息,而且要求必须是那种
没有任何商品的店铺,想了很久也没思路,淘宝上根本找不到 相关的查询条件。
希望诸位大神前辈,能分享一下可行的解决思路,或者方案。

注:关键是通过什么链接地址才能在 淘宝上找到 新开店铺? 总要知道个url地址,我才能模拟用户访问请求,然后分析页面的元素得到我想要的东西。
实在是毫无头绪,以前也没做过类似的东西。

采用Python爬虫爬取淘宝的店铺信息,再去判断是否有商品。最后得出了需要的信息。(分布式爬虫、记得设置代理)

利用Python爬虫技术获取相关信息 自定义信息字段 导入集合 判断Null 得出信息

1.nutch地址:apache/nutch · GitHubapache下的开源爬虫程序,功能丰富,文档完整。有数据抓取解析以及存储的模块。而且这玩意儿还包括了一个开箱即用的搜索引擎,安装好就可以搜索了。
2.Heritrix地址:internetarchive/heritrix3 · GitHub很早就有了,经历过很多次更新,使用的人比较多,功能齐全,文档完整,网上的资料也多。有自己的web管理控制台,包含了一个HTTP 服务器。操作者可以通过选择Crawler命令来操作控制台。
3.crawler4j地址:yasserg/crawler4j · GitHub因为只拥有爬虫的核心功能,所以上手极为简单,几分钟就可以写一个多线程爬虫程序。

采用Python爬虫爬Django、Flask、web都是开发框架,爬虫最基本要有 urllib、urllib2/requests这些库,提取工具一般要xpath、bs4、正则这些、Scrapy是爬虫的框架,可以做深度爬取,分布式爬虫。最重要的是攻破反爬的经验~

请问你这个后来做了吗?我也需要做个这样的功能,一筹莫展

现在有一个现成的软件,就是可以采集淘宝当天的新开店铺信息,可以选择开店日期采集

请问做出来了吗,我也需要

有现成的可以直接用的。