去哪儿网,什么kuxun等等搜特价机票的网站,都有些类似的功能。
他们是在别人搜索的基础上做搜索的么?有人对这方面比较熟悉么?能详细说说么?
[b]问题补充:[/b]
怎么监听别人的更新?只有查询一下才能拿到结果的对不?
而且前端时间携程好像和一个公司打了官司,就是因为他们未经授权盗用数据。
我先瞎猜一下:
比如我要搜索北京到上海的航班,我是不是要把这个请求向目标网站发送一下,比如携程,比如各个航空公司。然后我把他们的搜索结果返回,包装一下,然后放到我的网页上,用户看起来好像都是我自己网站的数据。
所谓监听别人的更新,其实就是程序自动分析别人的网页,看是否有新的内容.如果这个实现比较难,那就不做实时的,就定时的几分钟查询一次,看看是否有更新.
你的猜想没有错,原理就是这样.
一个可能是数据抓取.定时的监听别人网站内容是否更新,一旦更新就将别人网站的数据抓过来,更新自己的网站.
另外可能跟别的网站合作..支付一点钱,别的网站提供数据..
你也可以通过网页抓取技术实现一个类似的功能.基础要httpclient,它可以在后台发起http请求,就像一个用户一样到别人网站去查询,返回得到查询结果.至于解析,你可以挑选自己顺手的工具,别人网站查询结果的返回值无非就是html,js,xml.这3个东西都有对应的解析工具包.
html有jericho,htmlparser,nekohtml.
js有json-lib等
xml有dom4j,jdom.