想实现一个系统,比如google的搜索,在客户端和搜索服务器之间建立一个代理服务器,通过代理服务器,对搜索结果进行过滤、控制,来获取最希望得到的结果。
有没有高手能给点意见,类如实现方法,或者推荐的软件,最好是开源的。
希望回答的详细点,或者推荐几部相关的资料。
如果那样的话,应该是要完成以下工作:
1.获得搜索结果
2.对得到的搜索结果进行解析,如:
标签中的就是一条结果,而标签中的就是新闻的搜索结果3.按照你的规则和要求,对结果排序或者删除
4.把处理后的结果发送到客户端
编程的话,主要用到:
1.soket或是对它的包装的URLConnection来得到搜索结果和发送搜索结果
2.文本内容的处理,正则表达式
现在,google的服务器做了一些处理,如果你搜索次数多的话,会出现验证码,用编程的方式不太容易解决.
你可以看看google的自定义搜索