我想从网站上爬取我要的内容....不知现在用什么技术好?
最直接的就用jdk自己提供的HttpConnection(记得好像是这样写的),但是想用的简单点就用apache的http-client好了,这个用起来简单。
你可以参考一下nutch1.0的代码,nutch1.0是个开源的搜索引擎。