本人在做网页抓取程序,由于抓取的内容,源代码里是看不到的, 用WINFORM是可以用WebBrowser这样实现的。。我想知道用ASP.NET的话,有没有能达到这个效果的方法, 我试了 HttpWebRequest,, 但是没找到操作DOM元素的方法。
你可以下网页抓取软件,然后看他怎么使用的,可以借鉴一下
获取出来的是html文本,你可以用正则表达式过去想要的内容!
如果你需要用DOM,可以用HtmlAgilityPack
http://htmlagilitypack.codeplex.com/
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.Load(你的html文本);
当然简单的,你也可以用正则。
htmlunit 找到了这个可以实现,但是没有找到这个DLL的引用下载。不知道哪位大神有的