最近在学httpclient,随便抓来一个网页:"http://ah.10086.cn",想通过httpget方法得到其原网页内容,本来以为很简单,先是碰到https验证问题,通过验证后拿到的网页源码竟然和鼠标右键查看网页源码不同,百思不得其解……
这很正常啊,有些是js动态加载的页面内容,有些是嵌了iframe之类的