http://ircs.p5w.net/ircs/interaction/queryQuestionByGszz.do?condition.keyWord=民营银行&condition.status=3&condition.searchType=content
民营银行在页面上显示为æ°è¥é¶è¡?
由于页面编码和后台编码不同,怎么样按照特定的中文关键词进行爬去网页内容
求大虾解决!
传url之前用encodeURI(url)试试
你转一下格式用UTF-8传再用UTF-8接受
encode编码
decode解码
转换一下编码就可以了、、、、、、
keyWord=new String(keyWord.getBytes("ISO-8859-1"),"UTF-8")
var s =escape("民营银行");
var url="http://ircs.p5w.net/ircs/interaction/queryQuestionByGszz.do?condition.keyWord="+s+"&condition.status=3&condition.searchType=content"
keyWord=new String(keyWord.getBytes("ISO-8859-1"),"UTF-8")这才是正解
编一下码吧,建议不直接用中文
是不是客户端和服务端一个GBK一个UTF-8?
前台:encodeURI(encodeURI(url))后台解码:name=URLDecoder.decode(name,"UTF-8")