关于HTML和JSP的编码问题

百度来的技术贴,可以说众说纷纭,各执一词,很多博主写的根本经不起验证,实验一下就发现根本就是错的!写一大段难于理解的废话最后还是错的,浪费生命!
有没有大神能权威的解释一下以下五种编码的作用及区别
(1)<%@ page pageEncoding="GBK"%>
(2)<%@ page contentType="text/html;charset=GBK"%>
(3)request.setCharacterEncoding("GBK");
(4)response.setCharacterEncoding("GBK");
(5)

 pageEncoding是jsp文件本身的编码
  contentType的charset是指服务器发送给客户端时的内容编码
  JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。
  第一阶段是jsp编译成.Java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
  第二阶段是由JAVAC的JAVA源码至Java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
  JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
  第三阶段是Tomcat(或其的application Container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效
  contentType的設定.
  pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。
一、request.setCharacterEncoding():是设置从request中取得的值或从数据库中取出的值。

指定后可以通过getParameter()则直接获得正确的字符串,如果不指定,则默认使用iso8859-1编码。值得注意的是在执行setCharacterEncoding()之前,不能执行任何getParameter()。而且,该指定只对POST方法有效,对GET方法无效。分析原因,应该是在执行第一个getParameter()的时候,Java将会按照编码分析所有的提交内容,而后续的getParameter()不再进行分析,所以setCharacterEncoding()无效。而对于GET方法提交表单是,提交的内容在URL中,一开始就已经按照编码分析提交内容,setCharacterEncoding()自然就无效。

get需在Tomcat的server.xml中的:

<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443"

URIEncoding="GBK" />

)加入URIEncoding="GBK",解决get请求乱码问题

客户端编码后,用该方法告知服务端,解码时使用相同的编码格式,否则会出现乱码。客户端一般编码()设置

(post提交的form表单参数采用meta编码方式)

二、response.setContentType("text/html;charset=gb2312")是设置页面中为中文编码。(get中的QueryString参数用response中的contentType编码,如果没有采用meta编码)

前者是设置动态文字(参数,数据库),后者设置页面静态文字

response.setContentType指定 HTTP 响应的编码,同时指定了浏览器显示的编码.
response.setCharacterEncoding设置HTTP 响应的编码,如果之前使用response.setContentType设置了编码格式,则使用response.setCharacterEncoding指定的编码格式覆盖之前的设置.与response.setContentType相同的是,调用此方法,必须在getWriter执行之前或者response被提交之前.

该方法是指定服务端编码格式,并告知客户端解码时的编码码格式,这样两者保持一致,才不会出现乱码。
第五个根本看不到

楼上总结的好啊,不过可能是贴出来的,

(1)<%@ page pageEncoding="GBK"%>
的作用是设置JSP编译成Servlet时使用的编码。

(2)<%@ page contentType="text/html;charset=GBK"%>
的作用是指定对服务器响应进行重新编码的编码

(3)request.setCharacterEncoding("GBK");
的作用是设置对客户端请求进行重新编码的编码。

(4)response.setCharacterEncoding("GBK");
的作用是指定对服务器响应进行重新编码的编码。

(5)我猜第五个是:

 <meta charset="UTF-8">

charset 属性规定 HTML 文档的字符编码。相当于文本文件编码。

参考:http://blog.csdn.net/fancylovejava/article/details/7700683
有问题还可以追问,,,我不是权威,我只是学习者。