JAVA 乱码 根本原因是什么?该如何预防和解决?

JAVA 乱码 根本原因是什么?该如何预防和解决?

可以参考我的博客文章:

[url]http://playfish.iteye.com/blog/186293[/url]
以及
[url]http://playfish.iteye.com/blog/85900[/url]

*************************************java、jsp中设置编码******************************************/
首先说在java里那些地方能够设置编码
开发工具会有好多地方设置编码这个不解少了,这里不介绍了。

下面两种设置编码格式方法适用于jsp页面(*.jsp)
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%>
<%@ page contentType="text/html; charset=UTF-8" %>

下面方式适合于jsp、servlet、action中(*.java)
request.setCharacterEncoding("UTF-8");
response.setCharacterEncoding("UTF-8");

下面适合html页面(*.htm;*.html)

Tomcate设置编码(server.xml)

mysql设置编码命令

SET character_set_client = utf8;
SET character_set_connection = utf8;
SET character_set_database = utf8;
SET character_set_results = utf8;/*这里要注意很有用*/
SET character_set_server = utf8;

SET collation_connection = utf8_bin;
SET collation_database = utf8_bin;
SET collation_server = utf8_bin;

my.ini中配置默认编码
default-character-set=utf8

连接数据库设置编码
jdbc:mysql://192.168.0.5:3306/test?characterEncoding=utf8

/*****************************************java与mysq编码对应****************************************/
java中的常用编码UTF-8;GBK;GB2312;ISO-8859-1;
对应mysql数据库中的编码utf8;gbk;gb2312;latin1

/********************************************过滤器使用*********************************************/
//过滤器设置编码过滤(SetCharacterEncodingFilter.java)
package com.sorc;

import java.io.*;
import javax.servlet.*;
import javax.servlet.http.*;

public class SetCharacterEncodingFilter extends HttpServlet implements Filter{
private FilterConfig filterConfig;
private String encoding=null;
//Handle the passed-in FilterConfig
public void init(FilterConfig filterConfig){
this.filterConfig=filterConfig;
encoding=filterConfig.getInitParameter("encoding");
}
//Process the request/response pair
public void doFilter(ServletRequest request,ServletResponse response,FilterChain filterChain){
try{
request.setCharacterEncoding(encoding);
filterChain.doFilter(request,response);
} catch(ServletException sx){
filterConfig.getServletContext().log(sx.getMessage());
} catch(IOException iox){
filterConfig.getServletContext().log(iox.getMessage());
}
}
//Clean up resources
public void destroy(){
}
}
//web.xml配置过滤器方法(web.xmd)

setcharacterencodingfilter
com.sorc.SetCharacterEncodingFilter

encoding
utf8



setcharacterencodingfilter
/*

/************************有了上面的基础下面试完满解决方案*****************************************/
1.使用GBK编码的解决方案
这个最简单 遇到设置编码的地方就是用GBK数据库gbk 然后在使用个过滤器过滤编码为gbk一切搞定。
效果为添加数据无乱码 读出无乱码 数据库管理工具无乱码 到处sql结构和数据无乱码

2.使用UTF-8编码解决方案
所有编码都设置为UTF-8
数据库编码utf8
设置过滤器编码utf8
数据库连接?characterEncoding=utf8
然后在数据库管理工具或mysql命令行 运行 SET character_set_results = gbk;
效果为添加数据无乱码 读出无乱码 数据库管理工具无乱码 到处sql结构和数据时存在乱码

3.页面使用UTF8 数据库使用latin1的解决方案
jap java tomcat 设置为UTF-8
过滤器 utf8
数据库连接?characterEncoding=latin1
数据库其他latin1
然后在数据库管理工具或mysql命令行 运行 SET character_set_results = gbk;
效果为添加数据无乱码 读出无乱码 数据库管理工具无乱码 到处sql结构和数据时存在乱码

以上都不需要页面或java代码中手动转码

[size=x-large][color=red]乱码问题出现的情况主要是页面之间数据传递的时候没有统一的编码造成的,如下:
1:由于页面之间的编码格式不一致,导致出现乱码
2:传递过程中编码和解码出现问题
解决情况如下
1:统一页面的编码格式,可以都为UTF-8

2:HTML之间的传递出现乱码可以如下,encoding(转码)和uncoding(解码),具体方法忘记了,自行查阅
3:转码:java.net.URLEncoder.encode("字符串","UTF-8");
解码:java.net.URLDecoder.decode("字符串","UTF-8");
4:////////////过滤器
import java.io.IOException;

import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;

public class EncodingFilter implements Filter {
private String encode;

public void destroy() {
}

public void doFilter(ServletRequest sreq, ServletResponse sres,
FilterChain chain) throws IOException, ServletException {
// 在此截获请求
sreq.setCharacterEncoding(encode);
sres.setContentType("text/html;charset="+encode);
chain.doFilter(sreq, sres);
// 截获响应
}

public void init(FilterConfig arg0) throws ServletException {
encode = arg0.getInitParameter("encode");
}
}

//////////web.xml

encoding
com.skywin.action.filter.EncodingFilter

encode
utf-8



encoding
/*


5:也可以在TOMCAT里面配置,JBOSS或weblogic也有相对应的配置,[/color][/size]

above message si very good , you can learn .

理论,上面几位讲的都很明白了。可以用下面这个快速找到正确的编码。也会找不到,那可能是因为解码的时候的字符集就错了。那样这个办法就不行了。
http://lijunjie.iteye.com/blog/342936