简单描述下问题
需要将url生成静态页面
服务器是 apache+tomcat 乱码都处理过了,包括web.xml里的设置,过滤器的设置,apache转发的设置。
整个系统不存在页面显示的乱码问题。
如果是以上问题的回答,请不要回答。
现在的问题是,需要将一个地址转换成html文件,已便于其它程序(一个邮件订阅系统)使用。
[code="java"]
import java.io.BufferedReader;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.net.MalformedURLException;
import java.net.URL;
public class UrlToHtml {
public static void main(String[] args) {
String content = readUrlContent("http://www.investide.cn/edm/index.do");
//http://www.investide.cn/edm/index.do用的是gbk编码
try{
content = new String(content.getBytes(), "GBK");
System.out.println(content);
if (!(writeFile(content, "/home/mush/1.html")))
{
System.out.println("文件生成失败");
}
}catch(Exception e){
e.printStackTrace();
}
}
public static String readUrlContent(String url)
{
StringBuffer sb = new StringBuffer();
try
{
String strLine;
URL urlObj = new URL(url);
InputStream streamObj = urlObj.openStream();
InputStreamReader readerObj = new InputStreamReader(streamObj,"GBK");
BufferedReader buffObj = new BufferedReader(readerObj);
while ((strLine = buffObj.readLine()) != null)
sb.append(strLine + "\r");
buffObj.close();
} catch (MalformedURLException e) {
System.err.println("url error");
} catch (IOException e) {
System.out.println("IO error");
}
return sb.toString();
}
public static boolean writeFile(String str, String filePath) {
boolean result = true;
try {
//FileWriter fw = new FileWriter(filePath);
Writer fw = new OutputStreamWriter(new FileOutputStream (filePath),"GBK");
fw.write(str);
fw.close();
} catch (IOException e) {
result = false;
System.out.println("写文件失败");
}
return result;
}
}
[/code]
开始程序在本地运行没有任何问题,放到服务器上后,生成的文件就会乱码,然后加了几处乱码处理(见三处GBK编码),仍然显示时乱码。
服务器用的是redhat,i18n文件已设置过GBK编码。
能处理的地方都处理过了,不明白为什么还有问题。
望指教。。。
[b]问题补充:[/b]
Tomcat的server.xml也设置过了。
整个系统不存在页面显示的乱码问题。
如果是以上问题的回答,请不要回答。
你用httpclient来得到网页内容,应该能解决
http://blog.csdn.net/ninibinbin/archive/2009/05/12/4169926.aspx
http://news.softhouse.com.cn/news/show/78000.html
哥们,你这个是由于Tomcat服务器里没有设置,你要在Tomcat的server.xml里设置才行的
需要在8080那里设置URIEncoding='GBK'这样URL才会不会出现乱码的,应该是在显示中文URL的时候才出现乱码的吧?