java下html导出pdf文件,换jar包的后如何解决出现的问题???

项目有个问题,页面动态导出pdf,用了itext2.0.8jar core-renderer.jar iTextAsian.jar 包,正确生成pdf文件。
由于项目原来使用了iText-2.1.4.jar包,经理不许jar降级,先在是修改iText-2.1.4.jar包中package com.lowagie.text.pdf; BaseFont.java文件中的getCharBBox方法 2.08传的字符,其他的传的int ,
public int[] getCharBBox(char paramChar)
{
byte[] arrayOfByte = convertToBytes(paramInt);
if (arrayOfByte.length == 0)
return null;
return this.charBBoxes[(arrayOfByte[0] & 0xFF)];
}
修改后重新打包 ,之后汉字支持出现问题。
代码如下
ITextRenderer renderer = new ITextRenderer();
ITextFontResolver fontResolver = renderer.getFontResolver();
try {
OutputStream os = new FileOutputStream(pdfPath);
//解决中文问题
fontResolver.addFont("C:\Windows\Fonts\simsun.ttc", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
renderer.setDocumentFromString(htmlCode);//引入html字符串
renderer.layout();
renderer.createPDF(os);
os.close();
} catch (Exception e) {
e.printStackTrace();
}
报错如下
ExceptionConverter: java.io.UnsupportedEncodingException: Identity-H
at java.lang.StringCoding.encode(StringCoding.java:269)
at java.lang.String.getBytes(String.java:947)
at com.lowagie.text.pdf.PdfEncodings.convertToBytes(Unknown Source)
at com.lowagie.text.pdf.BaseFont.convertToBytes(Unknown Source)
at com.lowagie.text.pdf.BaseFont.getCharBBox(Unknown Source)
at org.xhtmlrenderer.pdf.ITextFontResolver$FontDescription.setMetricDefaults(ITextFontResolver.java:679)
at org.xhtmlrenderer.pdf.ITextFontResolver$FontDescription.(ITextFontResolver.java:610)
at org.xhtmlrenderer.pdf.ITextFontResolver$FontDescription.(ITextFontResolver.java:603)
at org.xhtmlrenderer.pdf.ITextFontResolver.addFont(ITextFontResolver.java:169)
at org.xhtmlrenderer.pdf.ITextFontResolver.addFont(ITextFontResolver.java:157)
at org.xhtmlrenderer.pdf.ITextFontResolver.addFont(ITextFontResolver.java:180)
at org.xhtmlrenderer.pdf.ITextFontResolver.addFont(ITextFontResolver.java:157)
at cn.com.pdf.demo.Demo.htmlCodeComeString(Demo.java:77)
at cn.com.pdf.demo.Demo.test(Demo.java:115)
at cn.com.pdf.demo.Demo.main(Demo.java:124)

不知道怎么办了,求教诸位大神

你清除一下,重新编译一下试试

这个是你的pdf文件没有健康,文件中的文字乱码问题。Identity-H编码好像是繁体或韩文的一种编码,在没有响应语言包支持下,导出是会出现乱码的,通过acrobat导出为图片,再转换为pdf,然后在acrobat使用ocr(文字识别)一下,这时文字的编码就会变为NASI,这时在导出为word文件就可以了,只是需要仔细校对一下