用Java实现 对PDF文件大小的控制。

如题,通过代码可以将现有的PDF,比如100m大小的文件缩小到80m,不是压缩成zip或者rar.
在网上找了很多,一点代码都没有可以参考的。求大神指点

如果你对pdf的阅读没有严格要求的话,倒可以考虑将内容转化成图片的形式(在阅读效果没有要求的情况下一页pdf所转化成图片的大小在30kb-100kb左右)。下面提供了一个用java实现的将pdf转jpg图片的代码。

 package pdf;

import java.awt.Image;
import java.awt.Rectangle;
import java.awt.image.BufferedImage;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.RandomAccessFile;
import java.nio.ByteBuffer;
import java.nio.channels.FileChannel;
import javax.swing.SwingUtilities;
import com.sun.image.codec.jpeg.JPEGCodec;
import com.sun.image.codec.jpeg.JPEGImageEncoder;
import com.sun.pdfview.PDFFile;
import com.sun.pdfview.PDFPage;

public class PdfToJpgTest {
    public static void setup() throws IOException {

        // load a pdf from a byte buffer
        File file = new File(
                "c://xxxxx.pdf");
        RandomAccessFile raf = new RandomAccessFile(file, "r");
        FileChannel channel = raf.getChannel();
        ByteBuffer buf = channel.map(FileChannel.MapMode.READ_ONLY, 0, channel
                .size());
        PDFFile pdffile = new PDFFile(buf);

        System.out.println("页数: " + pdffile.getNumPages());

        for (int i = 1; i <= pdffile.getNumPages(); i++) {
            // draw the first page to an image
            PDFPage page = pdffile.getPage(i);

            // get the width and height for the doc at the default zoom
            Rectangle rect = new Rectangle(0, 0, (int) page.getBBox()
                    .getWidth(), (int) page.getBBox().getHeight());

            // generate the image
            Image img = page.getImage(rect.width, rect.height, // width &
                                                                // height
                    rect, // clip rect
                    null, // null for the ImageObserver
                    true, // fill background with white
                    true // block until drawing is done
                    );

            BufferedImage tag = new BufferedImage(rect.width, rect.height,
                    BufferedImage.TYPE_INT_RGB);
            tag.getGraphics().drawImage(img, 0, 0, rect.width, rect.height,
                    null);
            FileOutputStream out = new FileOutputStream(
                    "c://picture//"
                            + i + ".jpg"); // 输出到文件流
            JPEGImageEncoder encoder = JPEGCodec.createJPEGEncoder(out);
            encoder.encode(tag); // JPEG编码

            out.close();
        }

        // show the image in a frame
        // JFrame frame = new JFrame("PDF Test");
        // frame.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
        // frame.add(new JLabel(new ImageIcon(img)));
        // frame.pack();
        // frame.setVisible(true);
    }

    public static void main(final String[] args) {
        SwingUtilities.invokeLater(new Runnable() {
            public void run() {
                try {
                    PdfToJpgTest.setup();
                } catch (IOException ex) {
                    ex.printStackTrace();
                }
            }
        });
    }

}

压缩pdf文件的思路主要是删除pdf中冗余的,不显示的内容,比如脚本、注释、书签、多媒体文件、嵌入的ttf字体等等。以及改变图片的分辨率。
说白了,不是什么样的pdf都能精简,也不是想精简到什么程度就能精简到什么程度。我让你产生一个10kb的pdf,装一部三国演义,这可能么?

这个还真不清楚如何压缩的,得用专门的压缩工具吧

用itext导出的pdf文件,要用内嵌字体,虽然存在一些可以设置的属性,但是压缩效果并不明显,使用Acrobat 软件可以把导出的6M文件压缩
到500k+,看了一下分析主要压缩的是文字和框架,但是怎么实现的并没有好方法。