JAVA中 PDF文件轉成TIFF文件的2種方式


由於在工作中使用到了PDF->TIFF的技術,所以稍微研究了一下實現方式,通過資料查閱,暫時發現了2種方式,2種方式有所區別:第一種方式轉化后的tiff文件是黑白的,第二種方式轉化后的tiff文件是有色彩的(跟PDF文件相同),如果不對色彩要求嚴格的話,建議使用第一種方式,因為轉化的文件較小。

第一種PDF轉化TIFF的方式(黑白):

注意主要依賴pdfbox的版本是1.8.9,而新版本的依賴不適用,例如2.0.0-RC2。

<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>1.8.9</version>
<scope>compile</scope>
</dependency>
    /**
     * 把PDF讀入輸入流,轉化每一頁為TIF
     * @param inputStream PDF輸入流
     * @param dir         存放的路徑
     * @param dpi         dpi    
     * @return 轉化后的tif文件列表
     */
public List<File> pdf2tif(InputStream inputStream, File dir, int dpi) {
try (PDDocument pdf = PDDocument.load(inputStream)) {
BufferedImage[] images = new BufferedImage[pdf.getNumberOfPages()];
List<File> files = new ArrayList<>();
long suffix = System.currentTimeMillis();
for (int i = 0; i < images.length; i++) {
PDPage page = (PDPage) pdf.getDocumentCatalog().getAllPages().get(i);
BufferedImage image;
image = page.convertToImage(BufferedImage.TYPE_BYTE_BINARY, dpi);
images[i] = image;
File file = new File(dir.getAbsolutePath() + File.separator + suffix + "-" + (i + 1) + ".tiff");
try (FileOutputStream out = new FileOutputStream(file);ImageOutputStream ios = ImageIO.createImageOutputStream(out)) {
TIFFImageWriterSpi tiffWriter = new TIFFImageWriterSpi();
ImageWriter writer = tiffWriter.createWriterInstance();
ImageWriteParam param = writer.getDefaultWriteParam();
ImageTypeSpecifier typeSpecifier = ImageTypeSpecifier.createFromBufferedImageType(BufferedImage.TYPE_INT_ARGB);
param.setCompressionMode(ImageWriteParam.MODE_EXPLICIT);
param.setCompressionType("CCITT T.6");
param.setCompressionQuality(1);
IIOMetadata metadata = writer.getDefaultImageMetadata(typeSpecifier, param);
IIOMetadataNode hps = new IIOMetadataNode("HorizontalPixelSize");
hps.setAttribute("value", Double.toString(1d / 300d * 25.4d));
IIOMetadataNode vps = new IIOMetadataNode("VerticalPixelSize");
vps.setAttribute("value", Double.toString(1d / 300d * 25.4d));
IIOMetadataNode dim = new IIOMetadataNode("Dimension");
dim.appendChild(hps);
dim.appendChild(vps);
IIOMetadataNode root = new IIOMetadataNode("javax_imageio_1.0");
root.appendChild(dim);
metadata.mergeTree("javax_imageio_1.0", root);
writer.setOutput(ios);
writer.write(metadata, new IIOImage(image, null, metadata), param);
} catch (IOException e) {
e.printStackTrace();
}
files.add(file);
System.out.println(file.getAbsolutePath());
}
return files;
} catch (IOException e) {
e.printStackTrace();
return null;
}
}

 

 

第二種PDF轉化TIFF文件的方式(有色彩):

注意主要的依賴:(maven可能拉不下來,建議去網上下載)

<dependency>
<groupId>com.sun.media</groupId>
<artifactId>jai_codec</artifactId>
<version>1.1-mr</version>
</dependency>
<dependency>
<groupId>javax.media</groupId>
<artifactId>jai_core</artifactId>
<version>1.1-mr</version>
</dependency>
<dependency>
<groupId>com.sun.medialib</groupId>
<artifactId>mlibwrapper_jar</artifactId>
<version>1.1</version>
</dependency>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.0-RC2</version>
</dependency>
/**
     * 從輸入流讀取pdf,轉化為tiff后寫入輸出流.<br/>
     * @param is  輸入流,提供pfg內容.
     * @param outPath  輸出目錄.
     */
    public static List<File> pdf2Tiff(InputStream is, String  outPath) {
        PDDocument doc = null;
        FileOutputStream fos = null;
        List<File> files = new ArrayList<>();
        try {
            doc = PDDocument.load(is);
            int pageCount = doc.getNumberOfPages();
            PDFRenderer renderer = new PDFRenderer(doc); // 根據PDDocument對象創建pdf渲染器
            List<PlanarImage> piList = new ArrayList<PlanarImage>(pageCount - 1);
            TIFFEncodeParam param = new TIFFEncodeParam();// 創建tiff編碼參數類
            param.setCompression(TIFFEncodeParam.COMPRESSION_DEFLATE);// 壓縮參數
            param.setExtraImages(piList.iterator());// 設置圖片的迭代器
            for (int i = 0; i < pageCount; i++) {
                BufferedImage fimg = renderer.renderImageWithDPI(i, DPI, ImageType.RGB);
                PlanarImage fpi = JAI.create("mosaic", fimg); // 通過JAI的create()方法實例化jai的圖片對象
                File file = new File(outPath + (i + 1) + ".tiff");
                fos = new FileOutputStream(file);
                ImageEncoder enc = ImageCodec.createImageEncoder("tiff", fos, param);
                enc.encode(fpi);// 指定第一個進行編碼的jai圖片對象,並將輸出寫入到與此
                files.add(file);
                if (fos !=null) {
                    fos.close();
                }
            }
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                if (doc != null)
                    doc.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return files;
    }

 注意:第二種方式可能會報錯(有關JAI的錯誤),但是不影響程序正常運行,也不影響結果。可通過配置VM options參數來解決:-Dcom.sun.media.jai.disableMediaLib=true。

如果開發工具是IDEA可在Configuration中的VM options欄添加:-Dcom.sun.media.jai.disableMediaLib=true。如圖:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM