Java 將PDF轉為HTML時保存到流


本文介紹如何通過Java后端程序代碼將PDF文件轉為HTML,並將轉換后的HTML文件保存到流。在實現轉換時,可設置相關轉換屬性,如:是否嵌入SVG、是否嵌入圖片等。下面是實現轉換的方法和步驟:

1. 導入jar

本次轉換的方法通過導入Free Spire.PDF for Java中的Spire.Pdf.jar免費jar來實現。可按照如下兩種方法中的任意一種導入jar:

  方法1:從Maven倉庫中導入。在pom.xml中配置如下內容:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.pdf.free</artifactId>
        <version>4.4.1</version>
    </dependency>
</dependencies>

方法2:下載 jar 包到本地,解壓,找到lib文件夾下的Spire.Pdf.jar文件。然后執行如下圖步驟完成導入:

 

 

 

 

 

 

2. Java代碼

將PDF轉換為HTML時,主要通過以下步驟中的類及方法實現:

  • 實例化PdfDocument類的對象,並通過PdfDocument.loadFromFile(String filename)方法加載PDF文檔
  • PdfDocument. getConvertOptions().setPdfToHtmlOptions(boolean useEmbeddeSvg, boolean useEmbeddeImg)方法設置轉換為HTML格式時的相關轉換屬性。
  • PdfDocument.saveToStream(OutputStream stream, FileFormate format)方法轉換成HTML時保存到流。

Java

import com.spire.pdf.*;

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.OutputStream;

public class SaveToStream {
    public static void main(String[] args) throws FileNotFoundException {
        //加載PDF文檔
        PdfDocument pdf = new PdfDocument();
        pdf.loadFromFile("咖啡豆.pdf");

        //設置useEmbeddedSvg和 useEmbeddedImg布爾值為true
        pdf.getConvertOptions().setPdfToHtmlOptions(true,true);

        //保存到流
        File outFile = new File("toHTML.html");
        OutputStream outputStream = new FileOutputStream(outFile);
        pdf.saveToStream(outputStream, FileFormat.HTML);
        pdf.close();
    }
}

3. 執行代碼后,生成html文件。

 

 

—End—


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM