上個項目客戶提出了一個需求,要求把PDF格式的文件轉化為HTML格式。
上網查了一下,要么使用軟件處理,要么是HTML格式轉化為PDF。因為涉及到圖文識別問題,所以說僅僅依靠前端不能實現。在網上查了幾種方法,最后拍板使用pdf2htmlEX.
pdf2htmlEX是一款開源的軟件,所以說可以鑲嵌到自己的項目之中,不用再手動使用軟件去轉化格式。
資源在網上可以搜索的到。
使用方法:
1:下載資源,解壓之后在本頁面打開命令窗口。

2:直接在命令窗口輸入命令

pdf2htmlEX后面為PDF文件地址,--dest-dir后,后面為輸出地址。網上有具體的命令參數就不一一列舉了。
轉化生成的文件:

因為是要求點擊列表切換網頁,最后我是把轉化后的HTML網頁使用iframe標簽引入到一個現實網頁之中,最后通過點擊事件動態改變iframe的href屬性值來實現網頁跳轉問題。
當然,如果是自己需要PDF轉化HTML還是推薦使用軟件,操作起來比較快捷方便。但是如果是項目中需要轉化HTML還是推薦使用pdf2htmlEX,首先要自己使用命令窗口調試出合適的參數,然后通過后端技術轉換。這樣遇到大批量處理PDF轉化HTML的話不用手動一一去轉化。
