Java使用Jacob轉換Word為HTML


從今天開始,我也要養成記錄開發中遇到的問題和解決方法的好習慣!微笑

最近開發一個Android項目,需要用到查看Word和Pdf文檔的功能,由於Android沒有直接顯示Word和PDF文檔的組件,只有一個Webview能查看html網頁,所以決定將文檔於服務器端轉換為html,之后不論是在線預覽還是下載到移動終端都可以直接查看了。

最近在網上查閱相關資料,找到利用Jacob來轉換Word為html,除了占用CPU性能多一些,好像還不錯(.doc和.docx都可以轉換的!)。廢話不多說,切入正題,這篇文章就先介紹轉換Word為html的過程,Pdf還在研究當中,如果有結果我也會發出來!

 

“JACOB一個Java-COM中間件.通過這個組件你可以在Java應用程序中調用COM組件和Win32 libraries。”

Ps:Jacob只能用於windows系統,如果你的系統不是windows,建議使用Openoffice.org,這個是跨平台的,雖然我沒用,但是應該不麻煩,就是需要先安裝Openoffice這個軟件,然后使用8100服務。至於Poi,說實話,我真不愛用,那個需要先解析word,然后自己覆寫成html,工作量大不說,還得不償失,因為很難保證轉換的html內容的格式與原來word文檔格式一致,並且.docx轉換也很費勁。

 

1、到官網下載Jacob,目前最新版是1.17,地址鏈接:http://sourceforge.net/projects/jacob-project/

2、將壓縮包解壓后,Jacob.jar添加到Libraries中(先復制到項目目錄中,右鍵單擊jar包選擇Build Path—>Add to Build Path);

3、將Jacob.dll放至當前項目所用到的“jre\bin”下面(比如我的Eclipse正在用的Jre路徑是D:\Java\jdk1.7.0_17\jre\bin)。
Ps:我就是按照上面的步驟配置的,一點問題沒有,但是有些人可能還會報錯,比如:java.lang.UnsatisfiedLinkError: no jacob in java.library.path,這是系統沒有加載到jacob.dll,網上解決方法是將Jacob.dll放至“WINDOWS\SYSTEM32”下面(我沒試過,因為我的直接沒問題)

 

Java代碼:

[java]  view plain copy
 
    1. public class JacobUtil {  
    2.       
    3.     // 8 代表word保存成html  
    4.     public static final int WORD_HTML = 8;   
    5.   
    6.     public static void main(String[] args) {  
    7.         String docfile = "C:\\Users\\無名\\Desktop\\xxx.doc";  
    8.         String htmlfile = "C:\\Users\\無名\\Desktop\\xxx.html";  
    9.         JacobUtil.wordToHtml(docfile, htmlfile);  
    10.     }  
    11.       
    12.     /**   
    13.      * WORD轉HTML   
    14.      * @param docfile WORD文件全路徑   
    15.      * @param htmlfile 轉換后HTML存放路徑   
    16.      */    
    17.     public static void wordToHtml(String docfile, String htmlfile)     
    18.     {     
    19.         // 啟動word應用程序(Microsoft Office Word 2003)  
    20.         ActiveXComponent app = new ActiveXComponent("Word.Application");  
    21.         System.out.println("*****正在轉換...*****");  
    22.         try    
    23.         {     
    24.             // 設置word應用程序不可見    
    25.             app.setProperty("Visible"new Variant(false));    
    26.             // documents表示word程序的所有文檔窗口,(word是多文檔應用程序)  
    27.             Dispatch docs = app.getProperty("Documents").toDispatch();    
    28.             // 打開要轉換的word文件  
    29.             Dispatch doc = Dispatch.invoke(     
    30.                     docs,     
    31.                     "Open",     
    32.                     Dispatch.Method,     
    33.                     new Object[] { docfile, new Variant(false),   
    34.                             new Variant(true) }, new int[1]).toDispatch();     
    35.             // 作為html格式保存到臨時文件  
    36.             Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] {     
    37.                     htmlfile, new Variant(WORD_HTML) }, new int[1]);     
    38.             // 關閉word文件  
    39.             Dispatch.call(doc, "Close"new Variant(false));     
    40.         }     
    41.         catch (Exception e)     
    42.         {     
    43.             e.printStackTrace();     
    44.         }     
    45.         finally    
    46.         {     
    47.             //關閉word應用程序  
    48.             app.invoke("Quit"new Variant[] {});     
    49.         }   
    50.         System.out.println("*****轉換完畢********");  
    51.     }  
    52. }  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM