解析html標簽並轉化成圖片


1、最直接的方式——使用Robot

  方法詳解:該方法利用Robat提供的強大桌面操作能力,硬性調用瀏覽器打開指定網頁,並將網頁信息保存到本地。

  優勢:簡單易用,不需要任何第三方插件。

  缺點:不能同時處理大量數據,技術含量過低,屬於應急型技巧。

2、最常規的方式——利用JNI,調用第三方C/C++組件

  方法詳解:目前來講,Java領域對於網頁截圖組件的開發明顯不足,當您需要完成此種操作時,算得上碰到了Java的軟肋。但是,眾所周知Java也擁有強大的JNI能力,可以輕易將C/C++開發的同類組件引為己用。

  優勢:實現簡單,只需要封裝對應的DLL文件,就可以讓Java實現同類功能。

  劣勢:同其他JNI實現一樣,在跨平台時存在隱患,而且您的程序將不再屬於純Java應用。

3、最扎實的方法——自行解析HTML標記,並將其圖像化

  方法詳解:眾所周知,HTML之所以在瀏覽器中以具體的網頁格式出現,並非服務器端傳了一整個應用到客戶端,而是源自於瀏覽器對於客戶端自行解析的結果。因此,只要我們將對應的解析一一實現,那么將網頁圖形化,就將不是什么難事。

  優勢:純Java實現,一勞永逸,一旦開發完成則永遠通用,而且有一定的商用價值。

  劣勢:開發費時,且需要針對不同語法做精確分析,才能保證輸出的基本正確。尤其在涉及到JavaScript解析時,難度將尤其增大。

  現成的開源類庫很少,推薦一個http://www.oschina.net/p/html2image,不過這個生成的圖片會比實際的html標簽顯示多出來3px的邊框


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM