解析html標簽並轉化成圖片

本文轉載自查看原文 2013-01-07 14:04 4489 java

1、最直接的方式——使用Robot

　　方法詳解：該方法利用Robat提供的強大桌面操作能力，硬性調用瀏覽器打開指定網頁，並將網頁信息保存到本地。

　　優勢：簡單易用，不需要任何第三方插件。

　　缺點：不能同時處理大量數據，技術含量過低，屬於應急型技巧。

2、最常規的方式——利用JNI，調用第三方C/C++組件

　　方法詳解：目前來講，Java領域對於網頁截圖組件的開發明顯不足，當您需要完成此種操作時，算得上碰到了Java的軟肋。但是，眾所周知Java也擁有強大的JNI能力，可以輕易將C/C++開發的同類組件引為己用。

　　優勢：實現簡單，只需要封裝對應的DLL文件，就可以讓Java實現同類功能。

　　劣勢：同其他JNI實現一樣，在跨平台時存在隱患，而且您的程序將不再屬於純Java應用。

3、最扎實的方法——自行解析HTML標記，並將其圖像化

　　方法詳解：眾所周知，HTML之所以在瀏覽器中以具體的網頁格式出現，並非服務器端傳了一整個應用到客戶端，而是源自於瀏覽器對於客戶端自行解析的結果。因此，只要我們將對應的解析一一實現，那么將網頁圖形化，就將不是什么難事。

　　優勢：純Java實現，一勞永逸，一旦開發完成則永遠通用，而且有一定的商用價值。

　　劣勢：開發費時，且需要針對不同語法做精確分析，才能保證輸出的基本正確。尤其在涉及到JavaScript解析時，難度將尤其增大。

　　現成的開源類庫很少，推薦一個http://www.oschina.net/p/html2image，不過這個生成的圖片會比實際的html標簽顯示多出來3px的邊框

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 html中canvas渲染圖片，並轉化成base64格式保存關於word轉化成xml，圖片的轉換 java執行命令並通過libreoffice軟件的方式將word轉化成HTML的詳細步驟解析 html dom 轉化成圖片踩坑記（canvas toDataURL） python3.6.3中html頁面轉化成pdf Java 接收String類型的日期參數並轉化成Date類型 python3提取mysql數據並轉化成字典數組如何將Word 或 PDF文件轉化成長圖片？將activity轉化成view JS上傳圖片轉化成Base64編碼demo