Java解析html頁面,獲取想要的元素

本文轉載自查看原文 2017-09-05 14:35 6826 JAVA

背景:通過接口訪問數據，獲取的內容是個標准的html格式，使用jsoup的方式獲取頁面元素值

先推薦比較好的博客：http://www.open-open.com/jsoup/、單個案例比較不錯

http://blog.csdn.net/u010814849/article/details/52526582 整合內容很多

1.插件下載並安裝

官網安裝地址：http://jsoup.org/packages/jsoup-1.8.1.jar

2.使用（目前都是用的css方式定位元素）

1.獲取這個網頁的商品標題內容

代碼說明：response為頁面的網頁元素，一個標准的html

Document doc = Jsoup.parse(resopnes); // 使用jsoup 進行語言轉換
String getTitle = doc.select("#goods_title").attr("value");// 商品標題 #使用css方式

2. 獲取靜態頁面的標題，元素input

可直接使用瀏覽器的css方式：#showtab0 > tbody > tr:nth-child(2) > td:nth-child(2) > input.input_style

Document doc = Jsoup.parse(resopnes); // 使用jsoup 進行語言轉換

String getProductName = doc.select("#showtab0 > tbody > tr:nth-child(2) > td:nth-child(2) > input.input_style").attr("value");
System.out.println("商品名稱:"+getProductName);

3.獲取其他說明，元素為textarea

String detail = doc.select("#goods_desc_en").text();// 詳細描述
System.out.println("詳細描述"+detail);

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 JAVA解析HTML，獲取待定元素屬性【JavaMail-解析郵件HTML郵件獲取想要的值】【Java解析PDF並獲取想要的字符串】遍歷獲取html頁面所有元素的id html之獲取元素距離頁面頂部的高度 python解析日志,獲取想要的數據 BeautifulReport底層框架的解析以及html報告頁面元素的更改 HTML iframe, 獲取iframe子頁面中的元素(基於JavaScript) html頁面之間的傳值，獲取元素和方法的調用字典的創建、刪除以及獲取字典中想要的元素