Java 獲取Html文本中的img標簽下src中的內容方法


如下所示:

/**
  * 得到網頁中圖片的地址
  * @param sets html字符串
  */
 public Set<String> getImgStr(String htmlStr) {
  Set<String> pics = new HashSet<String>();
  String img = "";
  Pattern p_image;
  Matcher m_image;
  String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
  p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
  m_image = p_image.matcher(htmlStr);
  while (m_image.find()) {
   // 得到<img />數據
   img = m_image.group();
   // 匹配<img>中的src數據
   Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
   while (m.find()) {
    pics.add(m.group(1));
   }
  }
  return pics;
 }


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM