python 去除html 超鏈接href 如何實現?


今天持久男 在抓取數據的時候發現很多內容都加了錨文本, 這怎么辦呢? 沒辦法只能通過工具解決

我是這樣解決的:

 

例如:

 

soup = BeautifulSoup('<p>Hello <a href="http://google.com">Google</a></p>') 
for a in soup.findAll('a'):
 del a['href'] 
 print (soup) 

結果:
<p>Hello <a>Google</a></p>

  

成功了.

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM