beautiful soup解析有空格的class

本文轉載自查看原文 2016-12-01 21:27 3696 python爬蟲/ beautiful soup

用Python寫一個爬蟲，用BeautifulSoup解析html。
其中一個地方需要抓取下面兩類標簽：

<dd class="ab "   >blabla1</dd>
<dd class="ab cd" >blabla2</dd>

第一類class的值的末尾有一個空格。
第二類class的值中間有一個空格，而且開頭部分和第一類相同。

在css中，class的值不應該有空格，所以第一類會忽略空格，第二類會被當做多值屬性。參考官方文檔多值屬性。

所以在處理時也不需再考慮class值中的空格。

傳入參數時用列表過濾器是最方便的，如下:

soup.find_all("dd", class_= ["ab", "cd"])

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python中html解析-Beautiful Soup 小白學 Python 爬蟲（21）：解析庫 Beautiful Soup（上） 2.33 定位的坑：class屬性有空格 beautiful soup的用法 python Beautiful Soup的使用通過PyCharm安裝Beautiful Soup etree和Beautiful Soup的使用 (轉)利用Beautiful Soup去抓取p標簽下class=jstest的內容 python爬蟲之Beautiful Soup的基本使用 python爬蟲數據解析的四種不同選擇器Xpath，Beautiful Soup，pyquery，re