有時候需要css選擇器
1、通過標簽名查找:
<style type="text/css"> p{ background-color:pink; } </style> <body> <div class="box"> <p>123</p> <p>456</p> </body>
print(soup.select('p'))
這時就可以查到123和456得數據
2、通過類名查找:
<style type="text/css"> .line{ background-color:pink; } </style> <body> <div class="box"> <p class="line">123</p> <p>456</p> </body>
print(soup.select('.line'))
這樣就可以查到123得數據
3、通過id查找:
<style type="text/css"> #line1{ background-color:pink; } </style> <body> <div class="box"> <p id="line1">123</p> <p>456</p> </body>
print(soup.select('#sister'))
這樣可以查到123得數據
4、通過組合查找:
<style type="text/css"> .box p{ background-color:pink; } </style> <body> <div class="box"> <p>123</p> <p>456</p> </body>
print(soup.select('p #sister'))
這樣可以得到box下面得p標簽,123和456得值
5、通過屬性查找
<style type="text/css"> input[name='username']{ background-color:pink; } </style> <body> <form> <input type="text" name="username"> </form> </body>
print(soup.select('a[href="http://example.com/elsie"]'))
可以得到這個input標簽