python爬蟲(二十) select方法


有時候需要css選擇器

1、通過標簽名查找:

<style type="text/css">
      p{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p>123</p>
       <p>456</p>
</body>
print(soup.select('p'))

這時就可以查到123和456得數據

2、通過類名查找:

<style type="text/css">
      .line{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p  class="line">123</p>
       <p>456</p>
</body>
print(soup.select('.line'))

這樣就可以查到123得數據

3、通過id查找:

<style type="text/css">
      #line1{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p  id="line1">123</p>
       <p>456</p>
</body>
print(soup.select('#sister'))

這樣可以查到123得數據

4、通過組合查找:

<style type="text/css">
      .box  p{
            background-color:pink;
        }
</style>
<body>
       <div class="box">
       <p>123</p>
       <p>456</p>
</body>
print(soup.select('p #sister'))

這樣可以得到box下面得p標簽,123和456得值

5、通過屬性查找

<style type="text/css">
      input[name='username']{
            background-color:pink;
        }
</style>
<body>
     <form>
     <input  type="text" name="username">
     </form>
</body>
print(soup.select('a[href="http://example.com/elsie"]'))

可以得到這個input標簽


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM