首先,找到一個皮膚網站,其中一個著名的皮膚網站就是 https://littleskin.cn 。進入網站,我們就會見到一堆皮膚,這就是今天我們要爬的皮膚。給各位分享一下代碼。
PS:另外很多人在學習Python的過程中,往往因為遇問題解決不了或者沒好的教程從而導致自己放棄,為此我整理啦從基礎的python腳本到web開發、爬蟲、django、數據挖掘等【PDF等】需要的可以進Python全棧開發交流.裙 :一久武其而而流一思(數字的諧音)轉換下可以找到了,里面有最新Python教程項目可拿,不懂的問題有老司機解決哦,一起相互監督共同進步
import requests import re import time import json download_sucess = True time.sleep(1.5) pictures = input('你想下載多少張皮膚:') while pictures.isdigit() == False: print("請輸入數字!") pictures = input('你想下載多少張皮膚:') Path = input('請輸入保存的路徑:') print("請稍等......") pictures = int(pictures) for i in range(1,pictures+1): url = 'https://littleskin.cn/skinlib/data?filter=skin&uploader=0&sort=likes&keyword=&page=' + str(i) response = requests.get(url).json() ids = re.findall("'tid': (.*?),",str(response)) for id in ids: picture_url = 'https://littleskin.cn/preview/' + id + '.png' picture_name = picture_url.strip('https://littleskin.cn/preview/') picture = requests.get(picture_url).content try: with open(Path + '//%s'%picture_name,'wb') as file: file.write(picture) except FileNotFoundError: download_sucess = False print('路徑不存在!') break if download_sucess == False: print("下載失敗!") elif download_sucess == True: print('下載完成!')
最終效果:
皮膚爬取的原理是通過 json 格式來查看網站的每一張圖片的 id 號,再用拼接的方式組成一個圖片地址,最后再用二進制的方式把圖片存放在我們的文件夾里。希望各位能通過這篇文章學到東西。
總結:很多人在學習Python的過程中,往往因為遇問題解決不了或者沒好的教程從而導致自己放棄,為此我整理啦從基礎的python腳本到web開發、爬蟲、django、數據挖掘等【PDF等】需要的可以進Python全棧開發交流.裙 :一久武其而而流一思(數字的諧音)轉換下可以找到了,里面有最新Python教程項目可拿,不懂的問題有老司機解決哦,一起相互監督共同進步
本文的文字及圖片來源於網絡加上自己的想法,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。