不能一事無成,這么久了學python還是吊着,要落地,落在博客園好了,好像公司也只能上博客園了
昨天看了一篇用正則爬電影天堂的視頻,直接拿來用,爬磁力吧,爬好玩的
1 #導入模塊 2 import requests 3 import re 4 5 #用一個變量接受輸入 6 input_name = input("輸入關鍵字搜索:") 7 8 for n in range(1,2): #n是頁碼 看情況,想多搜就放大點 9 # 網址 用+ +進行拼接,還很好用 10 a_url = 'https://www.ciliba.org/s/'+input_name+'_rel_'+str(n)+'.html' 11 html_1 = requests.get(a_url) 12 html_1.encoding = 'utf-8' #轉碼 13 print(html_1.status_code) #返回碼為200則說明能爬 14 detail_list = re.findall('<div class="item-title"><h3><a href="(.*?)" target="_blank',html_1.text) 15 #print(detail_list) 16 for m in detail_list: 17 html_2 = requests.get(m) 18 html_2.encoding = 'utf-8' 19 ftp = re.findall('資源下載:<a href="(.*?)" class="download" >磁力鏈接</a>',html_2.text) 20 #print(ftp) 21 with open('C:\\Users\\wyx\\Desktop\\'+input_name+'的磁力鏈.txt','a',encoding='utf-8') as ff: 22 ff.write(ftp[0]+'\n') 23 print("the search is done")
最后在桌面上形成相關關鍵字的文件,我試了蒼老師,可以的
很入門,努力中
