在寫爬蟲的過程中發現,很多網站的信息均以當天日期為鏈接組成部分,但是格式又不相同
有些是20210328,有些是2021-03-28,還有些2021/03/28
如果一次爬取來源不同網站的信息,需要對日期格式進行處理
先上代碼
import datetime def getYesterday(): today=datetime.date.today() oneday=datetime.timedelta(days=1) yesterday=today-oneday gyesterday=str(yesterday)[:7]+'/'+str(yesterday)[8:] nyesterday=str(yesterday)[:4]+str(yesterday)[5:7]+str(yesterday)[8:] return(str(yesterday),gyesterday,nyesterday) time = getYesterday() print(time)
打印后
這里的思路主要是獲取當天日期,然后進行分隔符處理,再拼接起來,上面的腳本用於獲取昨天日期