寫在前面
windows
文件或文件夾命名包含以上任何字符時會報錯,所以使用python
做爬蟲或其它項目時需要注意保存文件名不能包含這些字符。如果有的話,請用字符串的replace
方法替換為空。
測試樣例
https://img-blog.csdnimg.cn/20201116003919682.jpg
下載代碼
import requests
url = 'https://img-blog.csdnimg.cn/20201116003919682.jpg'
name = 'test<*?.jpg'
sets = ['/', '\\', ':', '*', '?', '"', '<', '>', '|']
for char in name:
if char in sets:
name = name.replace(char, '')
res = requests.get(url)
with open(name, 'wb') as f:
f.write(res.content)
代碼分析
假如我們通過爬蟲獲取到了很多張圖片的鏈接和名字,但是名字不知道是否包含有windows
命名所不支持的特殊字符,因此下載保存圖片之前需要對文件名進行處理,將不支持的字符替換為空:
name = 'test<*?.jpg'
sets = ['/', '\\', ':', '*', '?', '"', '<', '>', '|']
for char in name:
if char in sets:
name = name.replace(char, '')
注:\
在python
中是轉義字符,所以如果想表示\
必須用\\
。
溫馨提示
windows
對於文件或文件夾的命名大小寫不敏感。舉個栗子:同一目錄下,不能同時存在a.txt
和A.txt
兩個文件。因此,下載保存文件時除了不能包含一些特殊字符外也要注意大小寫問題。當然,這不是python
的問題,而是windows
系統的問題,所以用其它編程語言應該也會遇到同樣的問題。