在python2的使用中,總會遇到各種各樣的編碼問題,這也是使用Python2最頭疼的一件事情,幸好python3解決了編碼的問題。
下面我在爬蟲時遇到的類似éç»äººè¡¨ç®çé¿å ååè¶(æå格式的編碼。
解決:
response = requests.get(url)
response.encoding = response.apparent_encoding # 將亂碼進行編碼
html = etree.HTML(response.text)