- # coding=utf-8
- import urllib.request
- import re
- url = 'http://www.163.com'
- file = 'd:/test.html'
- data = urllib.request.urlopen(url).read()
- r1 = re.compile('<.*?>')
- c_t = r1.findall(data)
- print(c_t)
發現讀取下來后,運行到第9 行,出現:
can't use a string pattern on a bytes-like object
查找了一下,是說3.0現在的參數更改了,現在讀取的是bytes-like的,但參數要求是chart-like的,找了一下,加了個編碼:
data = data.decode('utf-8')
在與正則使用前,就可以正常使用了..