codecs
https://docs.python.org/3/library/codecs.html
我們經常用open打開文件的時候會出現各式各樣的錯誤,編碼格式的問題,等等~真的很煩
現在盡量使用codecs的方式打開文件
txt文檔是這樣的,使用open()的方式,打開直接報錯。
那么使用codecs的方式,如下:
import codecs f = codecs.open("123.txt","r","utf-8") words = f.read()
基本使用到現在沒有出現錯誤!
為了獲取id我們還需要使用正則匹配
import re import codecs f = codecs.open(r"78.txt","r","utf-8") words = f.read() p = re.compile(' ID="(.*?)" IsException', re.S) ids = re.findall(p , words) #ids這里是以list的形式儲存 s = '\n'.join(ids) #每一項都換行打印 print(s)
>>>
最終得到id