python基礎===codecs打開文件,解決文件編碼格式的問題


codecs

https://docs.python.org/3/library/codecs.html

 

我們經常用open打開文件的時候會出現各式各樣的錯誤,編碼格式的問題,等等~真的很煩

現在盡量使用codecs的方式打開文件

txt文檔是這樣的,使用open()的方式,打開直接報錯。

那么使用codecs的方式,如下:

import codecs

f = codecs.open("123.txt","r","utf-8")
words = f.read()

 

基本使用到現在沒有出現錯誤!


 

為了獲取id我們還需要使用正則匹配

import re
import codecs

f = codecs.open(r"78.txt","r","utf-8")
words = f.read()
p = re.compile(' ID="(.*?)" IsException', re.S)
ids = re.findall(p , words)       #ids這里是以list的形式儲存
s = '\n'.join(ids)                #每一項都換行打印
print(s)

>>>

最終得到id

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM