python中------decode解碼出現的0xca問題解決方法

本文轉載自查看原文 2018-12-31 13:03 1031

一。錯誤：

解決方法：

#源代碼
data = sk.recv(1024)
print(str(data,'gbk'))


#修改代碼
data = sk.recv(1024)
print(str(data,'gbk'，‘ignore’))

二。常見錯誤整理

0x00 問題引出：

　　result = res.decode('utf-8')
　　#當執行該語句的時候，會造成異常：
　　UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe5 in position 103339: invalid continuation byte

0x01 問題分析

該情況是由於出現了無法進行轉換的二進制數據造成的，可以寫一個小的腳本來判斷下，是整體的字符集參數選擇上出現了問題，還是出現了部分的無法轉換的二進制塊：

#python3
#以讀入文件為例：
f = open("data.txt","rb")#二進制格式讀文件
while True:
    line = f.readline()
    if not line:
        break
    else:
        try:
            #print(line.decode('utf8'))
            line.decode('utf8')
            #為了暴露出錯誤，最好此處不print
        except:
            print(str(line))

0x03 解決方法

修改字符集參數，一般這種情況出現得較多是在國標碼(GBK)和utf8之間選擇出現了問題。
出現異常報錯是由於設置了decode()方法的第二個參數errors為嚴格（strict）形式造成的，因為默認就是這個參數，將其更改為ignore等即可。例如:

line.decode("utf8","ignore")

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python字符串的encode與decode研究心得亂碼問題解決方法(轉) 《Discuz安裝時候出現亂碼 -- 問題解決方法》 python No tests were found問題解決方法 macaca使用中問題解決方法整理 Python中讀取txt文本出現：SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape問題解決 Centos6.5 python升級成2.7版本出現的一些問題解決方法 python3 庫pandas寫入csv格式文件出現中文亂碼問題解決方法 VB中多個Winsock連續發送出現接收不到的異常問題解決方法關於ubuntu安裝其他應用時出現的依賴問題解決方法 android項目出現紅色大感嘆號的問題解決方法