Python使用content.encode("utf-8").decode("unicode-escape")導致中文亂碼的解決方法 - 碼上歡樂

相關內容簡體繁體

Python使用content.encode("utf-8").decode("unicode-escape")導致中文亂碼的解決方法

本文轉載自查看原文 2020-09-09 12:01 855 Python

當想要把一個字符串中的\u002F這樣的字符串轉成正常字符串時，如果字符串中存在中文字符，將導致中文被轉成亂碼。
例如：

content = "\\u002F哈哈"
content = content.encode("utf-8").decode("utf-8") 
==> \u002F哈哈  無法進行轉碼

如果使用.decode(“unicode-escape”)

content = "\\u002F哈哈"
content = content.encode("utf-8").decode("unicode-escape")
==> /å“ˆå“ˆ   中文被轉碼導致亂碼

解決方法是逐段解碼，只對\uxxxx這樣的字符串進行unicode-escape解碼，代碼如下

import re
content = "\\u002F哈哈"
content = re.sub(r'(\\u[\s\S]{4})',lambda x:x.group(1).encode("utf-8").decode("unicode-escape"),content)
==> /哈哈

補充：自己

content = "\u002F哈哈"
content.encode("utf-8").decode("unicode-escape")
print(content)
==> /哈哈

原文：https://blog.csdn.net/wang785994599/article/details/97653329

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python爬蟲:decode('utf-8')之后還是亂碼的解決 mysql加密與解密decode與encode亂碼解決方法(轉) Java 使用URLEncoder.encode和URLDecoder.decode編解碼(utf-8)中文及特殊字符 python3：(unicode error) 'utf-8' codec can't decode python正則中如何匹配漢字以及encode(‘utf-8’)和decode(‘utf-8’)的互轉 idea軟件編碼已經設置好了為utf-8，但是svn中down下來的文件格式本身不是utf-8的，此時打開后會出現中文亂碼解決方法 Sublime text 2/3 [Decode error - output not utf-8] 完美解決方法 python寫入mysql時候出現'latin-1' codec can't encode character 問題解決方法以及python設置utf-8 postman測試接口報Content type 'text/plain;charset=UTF-8' not supported解決方法使用vscode運行python出現中文亂碼的解決方法

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM