常見字符編碼特征
1.以%開頭的一般是做了URL編碼的,用urllib.parse.unquote()解碼。
2.以&#開頭的一般是做了Unicode轉義處理,html.unescape()做反轉義。
3.以&#x開頭的是做了Unicode 16進制轉義,也用html.unescape()做反轉義。
4.以\u開頭的是一般是UTF-8編碼。
5.字符串后面以=結尾的,通常是做了base64編碼處理的
常見字符編碼特征
1.以%開頭的一般是做了URL編碼的,用urllib.parse.unquote()解碼。
2.以&#開頭的一般是做了Unicode轉義處理,html.unescape()做反轉義。
3.以&#x開頭的是做了Unicode 16進制轉義,也用html.unescape()做反轉義。
4.以\u開頭的是一般是UTF-8編碼。
5.字符串后面以=結尾的,通常是做了base64編碼處理的
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。