關於JAVA內存中字符編碼的一些說明,\x,\u,%


1、JAVA中的字符采用UTF-16編碼,一個char只能有兩個字節表示,其中字符串可以使用\u表示UTF-16編碼的標識

2、JAVA中String的length方法返回的是code unit數量,即UTF-16編碼之后的字節數(2字節一單元)

2、有些地方可能有\x這種表示,\x標識實際的編碼之后的2進制數據的16進制表示形式,具體的編碼格式則可能有區別,一般是屬於UTF-8編碼之后的字節的16進制表示形式

3、作為對比Python中,采用直接的Unicode碼點表示,在與網絡交互的時候則需要轉換為具體的UTF-8或者UTF-16等編碼形式

4、關於%,一般用於http請求中路徑中的字符轉義,具體內容比較復雜,參考一下這個網址,也沒深究

總之一句話,不講編碼的轉化都是耍流氓!!!!

https://www.ruanyifeng.com/blog/2010/02/url_encoding.html

參考鏈接

https://crossoverjie.top/2019/09/10/cs/not%20easy%20emoji/

https://docs.oracle.com/javase/specs/jls/se7/html/jls-3.html#jls-3.10.1

https://www.utf8-chartable.de/

https://www.unicode.org/emoji/charts/full-emoji-list.html#1f602


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM