Unichar, char, wchar_t


之前總結了一些關於字符表示,以及字符串的知識。 

現在在看看一些關於編譯器支持的知識。

L"" Prefix

幾乎所有的編譯器都支持L“” prefix,一個字符串如果帶有L“”prefix,意味着這個字符串中的字符都被作為wide char存儲,但是根據OS的不同這里的wide char又各有不同,比如在Windows上默認使用UTF-16表達Unicode,而MacOSx和Linux使用UTF-32表達Unicode,也就是默認情況下:wchar_t在Windows可用於存儲UTF-16的字符,長度為2個字節;而在Linux上往往用於存儲UTF-32在字符,長度為4個字節。

盡管OS有其默認實現,但有時還是需要使用非默認的情況,比如在Linux上使用UTF16,在Windows上使用UTF32。現實是由於wchar_t在Windows上只能是16bit的,無法支持UTF32,如果需要就只能全部自己做,比如將wchar_t定義為32位,wcslen等函數也都重寫。Linux提供了一些使用UTF16的支持,比如在編譯時,如果指定-fshort-wchar就可以把wchar_t轉化為16bit的,L""Prefix也會將后跟的字符串表達為UTF16。但是Linux並沒有提供wcslen等函數的支持,一旦指定-fshort-wchar,wcslen等函數都被標記為poison,不允許使用,也就是得自己實現wcslen等函數。

Note:使用-fshort-wchar時,Code中已經寫好的sizeof是正確的,但是如果在debugger中調用sizeof,就有可能是錯的,XCode5上還有這個問題。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM