之前總結了一些關於字符表示,以及字符串的知識。
現在在看看一些關於編譯器支持的知識。
L"" Prefix
幾乎所有的編譯器都支持L“” prefix,一個字符串如果帶有L“”prefix,意味着這個字符串中的字符都被作為wide char存儲,但是根據OS的不同這里的wide char又各有不同,比如在Windows上默認使用UTF-16表達Unicode,而MacOSx和Linux使用UTF-32表達Unicode,也就是默認情況下:wchar_t在Windows可用於存儲UTF-16的字符,長度為2個字節;而在Linux上往往用於存儲UTF-32在字符,長度為4個字節。
盡管OS有其默認實現,但有時還是需要使用非默認的情況,比如在Linux上使用UTF16,在Windows上使用UTF32。現實是由於wchar_t在Windows上只能是16bit的,無法支持UTF32,如果需要就只能全部自己做,比如將wchar_t定義為32位,wcslen等函數也都重寫。Linux提供了一些使用UTF16的支持,比如在編譯時,如果指定-fshort-wchar就可以把wchar_t轉化為16bit的,L""Prefix也會將后跟的字符串表達為UTF16。但是Linux並沒有提供wcslen等函數的支持,一旦指定-fshort-wchar,wcslen等函數都被標記為poison,不允許使用,也就是得自己實現wcslen等函數。
Note:使用-fshort-wchar時,Code中已經寫好的sizeof是正確的,但是如果在debugger中調用sizeof,就有可能是錯的,XCode5上還有這個問題。
