在UNICODE編碼格式下, CString 轉換為 char* :


//轉換示例:
CString cstring= "hello,bro ";
char* pcharbuf=new char;
int iSize = WideCharToMultiByte(CP_ACP, 0, cstring, -1, NULL, 0, NULL, NULL);
WideCharToMultiByte(CP_ACP, 0, cstring, -1, pcharbuf, iSize, 0, 0);

 

//WideCharToMultiByte()函數原型如下:
int
WINAPI
WideCharToMultiByte(
    _In_ UINT CodePage,
    _In_ DWORD dwFlags,
    _In_NLS_string_(cchWideChar) LPCWCH lpWideCharStr,  //待轉換的寬字符串
    _In_ int cchWideChar,  //待轉換寬字符串的長度,-1表示轉換到字符串結尾。
    _Out_writes_bytes_to_opt_(cbMultiByte, return) LPSTR lpMultiByteStr,  //接收轉換后輸出新串的緩沖區。
    _In_ int cbMultiByte,  //輸出緩沖區大小,如果為0,lpMultiByteStr將被忽略,函數將返回所需緩沖區大小而不使用lpMultiByteStr。
    _In_opt_ LPCCH lpDefaultChar,
    _Out_opt_ LPBOOL lpUsedDefaultChar
    );

此函數把寬字符串轉換為指定的新字符串,如ANSI,UTF8等,新字符串不必是多字節字符集。

CodePage: 指定要轉換成的字符集代碼頁,它可以是任何已經安裝的或系統自帶的字符集,你也可以使用如下所示代碼頁之一。

CP_ACP 當前系統ANSI代碼頁
CP_MACCP 當前系統Macintosh代碼頁
CP_OEMCP 當前系統OEM代碼頁,一種原始設備制造商硬件掃描碼
CP_SYMBOL Symbol代碼頁,用於Windows 2000及以后版本,我不明白是什么
CP_THREAD_ACP 當前線程ANSI代碼頁,用於Windows 2000及以后版本,我不明白是什么
CP_UTF7 UTF-7,設置此值時lpDefaultChar和lpUsedDefaultChar都必須為NULL
CP_UTF8 UTF-8,設置此值時lpDefaultChar和lpUsedDefaultChar都必須為NULL

 

dwFlags: 指定如何處理沒有轉換的字符, 但不設此參數函數會運行的更快一些,因此可設為0。 可設的值如下表所示:
WC_NO_BEST_FIT_CHARS 把不能直接轉換成相應多字節字符的Unicode字符轉換成lpDefaultChar指定的默認字符。也就是說,如果把Unicode轉換成多字節字符,然后再轉換回來,你並不一定得到相同的Unicode字符,因為這期間可能使用了默認字符。此選項可以單獨使用,也可以和其他選項一起使用。
WC_COMPOSITECHECK 把合成字符轉換成預制的字符。它可以與后三個選項中的任何一個組合使用,如果沒有與他們中的任何一個組合,則與選項WC_SEPCHARS相同。
WC_ERR_INVALID_CHARS 此選項會致使函數遇到無效字符時失敗返回,並且GetLastError會返回錯誤碼ERROR_NO_UNICODE_TRANSLATION。否則函數會自動丟棄非法字符。此選項只能用於UTF8。
WC_DISCARDNS 轉換時丟棄不占空間的字符,與WC_COMPOSITECHECK一起使用
WC_SEPCHARS 轉換時產生單獨的字符,此是默認轉換選項,與WC_COMPOSITECHECK一起使用
WC_DEFAULTCHAR 轉換時使用默認字符代替例外的字符,(最常見的如’?’),與WC_COMPOSITECHECK一起使用。

當指定WC_COMPOSITECHECK時,函數會將合成字符轉換成預制字符。合成字符由一個基字符和一個不占空間的字符(如歐洲國家及漢語拼音的音標)組成,每一個都有不同的字符值。預制字符有一個用於表示基字符和不占空間字符的合成體的單一的字符值。
當指定WC_COMPOSITECHECK選項時,也可以使用上表列出的最后3個選項來定制預制字符的轉換規則。這些選項決定了函數在遇到寬字符串的合成字符沒有對應的預制字符時的行為,他們與WC_COMPOSITECHECK一起使用,如果都沒有指定,函數默認WC_SEPCHARS。

對於下列代碼頁,dwFlags必須為0,否則函數返回錯誤碼ERROR_INVALID_FLAGS。
50220 50221 50222 50225 50227 50229 52936 54936 57002到57011 65000(UTF7) 42(Symbol)
對於UTF8,dwFlags必須為0或WC_ERR_INVALID_CHARS,否則函數都將失敗返回並設置錯誤碼ERROR_INVALID_FLAGS,你可以調用GetLastError獲得。

 

cbMultiByte: 輸出緩沖區大小,如果為0,lpMultiByteStr將被忽略,函數將返回所需緩沖區大小而不使用lpMultiByteStr。

 

lpDefaultChar: 指向字符的指針, 在指定編碼里找不到相應字符時使用此字符作為默認字符代替。 如果為NULL則使用系統默認字符。對於要求此參數為NULL的dwFlags而使用此參數,函數將失敗返回並設置錯誤碼ERROR_INVALID_PARAMETER。

 

lpUsedDefaultChar:開關變量的指針,用以表明是否使用過默認字符。對於要求此參數為NULL的dwFlags而使用此參數,函數將失敗返回並設置錯誤碼ERROR_INVALID_PARAMETER。lpDefaultChar和lpUsedDefaultChar都設為NULL,函數會更快一些。


返回值: 如果函數成功,且cbMultiByte非0,返回寫入lpMultiByteStr的字節數(包括字符串結尾的null);cbMultiByte為0,則返回轉換所需字節數。函數失敗,返回0。

注意:函數WideCharToMultiByte使用不當,會給影響程序的安全。調用此函數會很容易導致內存泄漏,因為lpWideCharStr指向的輸入緩沖區大小是寬字符數,而lpMultiByteStr指向的輸出緩沖區大小是字節數。為了避免內存泄漏,應確保為輸出緩沖區指定合適的大小。可以先使cbMultiByte為0調用WideCharToMultiByte一次以獲得所需緩沖區大小,為緩沖區分配空間,然后再次調用WideCharToMultiByte填充緩沖區,詳見下面的代碼。另外,從Unicode UTF16向非Unicode字符集轉換可能會導致數據丟失,因為該字符集可能無法找到表示特定Unicode數據的字符。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM