字符串轉碼UTF8轉碼為GBK的C語言程序源代碼

本文轉載自查看原文 2013-06-28 13:17 3109 C/C++/ gbk/ gb2312/ 漢字/ 編碼/ 轉碼/ 轉換/ utf8/ 亂碼

GBK和UTF8之間的轉換可以使用MultiByteToWideChar和WideCharToMultiByte兩個API，方法是先把它們轉換為中間編碼Unicode，再轉換為對應的編碼即可。

#include <stdio.h>

#include <windows.h>

//GBK編碼轉換到UTF8編碼

int GBKToUTF8(unsigned char * lpGBKStr,unsigned char * lpUTF8Str,int nUTF8StrLen)

{

wchar_t * lpUnicodeStr = NULL;

int nRetLen = 0;

if(!lpGBKStr) //如果GBK字符串為NULL則出錯退出

return 0;

nRetLen = ::MultiByteToWideChar(CP_ACP,0,(char *)lpGBKStr,-1,NULL,NULL); //獲取轉換到Unicode編碼后所需要的字符空間長度

lpUnicodeStr = new WCHAR[nRetLen + 1]; //為Unicode字符串空間

nRetLen = ::MultiByteToWideChar(CP_ACP,0,(char *)lpGBKStr,-1,lpUnicodeStr,nRetLen); //轉換到Unicode編碼

if(!nRetLen) //轉換失敗則出錯退出

return 0;

nRetLen = ::WideCharToMultiByte(CP_UTF8,0,lpUnicodeStr,-1,NULL,0,NULL,NULL); //獲取轉換到UTF8編碼后所需要的字符空間長度

if(!lpUTF8Str) //輸出緩沖區為空則返回轉換后需要的空間大小

{

if(lpUnicodeStr)

delete []lpUnicodeStr;

return nRetLen;

}

if(nUTF8StrLen < nRetLen) //如果輸出緩沖區長度不夠則退出

{

if(lpUnicodeStr)

delete []lpUnicodeStr;

return 0;

}

nRetLen = ::WideCharToMultiByte(CP_UTF8,0,lpUnicodeStr,-1,(char *)lpUTF8Str,nUTF8StrLen,NULL,NULL); //轉換到UTF8編碼

if(lpUnicodeStr)

delete []lpUnicodeStr;

return nRetLen;

}

// UTF8編碼轉換到GBK編碼

int UTF8ToGBK(unsigned char * lpUTF8Str,unsigned char * lpGBKStr,int nGBKStrLen)

{

wchar_t * lpUnicodeStr = NULL;

int nRetLen = 0;

if(!lpUTF8Str) //如果UTF8字符串為NULL則出錯退出

return 0;

nRetLen = ::MultiByteToWideChar(CP_UTF8,0,(char *)lpUTF8Str,-1,NULL,NULL); //獲取轉換到Unicode編碼后所需要的字符空間長度

lpUnicodeStr = new WCHAR[nRetLen + 1]; //為Unicode字符串空間

nRetLen = ::MultiByteToWideChar(CP_UTF8,0,(char *)lpUTF8Str,-1,lpUnicodeStr,nRetLen); //轉換到Unicode編碼

if(!nRetLen) //轉換失敗則出錯退出

return 0;

nRetLen = ::WideCharToMultiByte(CP_ACP,0,lpUnicodeStr,-1,NULL,NULL,NULL,NULL); //獲取轉換到GBK編碼后所需要的字符空間長度

if(!lpGBKStr) //輸出緩沖區為空則返回轉換后需要的空間大小

{

if(lpUnicodeStr)

delete []lpUnicodeStr;

return nRetLen;

}

if(nGBKStrLen < nRetLen) //如果輸出緩沖區長度不夠則退出

{

if(lpUnicodeStr)

delete []lpUnicodeStr;

return 0;

}

nRetLen = ::WideCharToMultiByte(CP_ACP,0,lpUnicodeStr,-1,(char *)lpGBKStr,nRetLen,NULL,NULL); //轉換到GBK編碼

if(lpUnicodeStr)

delete []lpUnicodeStr;

return nRetLen;

}

//使用這兩個函數的例子

int main()

{

char cGBKStr[] = "我是中國人!";

char * lpGBKStr = NULL;

char * lpUTF8Str = NULL;

FILE * fp = NULL;

int nRetLen = 0;

nRetLen = GBKToUTF8((unsigned char *)cGBKStr,NULL,NULL);

printf("轉換后的字符串需要的空間長度為：%d ",nRetLen);

lpUTF8Str = new char[nRetLen + 1];

nRetLen = GBKToUTF8((unsigned char *)cGBKStr,(unsigned char *)lpUTF8Str,nRetLen);

if(nRetLen)

{

printf("GBKToUTF8轉換成功！");

}

else

{

printf("GBKToUTF8轉換失敗！");

goto Ret0;

}

fp = fopen("C:\GBK轉UTF8.txt","wb"); //保存到文本文件

fwrite(lpUTF8Str,nRetLen,1,fp);

fclose(fp);

getchar(); //先去打開那個文本文件看看，單擊記事本的“文件”-“另存為”菜單，在對話框中看到編碼框變為了“UTF-8”說明轉換成功了

nRetLen = UTF8ToGBK((unsigned char *)lpUTF8Str,NULL,NULL); //再轉回來

printf("轉換后的字符串需要的空間長度為：%d ",nRetLen);

lpGBKStr = new char[nRetLen + 1];

nRetLen = UTF8ToGBK((unsigned char *)lpUTF8Str,(unsigned char *)lpGBKStr,nRetLen);

if(nRetLen)

{

printf("UTF8ToGBK轉換成功！ ");

}

else

{

printf("UTF8ToGBK轉換失敗！ ");

goto Ret0;

}

fp = fopen("C:\UTF8轉GBK.txt","wb"); //保存到文本文件

fwrite(lpGBKStr,nRetLen,1,fp);

fclose(fp);

getchar(); //再去打開文本文件看看，發現編碼框又變為了“ANSI”說明轉換成功了

Ret0:

if(lpGBKStr)

delete []lpGBKStr;

if(lpUTF8Str)

delete []lpUTF8Str;

return 0;

}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 PHP——字符串統一轉碼為GBK，自動判斷是否UTF8並轉碼字符串轉碼中文亂碼問題的進一步理解 UTF-8 GBK轉碼 Python字符編碼轉碼之GBK,UTF8互轉 VC++互相轉碼GBK，unicode，utf8 字符串轉碼utf-8以及解碼 iOS開發日記7-字符編碼(UTF8轉碼) C++ 字符串UTF8與GBK轉化 GBK和UTF-8互相轉碼 C# winForm utf8 gbk 相互轉碼小工具 Python 對目錄中的文件進行批量轉碼（GBK>UTF8）