typedef basic_string<char> string;
typedef basic_string<wchar_t> wstring;
前者string是常用類型,可以看作char[],其實這正是與string定義中的
_Elem=char相一致。而wstring,使用的是wchar_t類型,這是寬字符,用於滿足非ASCII字符的要求,例如Unicode編碼,中文,日文,韓文什么的。對於wchar_t類型,實際上C++中都用與char函數相對應的wchar_t的函數,因為他們都是從同一個模板類似於上面的方式定義的。因此也有wcout, wcin, werr等函數。 實際上string也可以使用中文,但是它將一個漢字寫在2個char中。而如果將一個漢字看作一個單位wchar_t的話,那么在wstring中就只占用一個單元,其它的非英文文字和編碼也是如此。這樣才真正的滿足字符串操作的要求,尤其是國際化等工作。
看一下下面的程序,就會理解兩者的差別。
- #include <iostream>
- #include <string>
- using namespace std;
- #define tab "\t"
- int main()
- {
- locale def;
- cout<<def.name()<<endl;
- locale current = cout.getloc();
- cout<<current.name()<<endl;
- float val=1234.56; cout<<val<<endl;
- //chage to french/france
- cout.imbue(locale("chs"));
- current=cout.getloc();
- cout<<current.name()<<endl;
- cout<<val<<endl;
- //上面是說明locale的用法,下面才是本例的內容,因為其中用到了imbue函數
- cout<<"*********************************"<<endl;
- //為了保證本地化輸出(文字/時間/貨幣等),chs表示中國,wcout必須使用本地化解析編碼
- wcout.imbue(std::locale("chs"));
- //string 英文,正確顛倒位置,顯示第二個字符正確
- string str1("ABCabc");
- string str11(str1.rbegin(),str1.rend());
- cout<<"UK\ts1\t:"<<str1<<tab<<str1[1]<<tab<<str11<<endl;
- //wstring 英文,正確顛倒位置,顯示第二個字符正確
- wstring str2=L"ABCabc";
- wstring str22(str2.rbegin(),str2.rend());
- wcout<<"UK\tws4\t:"<<str2<<tab<<str2[1]<<tab<<str22<<endl;
- //string 中文,顛倒后,變成亂碼,第二個字符讀取也錯誤
- string str3("你好么?");
- string str33(str3.rbegin(),str3.rend());
- cout<<"CHN\ts3\t:"<<str3<<tab<<str3[1]<<tab<<str33<<endl;
- //正確的打印第二個字符的方法
- cout<<"CHN\ts3\t:RIGHT\t"<<str3[2]<<str3[3]<<endl;
- //中文,正確顛倒位置,顯示第二個字符正確
- wstring str4=L"你好么?";
- wstring str44(str4.rbegin(),str4.rend());
- wcout<<"CHN\tws4\t:"<<str4<<tab<<str4[1]<<tab<<str44<<endl;
- //只有char類型的string時才可以如此構造
- wstring str5(str1.begin(),str1.end());
- wstring str55(str5.rbegin(),str5.rend());
- wcout<<"CHN\tws5\t:"<<str5<<tab<<str5[1]<<tab<<str55<<endl;
- //如此構造將失敗!!!!
- wstring str6(str3.begin(),str3.end());
- wstring str66(str6.rbegin(),str6.rend());
- wcout<<"CHN\tws6\t:"<<str6<<tab<<str6[1]<<tab<<str66<<endl;
- return 0;
- }
上面顯示了本地化的作用,是在數字中每三位加一個逗號,其實對時間/文字等都是用影響的。
下面的輸出說明了,如何正確使用string和wstring的方法。第三個因為使用string來表示漢字,出現了一些錯誤。最后一行也是錯誤,導致了輸出也受到了影響,沒有空格與回車。(最后兩個就不要管中英文了,僅僅說明一下中文構造方法是錯誤的)
《掌握標准C++類》在第十二章《語言支持》中專門講C++的國際化和本地化問題,C++提供了I18N的標准處理,軟件開發者可以參考。 C++標准庫還是非常博大精深的,功能比較齊全的。繼續學習。
來自: http://hi.baidu.com/janvyking999/blog/item/fd5d44df572c3c5c94ee37de.html