在C++里截取字符串可以使用string.substr(),可是這個函數只能按英文來截取,
如果是漢字可能就要計算好字符個數,如果是漢字和英文混合,那就只能望洋興嘆了。
可是恰好我需要這樣一個函數,於是就自己實現了一個,其中如何判斷漢字和英文
參看了此處。
代碼簡單也無優化,若有更好的方法歡迎提出,代碼如下。
#include <iostream> #include <string> #include<cstdio> #include<vector> #include<typeinfo> using namespace std; int is_zh_ch(char p) { /*漢字的兩個字節的最高為都為1,這里采用判斷最高位的方法 將p字節進行移位運算,右移8位,這樣,如果移位后是0, 則說明原來的字節最高位為0,不是1那么也就不是漢字的一個字節 */ if(~(p >> 8) == 0) { return 1;//代表不是漢字 } return -1; } string sub(string str,int start,int end=-1) { if(typeid(str)==typeid(string) && str.length()>0) { int len=str.length(); string tmp=""; //先把str里的漢字和英文分開 vector <string> dump; int i=0; while(i<len) { if (is_zh_ch(str.at(i))==1) { dump.push_back(str.substr(i,2)); i=i+2; } else { dump.push_back(str.substr(i,1)); i=i+1; } } end=end>0?end:dump.size(); //end默認為dump.size if(start<0||start>end) printf("start is wrong");
//直接從dump里取即可 for(i=start; i<=end; i++) { tmp+=dump[i-1]; } return tmp; } else { printf("str is not string\n"); return ""; } } int main() { string p="半山wuji"; cout<<sub(p,1,1)<<endl; cout<<sub(p,2,2)<<endl; cout<<sub(p,3); }
輸出如下:
半
山
wuji
符合我的要求。
