c++截取漢字和英文混合字符串

本文轉載自查看原文 2013-04-11 21:48 3556 cpp/ 漢字截取/ C/Cpp基礎

在C++里截取字符串可以使用string.substr()，可是這個函數只能按英文來截取，

如果是漢字可能就要計算好字符個數，如果是漢字和英文混合，那就只能望洋興嘆了。

可是恰好我需要這樣一個函數，於是就自己實現了一個，其中如何判斷漢字和英文

參看了此處。

代碼簡單也無優化，若有更好的方法歡迎提出，代碼如下。

#include <iostream>
#include <string>
#include<cstdio>
#include<vector>
#include<typeinfo>
using namespace std;

int is_zh_ch(char p)
{

    /*漢字的兩個字節的最高為都為1,這里采用判斷最高位的方法
    將p字節進行移位運算，右移8位，這樣，如果移位后是0，
    則說明原來的字節最高位為0，不是1那么也就不是漢字的一個字節
    */
    if(~(p >> 8) == 0)
    {
        return 1;//代表不是漢字
    }

    return -1;
}



string sub(string str,int start,int end=-1)
{

    if(typeid(str)==typeid(string) && str.length()>0)
    {
        int len=str.length();

        string tmp="";

        //先把str里的漢字和英文分開
        vector <string> dump;
        int i=0;
        while(i<len)
        {
            if (is_zh_ch(str.at(i))==1)
            {
                dump.push_back(str.substr(i,2));
                i=i+2;

            }
            else
            {
                dump.push_back(str.substr(i,1));
                i=i+1;
            }
        }


        end=end>0?end:dump.size(); //end默認為dump.size
        if(start<0||start>end)
            printf("start is wrong");
　　　　　//直接從dump里取即可
        for(i=start; i<=end; i++)
        {
            tmp+=dump[i-1];
        }

        return tmp;
    }
    else
    {
        printf("str is not string\n");
        return "";

    }
}

int main()
{
    string p="半山wuji";
    cout<<sub(p,1,1)<<endl;
    cout<<sub(p,2,2)<<endl;
    cout<<sub(p,3);
}

輸出如下：

半
山
wuji

符合我的要求。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 c++ 帶中文漢字的字符串截取 c++ 帶中文漢字的字符串截取（2）中英文混合字符串截取java Java 截取中英文混合字符串 c++關於字符串的讀入和截取 Lua截取utf-8編碼的中英文混合字符串 PHP針對中英文混合字符串長度判斷及截取方法 javascript截取字符串(支持中英文混合) 判斷字符串是數字還是漢字還是英文 C#、Java實現按字節截取字符串包含中文漢字和英文字符數字標點符號等