一、用strtok函數進行字符串分割
原型: char *strtok(char *str, const char *delim);
功能:分解字符串為一組字符串。
參數說明:str為要分解的字符串,delim為分隔符字符串。
返回值:從str開頭開始的一個個被分割的串。當沒有被分割的串時則返回NULL。
其它:strtok函數線程不安全,可以使用strtok_r替代。
strtok內部記錄上次調用字符串的位置,所以不支持多線程,可重入版本為strtok_r,有興趣的可以研究一下。它適用於分割關鍵字在字符串之間是“單獨”或是 “連續“在一起的情況。
注意:因為函數內部會修改原字符串變量,所以傳入的參數不能是不可變字符串(即不能是字符串常量區)。
如 char *tokenremain ="abcdefghij"//編譯時為文字常量,不可修改。
strtok(tokenremain,"cde");
strsep(&tokenremain,"cde");
編譯通過,運行時會報段錯誤。
這種情況必須先把字符串賦值為可修改的變量。
//借助strtok實現split #include <string.h> #include <stdio.h> int main() { char s[] = "Golden Global View,disk * desk"; const char *d = " ,*"; char *p; p = strtok(s,d); while(p) { printf("%s\n",p); p=strtok(NULL,d); //注意這里,strtok內部記錄了上次的位置 } return 0; }
還有strsep函數,自己百度一下例子。[http://www.cnblogs.com/longzhao1234/archive/2012/05/31/2528317.html]
strsep返回值為分割后的開始字符串,並將函數的第一個參數指針指向分割后的剩余字符串。它適用於分割關鍵字在兩個字符串之間只嚴格出現一次的情況。
二、用STL進行字符串的分割
涉及到string類的兩個函數find和substr:
1、find函數
原型:size_t find ( const string& str, size_t pos = 0 ) const;
功能:查找子字符串第一次出現的位置。
參數說明:str為子字符串,pos為初始查找位置。
返回值:找到的話返回第一次出現的位置,否則返回string::npos
2、substr函數
原型:string substr ( size_t pos = 0, size_t n = npos ) const;
功能:獲得子字符串。
參數說明:pos為起始位置(默認為0),n為結束位置(默認為npos)
返回值:子字符串
#include <iostream> #include <string> #include <vector> //字符串分割函數 std::vector<std::string> split(std::string str,std::string pattern) { std::string::size_type pos; std::vector<std::string> result; str+=pattern;//擴展字符串以方便操作 int size=str.size(); for(int i=0; i<size; i++) { pos=str.find(pattern,i); if(pos<size) { std::string s=str.substr(i,pos-i); result.push_back(s); i=pos+pattern.size()-1; } } return result; } int main() { std::string str; std::cout<<"Please input str:"<<std::endl; //std::cin>>str; getline(std::cin,str); std::string pattern; std::cout<<"Please input pattern:"<<std::endl; //std::cin>>pattern; getline(std::cin,pattern);//用於獲取含空格的字符串 std::vector<std::string> result=split(str,pattern); std::cout<<"The result:"<<std::endl; for(int i=0; i<result.size(); i++) { std::cout<<result[i]<<std::endl; } std::cin.get(); std::cin.get(); return 0; }
三、用Boost進行字符串的分割
用boost庫的正則表達式實現字符串分割
#include <iostream> #include <cassert> #include <vector> #include <string> #include "boost/regex.hpp" std::vector<std::string> split(std::string str,std::string s) { boost::regex reg(s.c_str()); std::vector<std::string> vec; boost::sregex_token_iterator it(str.begin(),str.end(),reg,-1); boost::sregex_token_iterator end; while(it!=end) { vec.push_back(*it++); } return vec; } int main() { std::string str,s; str="sss/ddd/ggg/hh"; s="/"; std::vector<std::string> vec=split(str,s); for(int i=0,size=vec.size();i<size;i++) { std::cout<<vec[i]<<std::endl; } std::cin.get(); std::cin.get(); return 0; }
boost里面有自帶的split的函數,如果用boost的話,還是直接用split的好
#include <iostream> #include <string> #include <vector> #include <boost/algorithm/string/classification.hpp> #include <boost/algorithm/string/split.hpp> using namespace std; int main() { string s = "sss/ddd,ggg"; vector<string> vStr; boost::split( vStr, s, boost::is_any_of( ",/" ), boost::token_compress_on ); for( vector<string>::iterator it = vStr.begin(); it != vStr.end(); ++ it ) cout << *it << endl; return 0; }
使用Boost庫
1)使用boost::split。根據字符來split,注意is_any_of的意思是集合中的任何一個,而不是equals的意思,那如何根據字符串split原字符串?請看2和3。
#include <iostream> #include <vector> #include <string> #include <boost/algorithm/string.hpp> using namespace std; int main() { string str( "dfa&fda|dfdf"); vector<string> tokens; boost::split(tokens, str, boost::is_any_of("&|")); for (size_t i = 0; i < tokens.size(); ++ i) { cout << tokens[i] << endl; } return 0; }
2) 使用boost::tokenize,注意 boost::char_separator<char>分隔符一樣是集合的概念!但划分方法和boost::split不大一樣,詳看boost文檔。
#include <iostream> #include <vector> #include <string> #include <boost/tokenizer.hpp> using namespace std; int main() { string str("dfa||fda||dfdf"); vector<string> tokens; boost::char_separator<char> sep("|"); boost::tokenizer<boost::char_separator<char> > tok(str, sep); tokens.clear(); std::copy(tok.begin(), tok.end(), std::back_inserter(tokens)); for (size_t i = 0; i < tokens.size(); ++ i) { cout << tokens[i] << endl; } return 0; }
3)使用boost::regex
#include <iostream> #include <vector> #include <string> #include <boost/regex.hpp> using namespace std; int main() { string str("dfa||fda||dfdf"); vector<string> tokens; boost::regex reg("\\|\\|"); boost::sregex_token_iterator it(str.begin(), str.end(), reg, -1); boost::sregex_token_iterator end; while (it!=end) { tokens.push_back(*it++); } for (size_t i = 0; i < tokens.size(); ++ i) { cout << tokens[i] << endl; } return 0; }