字符串分割技术

pezy

"This is a statement"

使用 C++ 将这个字符串分割成四个子字符串: "This", "is", "a", "statement"?

超级简略版

cpp#include <iostream>
using std::cout;
#include <iterator>
using std::istream_iterator; using std::ostream_iterator;
#include <string>
using std::string;
#include <sstream>
using std::istringstream;
#include <algorithm>
using std::copy;

int main()
{
    string str("This is a statement");
    istringstream iss(str), end;
    copy(istream_iterator<string>(iss), istream_iterator<string>(end), ostream_iterator<string>(cout, "\n"));
    return 0;
}

这个技巧不足为道,C++ Primer 5th10.4.2. iostream Iterators 里有介绍。

工程实用版

上面的方法虽然简洁,但是仅能够按空格分隔,在实际工程中,显然是没太大用处的,抽出一个 split 函数还是很有必要的。

cpp#include <iostream>
using std::cout; using std::getline;
#include <iterator>
using std::ostream_iterator;
#include <string>
using std::string;
#include <sstream>
using std::istringstream;
#include <vector>
using std::vector;
#include <algorithm>
using std::copy;

vector<string> &split(const string &str, char delim, vector<string> &elems, bool skip_empty = true) {
    istringstream iss(str);
    for (string item; getline(iss, item, delim); )
        if (skip_empty && item.empty()) continue;
        else elems.push_back(item);
    return elems;
}

int main()
{
    string str("Windows,Linux,,MacOS,");
    vector<string> result;
    split(str, ',', result);
    copy(result.begin(), result.end(), ostream_iterator<string>(cout, "\n"));
    return 0;
}

这样我们不仅可以用别的字符来做分隔,还可以选择跳过空白字符串,如我故意在 Linux 和 MacOS 之间放了两个相邻的 ,,,若不做处理和判断的话,就会多分割出一个空白字符来。


继续改进版

上面这样,还有一个限制未解决,即如果我想按多种字符来分隔呢?如按照 ,,|以及空格,来分割字符串。

可以利用 find_first_of 来实现。

cpp#include <string>
using std::string;
#include <vector>
using std::vector;
#include <iostream>

vector<string> &split( const string &str, const string &delimiters, vector<string> &elems, bool skip_empty = true ) {
    string::size_type pos, prev = 0;
    while ( ( pos = str.find_first_of(delimiters, prev) ) != string::npos ) {
        if ( pos > prev ) {
            if ( skip_empty && 1 == pos - prev ) break;
            elems.emplace_back( str, prev, pos - prev );
        }
        prev = pos + 1;
    }
    if ( prev < str.size() ) elems.emplace_back( str, prev, str.size() - prev );
    return elems;
}

int main()
{
    string str( "Windows,Linux||MacOS All" );
    vector<string> result;
    for ( const auto &s : split( str, ",| ", result ) )
        std::cout << s << " ";
    std::cout << std::endl;
}

这个版本基本满足大部分工程上的需要了。

阅读 22.4k

一个 C++ 程序员

3.1k 声望
330 粉丝
0 条评论

一个 C++ 程序员

3.1k 声望
330 粉丝
文章目录
宣传栏