如何按空格拆分字符串

新手上路,请多包涵

我需要用空格分割我的字符串。为此,我尝试了:

 str = "Hello I'm your String";
String[] splited = str.split(" ");

但这似乎不起作用。

原文由 safari 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 640
2 个回答

你有什么应该工作。但是,如果提供的空间默认为……其他东西?您可以使用空格正则表达式:

 str = "Hello I'm your String";
String[] splited = str.split("\\s+");

这将导致任意数量的连续空格将您的字符串拆分为标记。

原文由 corsiKa 发布,翻译遵循 CC BY-SA 4.0 许可协议

虽然接受的答案很好,但请注意,如果您的输入字符串以空格开头,您最终会得到一个前导空字符串。例如,与:

 String str = " Hello I'm your String";
String[] splitStr = str.split("\\s+");

结果将是:

 splitStr[0] == "";
splitStr[1] == "Hello";
splitStr[2] == "I'm";
splitStr[3] == "Your";
splitStr[4] == "String";

所以你可能想在拆分之前修剪你的字符串:

 String str = " Hello I'm your String";
String[] splitStr = str.trim().split("\\s+");

[编辑]

除了 trim 警告之外,您可能还需要考虑 unicode 不间断空格字符 ( U+00A0 )。这个字符就像字符串中的常规空格一样打印出来,并且经常潜伏在从富文本编辑器或网页复制粘贴的文本中。它们不由 .trim() 处理,它使用 c <= ' ' 测试要删除的字符; \s 也不会抓住他们。

相反,您可以使用 \p{Blank} 但您还需要启用 unicode 字符支持,而常规的 split 不会这样做。例如,这将起作用: Pattern.compile("\\p{Blank}", UNICODE_CHARACTER_CLASS).split(words) 但它不会执行 trim 部分。

下面演示问题并提供解决方案。为此依赖正则表达式 远非 最佳,但现在 Java 具有 8 位/16 位字节表示,对此的有效解决方案变得相当长。

 public class SplitStringTest
{
    static final Pattern TRIM_UNICODE_PATTERN = Pattern.compile("^\\p{Blank}*(.*)\\p{Blank}$", UNICODE_CHARACTER_CLASS);
    static final Pattern SPLIT_SPACE_UNICODE_PATTERN = Pattern.compile("\\p{Blank}", UNICODE_CHARACTER_CLASS);

    public static String[] trimSplitUnicodeBySpace(String str)
    {
        Matcher trimMatcher = TRIM_UNICODE_PATTERN.matcher(str);
        boolean ignore = trimMatcher.matches(); // always true but must be called since it does the actual matching/grouping
        return SPLIT_SPACE_UNICODE_PATTERN.split(trimMatcher.group(1));
    }

    @Test
    void test()
    {
        String words = " Hello I'm\u00A0your String\u00A0";
        // non-breaking space here --^ and there -----^

        String[] split = words.split(" ");
        String[] trimAndSplit = words.trim().split(" ");
        String[] splitUnicode = SPLIT_SPACE_UNICODE_PATTERN.split(words);
        String[] trimAndSplitUnicode = trimSplitUnicodeBySpace(words);

        System.out.println("words: [" + words + "]");
        System.out.println("split: [" + Arrays.stream(split).collect(Collectors.joining("][")) + "]");
        System.out.println("trimAndSplit: [" + Arrays.stream(trimAndSplit).collect(Collectors.joining("][")) + "]");
        System.out.println("splitUnicode: [" + Arrays.stream(splitUnicode).collect(Collectors.joining("][")) + "]");
        System.out.println("trimAndSplitUnicode: [" + Arrays.stream(trimAndSplitUnicode).collect(Collectors.joining("][")) + "]");
    }
}

结果是:

 words: [ Hello I'm your String ]
split: [][Hello][I'm your][String ]
trimAndSplit: [Hello][I'm your][String ]
splitUnicode: [][Hello][I'm][your][String]
trimAndSplitUnicode: [Hello][I'm][your][String]

原文由 GaspardP 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题