别惊讶,在 C# (默认 Unicode)中,它还可以匹配中文。
\w
,匹配包括下划线的任何单词字符
。等价于“[A-Za-z0-9_]
”。注意Unicode正则表达式会匹配中文字符。
不同正则引擎对转义的定义可以很不相同。
在 java.util.regex.Pattern, \w
包括:
A word character: [\p{Alpha}\p{gc=Mn}\p{gc=Me}\p{gc=Mc}\p{Digit}\p{gc=Pc}]
其中包括字母和数字
4 回答1.6k 阅读✓ 已解决
4 回答1.3k 阅读✓ 已解决
1 回答2.6k 阅读✓ 已解决
3 回答2k 阅读
2 回答786 阅读✓ 已解决
2 回答1.7k 阅读
2 回答1.3k 阅读
\w
匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”
,这里的"单词"字符使用Unicode字符集。\W
匹配任何非单词字符。等价于“[^A-Za-z0-9_]”
。https://baike.baidu.com/item/...