我个人的理解,正则表达式应该建立在与概念中的字符一一对应的code point上的,但是c++对于字符串的支持string本质上只是个char array,那么该如何理解建立在string和wstring等字符串类型上的regex呢?即regex中是如何处理正则表达式和编码的关系的?
相似的问题见:
https://www.zhihu.com/questio...
已注销用户的回答。
我个人的理解,正则表达式应该建立在与概念中的字符一一对应的code point上的,但是c++对于字符串的支持string本质上只是个char array,那么该如何理解建立在string和wstring等字符串类型上的regex呢?即regex中是如何处理正则表达式和编码的关系的?
相似的问题见:
https://www.zhihu.com/questio...
已注销用户的回答。
3 回答2k 阅读✓ 已解决
2 回答3.9k 阅读✓ 已解决
2 回答3.2k 阅读✓ 已解决
1 回答3.2k 阅读✓ 已解决
1 回答2.7k 阅读✓ 已解决
3 回答3.4k 阅读
1 回答1.6k 阅读✓ 已解决
一个是基于
char
,一个是wchar_t
。至于他是 code point 还是 code unit (你的 code unit 指啥?),那要看在
char
或者wchar_t
里放了啥了。