c++的regex正则表达式是建立在code point上还是code unit上呀?

我个人的理解,正则表达式应该建立在与概念中的字符一一对应的code point上的,但是c++对于字符串的支持string本质上只是个char array,那么该如何理解建立在string和wstring等字符串类型上的regex呢?即regex中是如何处理正则表达式和编码的关系的?

相似的问题见:
https://www.zhihu.com/questio...
已注销用户的回答。

阅读 2.3k
1 个回答
  using regex  = basic_regex<char>;
  using wregex = basic_regex<wchar_t>;

一个是基于 char ,一个是 wchar_t

至于他是 code point 还是 code unit (你的 code unit 指啥?),那要看在 char 或者 wchar_t 里放了啥了。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题