所以我知道 String#codePointAt(int) ，但它是由 char 偏移量而不是代码点偏移量索引的。我正在考虑尝试类似的东西：使用 String#charAt(int) char 测试 char 是否在高代理范围内如果是这样，使用 String#codePointAt(int) 获取代码点，并将索引递增 2 如果不是，则使用给定的 char 值作为代码点，并将索引递增 1 但我担心的是我不确定自然在高代理范围内的代码点是否将存储为两个 char 值或一个这似乎是一种非常昂贵的遍历字符的方法一定有人想出了更好的办法。原文由 rampion 发布，翻译遵循 CC BY-SA 4.0 许可协议

新手上路，请多包涵

所以我知道 String#codePointAt(int) ，但它是由 char 偏移量而不是代码点偏移量索引的。

我正在考虑尝试类似的东西：

使用 String#charAt(int) char
测试 char 是否在高代理范围内
- 如果是这样，使用 String#codePointAt(int) 获取代码点，并将索引递增 2
- 如果不是，则使用给定的 char 值作为代码点，并将索引递增 1

但我担心的是

我不确定自然在高代理范围内的代码点是否将存储为两个 char 值或一个
这似乎是一种非常昂贵的遍历字符的方法
一定有人想出了更好的办法。

原文由 rampion 发布，翻译遵循 CC BY-SA 4.0 许可协议

java string unicode

阅读 592

2 个回答

得票最新

社区维基

发布于
2022-11-29

✓ 已被采纳

是的，Java 对字符串的内部表示使用 UTF-16 式编码，而且，是的，它使用代理方案对基本多语言平面 ( BMP ) 之外的字符进行编码。

如果您知道您将处理 BMP 之外的字符，那么这里是迭代 Java String 字符的规范方法：

 final int length = s.length();
for (int offset = 0; offset < length; ) {
   final int codepoint = s.codePointAt(offset);

   // do something with the codepoint

   offset += Character.charCount(codepoint);
}

原文由 Jonathan Feinberg 发布，翻译遵循 CC BY-SA 3.0 许可协议

社区维基

发布于
2022-11-29

Java 8 添加了 CharSequence#codePoints 返回一个 IntStream 包含代码点。您可以直接使用流来迭代它们：

 string.codePoints().forEach(c -> ...);

或者通过将流收集到数组中来使用 for 循环：

 for(int c : string.codePoints().toArray()){
    ...
}

这些方法可能比 Jonathan Feinbergs 的解决方案更昂贵，但它们的读/写速度更快，并且性能差异通常是微不足道的。

原文由 Alex - GlassEditor.com 发布，翻译遵循 CC BY-SA 3.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

如何遍历 Java String 的 unicode 代码点？

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

一个类实现接口并且继承父类使用Spring aop 失效?

idea 中有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性有什么好的办法吗?

Stack Overflow 翻译

如何遍历 Java String 的 unicode 代码点？

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

一个类实现接口并且继承父类 使用Spring aop 失效?

idea 中 有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性 有什么好的办法吗?

Stack Overflow 翻译

一个类实现接口并且继承父类使用Spring aop 失效?

idea 中有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性有什么好的办法吗?