使用JavaScript检查字符串是否包含日文字符（包括汉字）

Question

新手上路，请多包涵

如何检查给定字符串是否包含一个或多个日语字符（由假名和/或汉字组成）？

我在这里看到一个类似的问题： How can I check if variable contains Chinese/Japanese characters? ，我用这个解决方案想出了这个：

 var containsJapanese = string.match(/[\u3400-\u9FBF]/);

然而，这会产生许多误报。

我通过让脚本遍历整个网页的内容（例如 Facebook、Stack Overflow 等）并标记应该包含日语文本的 div 来测试它。在这些情况下，大量的 div 最终会被错误标记。我还在包含日语文本的页面上对其进行了测试，那里的日语 div 最终与许多错误标记的 div 一起得到了正确标记。

原文由 Josh1billion 发布，翻译遵循 CC BY-SA 4.0 许可协议

javascript 正则表达式 string

阅读 1.6k

1 个回答

得票最新

社区维基

1

发布于
2022-12-09

✓ 已被采纳

检查这是否有效。我发现这个网站似乎列出了日文文本中可能使用的所有 Unicode 字符。

相应的正则表达式（对于单个字符）将是：

 /[\u3000-\u303f\u3040-\u309f\u30a0-\u30ff\uff00-\uff9f\u4e00-\u9faf\u3400-\u4dbf]/
  -------------_____________-------------_____________-------------_____________
   Punctuation   Hiragana     Katakana    Full-width       CJK      CJK Ext. A
                                            Roman/      (Common &      (Rare)
                                          Half-width    Uncommon)
                                           Katakana

范围是（从网站上引用）：

3000 - 303f ：日式标点符号
3040 - 309f : 平假名
30a0 - 30ff : 片假名
ff00 - ff9f : 全角罗马字符和半角片假名
4e00 - 9faf : CJK统一表意文字-普通和不常用汉字
3400 - 4dbf : CJK unified ideographs Extension A - Rare Kanji

我稍微改变了范围：

我已将 全角罗马字符和半角片假名 从 ff00 - ffef 更改为 ff00 - ff9f 。来自 ffa0 - ffdc 的代码点包含 Hangul 半角字符，这不是您想要的。您可能想重新添加 ffe0 - ffef 中的代码点，但它们大多是半角标点符号或全角货币符号。

您可以检查站点并删除任何您不想要的范围，或者确定它不会出现在您的输入中。

原文由 nhahtdh 发布，翻译遵循 CC BY-SA 3.0 许可协议

查看全部 1 个回答

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

使用JavaScript检查字符串是否包含日文字符（包括汉字）

js 如何将Key属性相同的放在同一个数组？

Next.js做纯前端是否可行？

如何实现一个深拷贝函数？

怎么获取动态弹出对话框的模拟单击？

git提交记录问题？

为什么在 JavaScript 中直接调用和用逻辑与调用方法结果不同？

Python字符串截取问题？

Stack Overflow 翻译