有没有库可以判断字符的相似度?

发布于
2024-08-13 广东

例如: ["马", "吗", "树"],从字形来看马和吗是比马和树更加相似,有没有库可以比较这种字形上的相似度?

阅读 1.1k

1 个回答

抓bug的猫

发布于
2024-08-15 陕西

目前应该没有，需要的话，可能需要基于某些模型去训练。
例如以下开源项目：
deep-text-recognition-benchmark：
这是一个开源的项目，提供了文本识别的基准模型，其中可以用于训练和比较汉字的字形。虽然它主要用于文本识别，但可以调整为针对字形相似度的任务。

tesserocr：
这是一个基于 Tesseract OCR 的 Python 包，虽然 Tesseract 是 OCR 引擎，但你可以训练一个专门的模型用于汉字字形的识别和相似度比较。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

极客观点

子站问答

相似问题

找不到问题？创建新问题