有没有库可以判断字符的相似度?

例如: ["马", "吗", "树"],从字形来看马和吗是比马和树更加相似,有没有库可以比较这种字形上的相似度?

阅读 1.2k
1 个回答

目前应该没有,需要的话,可能需要基于某些模型去训练。
例如以下开源项目:
deep-text-recognition-benchmark
这是一个开源的项目,提供了文本识别的基准模型,其中可以用于训练和比较汉字的字形。虽然它主要用于文本识别,但可以调整为针对字形相似度的任务。

tesserocr:
这是一个基于 Tesseract OCR 的 Python 包,虽然 Tesseract 是 OCR 引擎,但你可以训练一个专门的模型用于汉字字形的识别和相似度比较。

推荐问题