有没有库可以判断字符的相似度?

例如: ["马", "吗", "树"],从字形来看马和吗是比马和树更加相似,有没有库可以比较这种字形上的相似度?

阅读 1k
1 个回答

目前应该没有,需要的话,可能需要基于某些模型去训练。
例如以下开源项目:
deep-text-recognition-benchmark
这是一个开源的项目,提供了文本识别的基准模型,其中可以用于训练和比较汉字的字形。虽然它主要用于文本识别,但可以调整为针对字形相似度的任务。

tesserocr:
这是一个基于 Tesseract OCR 的 Python 包,虽然 Tesseract 是 OCR 引擎,但你可以训练一个专门的模型用于汉字字形的识别和相似度比较。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题