有什么开源免费的 ocr 可以识别下面的图片中的文字:「禁闭岛」
测试了一下最热门的 pytesseract 发现根本无法识别图中的任何文字,报错英文和中文
from PIL import Image
import pytesseract
# 打开含有中文的图片
image = Image.open('xxx.jpg')
# 执行OCR,指定中文语言
text = pytesseract.image_to_string(image, lang='chi_sim') # 或者使用 'chi_tra' 对于繁体中文
print(text)
最好还能识别这种竖着的文字:
需要可以封装成 http api 服务,所以那种本地小工具不行
试了 Umi-OCR 这两张都可以识别
调用服务就行cli , http