Pytesseract:“TesseractNotFound 错误:tesseract 未安装或不在您的路径中”,我该如何解决?

新手上路,请多包涵

我正在尝试在 python 中运行一个基本且非常简单的代码。

 from PIL import Image
import pytesseract

im = Image.open("sample1.jpg")

text = pytesseract.image_to_string(im, lang = 'eng')

print(text)

这就是它的样子,我实际上已经通过安装程序安装了 tesseract for windows。我对 Python 很陌生,我不确定如何继续?

这里的任何指导都会非常有帮助。我尝试重新启动我的 Spyder 应用程序,但无济于事。

原文由 Jed Bartlet 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.8k
2 个回答

我看到步骤分散在不同的答案中。根据我最近在 Windows 上遇到此 pytesseract 错误的经验,依次编写不同的步骤以更轻松地解决错误:

1 .使用 Windows 安装程序安装 tesseract: https ://github.com/UB-Mannheim/tesseract/wiki

2 .请注意安装中的 tesseract 路径。此编辑时的默认安装路径是: C:\Users\USER\AppData\Local\Tesseract-OCR 。它可能会改变,所以请检查安装路径。

3 . pip install pytesseract

4 .在调用 image_to_string 之前在脚本中设置 tesseract 路径:

pytesseract.pytesseract.tesseract_cmd = r'C:\Users\USER\AppData\Local\Tesseract-OCR\tesseract.exe'

原文由 Nafeez Quraishi 发布,翻译遵循 CC BY-SA 4.0 许可协议

首先你应该安装二进制文件:

在 Linux 上

sudo apt-get update
sudo apt-get install libleptonica-dev tesseract-ocr tesseract-ocr-dev libtesseract-dev python3-pil tesseract-ocr-eng tesseract-ocr-script-latn

在 Mac 上

brew install tesseract

在 Windows 上

https://github.com/UB-Mannheim/tesseract/wiki 下载二进制文件。然后将 pytesseract.pytesseract.tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe' 添加到您的脚本中。

然后你应该使用 pip 安装 python 包:

 pip install tesseract
pip install tesseract-ocr

参考资料: https ://pypi.org/project/pytesseract/(安装部分)和 https://tesseract-ocr.github.io/tessdoc/Installation.html

原文由 Ali 发布,翻译遵循 CC BY-SA 4.0 许可协议

推荐问题