Python:为 Windows 7 安装 Tesseract

新手上路,请多包涵

我的目标是在 Windows 7 机器上使用 Tesseract 在 Python 2.7 中使用 OCR,但我遇到了安装过程的问题。我尝试按照 此处 的说明进行操作,但指向“tesseract-core-yyyymmdd.exe”和“tesseract-langs-yyyymmdd.exe”的链接不再存在,我无法在其他地方在线找到这些 .exe。这是我到目前为止所做的:

  1. 从官方 tesseract-ocr 页面的可执行文件安装 tesseract。
  2. 通过 pip 包“wand”、“PIL”、“pyocr”安装。

现在,如果我在 Python 中执行以下操作:

from wand.image import Image from PIL import Image as PI import pyocr import pyocr.builders import io

加载这些包没有问题,但是 pyocr.get_available_tools() 给了我一个空列表。我确信这与上面缺少的安装 .exe 文件有关。我在哪里可以找到它们?我还缺少其他东西吗?

原文由 Plug4 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 830
2 个回答

我刚刚尝试设置 pytesseract 并且它有效!我安装了 windows 10 和 python 2.7。

所有你需要做的:

  1. http://aka.ms/vcpython27 下载Visual basic C++并安装(常见安装步骤)

  2. 通过此链接从 python 下载 tesseract https://pypi.python.org/pypi/pytesseract

  3. 解压缩文件。

  4. 转到包含 unizip 文件的目录

  5. 运行此命令“python setup.py install”

  6. (附加)要测试它是否已安装,请转到您的 python shell 并运行此命令“ import pytesseract ”

我希望它有效!注意 pytesseract 是基于 google 的 OCR,它的工作原理与 tesseract 类似。

原文由 Asha Magenta 发布,翻译遵循 CC BY-SA 3.0 许可协议

步骤 [1] 安装 tesseract 请访问

https://github.com/UB-Mannheim/tesseract/wiki

可以从这里下载最新的安装程序: _例如_,tesseract-ocr-setup-3.05.02-20180621.exe、tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe、tesseract-ocr-w64-setup -v4.0.0-beta.1.20180608.exe(64 位)

步骤 [2] 从下面给出的链接下载适用于 Python 2.7 的 Microsoft Visual C++ 编译器 https://download.microsoft.com/download/7/9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi

步骤[3] 安装 pytesseract 用于使用pip 绑定 tesseract

 pip install pytesseract

步骤 [4] 此外,您可以在 python 中安装图像处理库,例如 pillow

 pip install pillow

你好!!你完成了! :)

原文由 Shashank Singh 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题