我的目标是在 Windows 7 机器上使用 Tesseract 在 Python 2.7 中使用 OCR,但我遇到了安装过程的问题。我尝试按照 此处 的说明进行操作,但指向“tesseract-core-yyyymmdd.exe”和“tesseract-langs-yyyymmdd.exe”的链接不再存在,我无法在其他地方在线找到这些 .exe。这是我到目前为止所做的:
- 从官方 tesseract-ocr 页面的可执行文件安装 tesseract。
- 通过 pip 包“wand”、“PIL”、“pyocr”安装。
现在,如果我在 Python 中执行以下操作:
from wand.image import Image
from PIL import Image as PI
import pyocr
import pyocr.builders
import io
加载这些包没有问题,但是 pyocr.get_available_tools()
给了我一个空列表。我确信这与上面缺少的安装 .exe 文件有关。我在哪里可以找到它们?我还缺少其他东西吗?
原文由 Plug4 发布,翻译遵循 CC BY-SA 4.0 许可协议
我刚刚尝试设置 pytesseract 并且它有效!我安装了 windows 10 和 python 2.7。
所有你需要做的:
从 http://aka.ms/vcpython27 下载Visual basic C++并安装(常见安装步骤)
通过此链接从 python 下载 tesseract https://pypi.python.org/pypi/pytesseract
解压缩文件。
转到包含 unizip 文件的目录
运行此命令“python setup.py install”
(附加)要测试它是否已安装,请转到您的 python shell 并运行此命令“ import pytesseract ”
我希望它有效!注意 pytesseract 是基于 google 的 OCR,它的工作原理与 tesseract 类似。