Windows安装Tesseract-OCR 4.00并配置环境变量

阅读 2 分钟

3

一、前言

Tesseract-OCR 是一款由HP实验室开发由Google维护的开源OCR（Optical Character Recognition , 光学字符识别）引擎。与Microsoft Office Document Imaging（MODI）相比，我们可以不断的训练的库，使图像转换文本的能力不断增强；如果团队深度需要，还可以以它为模板，开发出符合自身需求的OCR引擎。
GitHub 地址：https://github.com/tesseract-...
安装包官方下载地址：https://digi.bib.uni-mannheim...
安装包百度云盘下载地址：https://pan.baidu.com/s/1AOsJ...

二、安装 Tesseract-OCR

直接执行下载好的 exe 文件，下一步、下一步默认安装即可。

三、配置环境变量

3.1 进入环境变量配置界面

右键点击此电脑--属性--高级系统设置--环境变量--系统变量--Path

3.2 添加系统变量

找到系统变量的 Path ，将 Tesseract-OCR 的安装目录添加进去：

3.3 添加 tessdata 系统变量

如下图新建系统变量： TESSDATA_PREFIX
变量值为 tessdata 文件夹的路径（在Tesseract-OCR的安装目录下）：

四、使用 Tesseract-OCR

4.1 进入cmd 输入下面的命令查看版本，正常运行则安装成功：

tesseract --version

4.2 使用下面命令识别图片

tesseract 图片路径 输出文件

查看输出的 result.txt文件：

结果正确！

windows10 tesseract ocr

阅读 30.3k发布于 2018-03-30

Developer

1.4k 声望123 粉丝

只要还在学习，人生就有无限的希望...

« 上一篇

Ubuntu16.04安装Docker

下一篇 »

Python3使用 pytesseract 进行图片识别

引用和评论

被 1 篇内容引用

Python3使用 pytesseract 进行图片识别
2

推荐阅读

Executors线程池工具类

Developer阅读 4k

Windows 10 version 22H2 中文版、英文版下载 (2025 年 3 月更新)

sysin阅读 612

智能扫描助力节碳超13万吨，合合信息旗下扫描全能王“指尖减碳”写就绿色诗篇

合合技术团队阅读 530

【大模型加速器2.0】合合信息文档图表解析全方位深度测评

一键难忘阅读 521

理解文字识别：一文读懂OCR商业化产品的算法逻辑

合合技术团队阅读 481

实测对比｜法国AI独角兽公司发布的“最强OCR”，实测效果如何？

合合技术团队阅读 476

合合信息IntFinQ知识库体验：大模型加速器2.0，助力企业走向文档智能化

GuangZhi_Liu阅读 474

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。