本地使用PaddleOCR进行图片识别获得文字（返回JSON）

优点

✅ 识别率高，支持繁简中文和手写识别
✅ 支持角度检测，避免文字方向影响识别效果
✅ 还能识别表格、票据等复杂场景

方法

pip install paddleocr
pip install paddlepaddle

（如果你有 GPU，可以安装 paddlepaddle-gpu 以加速识别）

使用示例

from paddleocr import PaddleOCR

ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # 使用中文模型，支持角度校正
result = ocr.ocr("example.png", cls=True)  # 识别图像
for line in result:
    print(line)  # 输出识别结果

指定GPU加速

from paddleocr import PaddleOCR

# 初始化 OCR，强制使用 GPU（如果有多张 GPU，可以设置 use_gpu=0, 1, 2...）
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0) 

# 读取图片并识别
result = ocr.ocr("example.png", cls=True)

# 输出识别结果
for line in result:
    print(line)

返回JSON

import json
from paddleocr import PaddleOCR

# 初始化 OCR，使用 GPU
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0)

# 读取图片并识别
result = ocr.ocr("example.png", cls=True)

# 处理结果，提取文字信息
output_data = []
for line in result:
    for word_info in line:
        text = word_info[1][0]  # 获取识别的文本
        confidence = word_info[1][1]  # 获取置信度
        output_data.append({"text": text, "confidence": confidence})

# 转换为 JSON 格式
json_output = json.dumps(output_data, ensure_ascii=False, indent=4)

# 输出 JSON 结果
print(json_output)

识别效果

本地使用PaddleOCR进行图片识别获得文字（返回JSON）

优点

方法

使用示例

TANKING

引用和评论

2025年最新反编译微信小程序的教程及工具

python与nodejs哪个性能高

Anaconda安装教程以及Anaconda和pip配置国内镜像

如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践

Python 描述符

科学计算编程涉及到的技术栈简介

使用 chardet 判断文件编码需要注意的坑——过大的文件会导致高耗时