头图

优点

✅ 识别率高,支持繁简中文和手写识别
✅ 支持角度检测,避免文字方向影响识别效果
✅ 还能识别表格、票据等复杂场景

方法

pip install paddleocr
pip install paddlepaddle

(如果你有 GPU,可以安装 paddlepaddle-gpu 以加速识别)

使用示例

from paddleocr import PaddleOCR

ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # 使用中文模型,支持角度校正
result = ocr.ocr("example.png", cls=True)  # 识别图像
for line in result:
    print(line)  # 输出识别结果

指定GPU加速

from paddleocr import PaddleOCR

# 初始化 OCR,强制使用 GPU(如果有多张 GPU,可以设置 use_gpu=0, 1, 2...)
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0) 

# 读取图片并识别
result = ocr.ocr("example.png", cls=True)

# 输出识别结果
for line in result:
    print(line)

返回JSON

import json
from paddleocr import PaddleOCR

# 初始化 OCR,使用 GPU
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0)

# 读取图片并识别
result = ocr.ocr("example.png", cls=True)

# 处理结果,提取文字信息
output_data = []
for line in result:
    for word_info in line:
        text = word_info[1][0]  # 获取识别的文本
        confidence = word_info[1][1]  # 获取置信度
        output_data.append({"text": text, "confidence": confidence})

# 转换为 JSON 格式
json_output = json.dumps(output_data, ensure_ascii=False, indent=4)

# 输出 JSON 结果
print(json_output)

识别效果
image.png


TANKING
4.8k 声望522 粉丝

热爱分享,热爱创作,热爱研究。