优点
✅ 识别率高,支持繁简中文和手写识别
✅ 支持角度检测,避免文字方向影响识别效果
✅ 还能识别表格、票据等复杂场景
方法
pip install paddleocr
pip install paddlepaddle
(如果你有 GPU,可以安装 paddlepaddle-gpu 以加速识别)
使用示例
from paddleocr import PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # 使用中文模型,支持角度校正
result = ocr.ocr("example.png", cls=True) # 识别图像
for line in result:
print(line) # 输出识别结果
指定GPU加速
from paddleocr import PaddleOCR
# 初始化 OCR,强制使用 GPU(如果有多张 GPU,可以设置 use_gpu=0, 1, 2...)
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0)
# 读取图片并识别
result = ocr.ocr("example.png", cls=True)
# 输出识别结果
for line in result:
print(line)
返回JSON
import json
from paddleocr import PaddleOCR
# 初始化 OCR,使用 GPU
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0)
# 读取图片并识别
result = ocr.ocr("example.png", cls=True)
# 处理结果,提取文字信息
output_data = []
for line in result:
for word_info in line:
text = word_info[1][0] # 获取识别的文本
confidence = word_info[1][1] # 获取置信度
output_data.append({"text": text, "confidence": confidence})
# 转换为 JSON 格式
json_output = json.dumps(output_data, ensure_ascii=False, indent=4)
# 输出 JSON 结果
print(json_output)
识别效果
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。