在用tesseract文字识别时发现:如果用放大后的图片识别,本来识别错误的文字会得到正确的结果,WIN10自带照片查看器或光影看图或Mac自带的预览工具的图片放大算法不是简单的缩放图片,是带有图像质量提高的优化的,如果能知道这个算法就能提高文字识别正确率实现单机识别文字,有人知道用的是什么算法吗
from PIL import Image
import pytesseract
path = r"D:\ocr.bmp"
for p in range(4,14):
text = pytesseract.image_to_string(Image.open(path), config="--psm {}".format(p),lang='chi_sim')
print(str(p)+" : "+text)