安装tesseract
brew uninstall tesseract
brew install --with-training-tools tesseract
构建字符集
合并为tif
tools-Merge Tiff
保存为num.myfont.exp0.tif
生成box
tesseract num.myfont.exp0.tif num.myfont.exp0 -l eng -psm 7 batch.nochop makebox
使用jTessBoxEditor修改box文件
生产font_properties
echo myfont 0 0 0 0 0 >font_properties
生成训练文件
tesseract num.myfont.exp0.tif num.myfont.exp0 -l eng -psm 7 nobatch box.train
生成字符集文件
unicharset_extractor num.myfont.exp0.box
生成shape
shapeclustering -F font_properties -U unicharset -O myfont.unicharset num.myfont.exp0.tr
聚合字符特征文件
mftraining -F font_properties -U unicharset -O myfont.unicharset num.myfont.exp0.tr
正常化
cntraining num.myfont.exp0.tr
合并训练文件
cp normproto myfont.normproto
cp inttemp myfont.inttemp
cp pffmtable myfont.pffmtable
cp unicharset myfont.unicharset
cp shapetable myfont.shapetable
combine_tessdata myfont.
新增语言
brew list tesseract
查看tessdata位置
cp myfont.traineddata /usr/local/Cellar/tesseract/3.04.01_2/share/tessdata/
tesseract --list-langs
测试
tesseract 9606.tif output -l myfont -psm 7
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。