tesseract使用过程一些技巧--开发技术学习--JAVA、PHP、前端、APP、网站开发

开发技术学习 » 服务器 » tesseract使用过程一些技巧

tesseract使用过程一些技巧

此文被围观2170次日期: 2017-05-13 分类 : 服务器标签: ·tesseract·tesseract训练

使用： tesseract test.jpg -l eng
Tesseract是图盲，默认情况下只能看得懂未压缩的TIFF图像，如果直接用tesseract处理其它格式的图片，会报错如下：
name_to_image_type:Error:Unrecognized image type:test.jpg
IMAGE::read_header:Error:Can't read this image type:test.jpg
tesseract:Error:Read of file failed:test.jpg

所以我们需要用ImageMagick来转换图片格式。
安装ImageMagick:
sudo apt-get install imagemagick

使用imagemagick转换图片格式：
convert -compress none -depth 8 -alpha off test.jpg test.tif

使用tesseract,结果保存在out.txt中
tesseract test.tif out

问题：如何让tesseract只识别字母或者数字？
编辑：sudo vi /usr/share/tesseract-ocr/tessdata/configs/digits
tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz0123456789
执行：
tesseract 1.tif out nobatch digits

该日志由开发技术学习于2017年05月13日发表在服务器分类下，你可以发表评论，并在保留原文地址（https://www.kfju.com/article-id-1020.html）及作者的情况下引用到你的网站或博客。
原创文章转载请注明: tesseract使用过程一些技巧 | 开发技术学习

上一页：tesseract运行报错：tesseract: error while loading shared libraries: libtesseract.so.4

下一页：vue引入tailwindcss,vue2 tailwindcss不生效解决方法

用发现美的眼睛去感受当下的幸福，发现生活的美感悟生活中的美

开发技术学习

tesseract使用过程一些技巧

您可能还会对这些文章感兴趣！

最新专题

随机文章

本月排行

Tags 标签云

Links 友情链接