Tesseract或任何其他OCR库
我正在寻找一个解释/ API文档/关于如何在C ++中使用(和培训?)Tesseract的示例,在谷歌Tesseract页面上没有任何用处,但还没有找到网络上的东西。
任何有用的资源,经验都会受到欢迎,因为我不知道如何开始。
PS:
我有一些Tesseract的经验...一个简单的谷歌'培训tesseract'揭示了这个网页:http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract你必须选择你想要哪个版本的tesseract培训..虽然3是最新版本,它是全新的,因此人们仍然在解决任何问题 - 即时通讯仍然使用2.4版本。 无论如何,你会发现为特定的“语言”(或者应该被称为'字体'或'字符集')训练tesseract大约有9个步骤。 您也可以使用现有的'eng'语言 - 但这取决于您的应用程序。 例如,在我的应用程序中,我将不得不进行文档分析并采取特定区域,并希望OCR输入一串13个字符的数字 - 我需要很高的准确性 - 而且我不希望它将'5'读作' S'和'0'为'O'等,所以根据我的特定字体创建一个特定的“语言”是唯一的,它只包含字符0..9,而你可能并不在乎是否有额外的噪音
Tesseract Ocr是一个用于检测光学字符的开源库。 如果您使用的是Visual Studio,则只需包含库文件即可。 如果您正在使用qt创建器,那么您必须构建库以在QT上工作。 您需要使用CMakelist或Cmake Gui构建库。 您可以访问Qt 5.4 mingw的Opencv Ocr build链接
链接地址: http://www.djcxy.com/p/49089.html