Tesseract或任何其他OCR库

2018-06-17 08:48:19

我正在寻找一个解释/ API文档/关于如何在C ++中使用（和培训？）Tesseract的示例，在谷歌Tesseract页面上没有任何用处，但还没有找到网络上的东西。

任何有用的资源，经验都会受到欢迎，因为我不知道如何开始。

PS：

我对其他图书馆的建议持开放态度。

只有免费的库

我有一些Tesseract的经验...一个简单的谷歌'培训tesseract'揭示了这个网页：http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract你必须选择你想要哪个版本的tesseract培训..虽然3是最新版本，它是全新的，因此人们仍然在解决任何问题 - 即时通讯仍然使用2.4版本。无论如何，你会发现为特定的“语言”（或者应该被称为'字体'或'字符集'）训练tesseract大约有9个步骤。您也可以使用现有的'eng'语言 - 但这取决于您的应用程序。例如，在我的应用程序中，我将不得不进行文档分析并采取特定区域，并希望OCR输入一串13个字符的数字 - 我需要很高的准确性 - 而且我不希望它将'5'读作' S'和'0'为'O'等，所以根据我的特定字体创建一个特定的“语言”是唯一的，它只包含字符0..9，而你可能并不在乎是否有额外的噪音

Tesseract Ocr是一个用于检测光学字符的开源库。如果您使用的是Visual Studio，则只需包含库文件即可。如果您正在使用qt创建器，那么您必须构建库以在QT上工作。您需要使用CMakelist或Cmake Gui构建库。您可以访问Qt 5.4 mingw的Opencv Ocr build链接

链接地址: http://www.djcxy.com/p/49089.html

上一篇: Tesseract or any other OCR lib

下一篇: Get groups from Active Directory using C#