3

C#で簡単なOCRを書いており、tesseract 2.0を使用しています

私のプログラムでは、大文字のみを認識します。

このため、次を使用しています:

Tesseract ocr = new Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZ");

したがって、この時点で、単一の大文字の画像を渡します。うまくいきますが、2文字の文字列が返されることがあります。

Input:
R
Output:
FE

ここで、ページ分割モードを「1 文字」に設定する方法を知る必要があります。結果を改善します。

誰でも tesseract 2 を使用して C# でこれを行う方法を知っていますか?

Tesseract ocr オブジェクトには、SetVariable メソッドしかありません。iOS API には、これを行う次のメソッドがあります。

setPageSegMode(TessBaseAPI.PSM_SINGLE_CHAR);

誰でも私を助けることができますか?

4

1 に答える 1

2

PSM は Tesseract 3.0x でのみ使用できます。したがって、互換性のある .NET ラッパーが必要になります。https://github.com/charlesw/tesseractにあります。

于 2013-04-09T23:16:01.177 に答える