C#で簡単なOCRを書いており、tesseract 2.0を使用しています
私のプログラムでは、大文字のみを認識します。
このため、次を使用しています:
Tesseract ocr = new Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZ");
したがって、この時点で、単一の大文字の画像を渡します。うまくいきますが、2文字の文字列が返されることがあります。
Input:
R
Output:
FE
ここで、ページ分割モードを「1 文字」に設定する方法を知る必要があります。結果を改善します。
誰でも tesseract 2 を使用して C# でこれを行う方法を知っていますか?
Tesseract ocr オブジェクトには、SetVariable メソッドしかありません。iOS API には、これを行う次のメソッドがあります。
setPageSegMode(TessBaseAPI.PSM_SINGLE_CHAR);
誰でも私を助けることができますか?