3

Tesseract setVariable ホワイトリストは英語で正常に機能します。たとえば、これを使用して画像から数字と文字のみを認識します (特殊文字 &*^%! などを除く)

_ocr.SetVariable("tessedit_char_whitelist",
"0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ");

しかし、私はタイ語で同じことをすることはできません

_ocr.SetVariable("tessedit_char_whitelist","0123456789กขคงจฉ");

別の原則はありますか?これは機能しないためです。すべての決定された文字の代わりに、出力で数字のみを受け取ります。tesseract は、ホワイトリストに入れたすべてのタイ文字を無視します。

この変数を正しく渡すにはどうすればよいですか?

4

1 に答える 1