Tesseract setVariable ホワイトリストは英語で正常に機能します。たとえば、これを使用して画像から数字と文字のみを認識します (特殊文字 &*^%! などを除く)
_ocr.SetVariable("tessedit_char_whitelist",
"0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ");
しかし、私はタイ語で同じことをすることはできません
_ocr.SetVariable("tessedit_char_whitelist","0123456789กขคงจฉ");
別の原則はありますか?これは機能しないためです。すべての決定された文字の代わりに、出力で数字のみを受け取ります。tesseract は、ホワイトリストに入れたすべてのタイ文字を無視します。
この変数を正しく渡すにはどうすればよいですか?