画像の文字を認識するためにTessearctOCRを使用しています。しかし、OCRを使用して数字を無視したい
_tesseract->SetVariable("tessedit_char_blacklist", "0123456789");
このように、OCRは数字文字を認識しませんが、不要な文字の代わりに他の文字を提供してくれます。
例:テキストがUSD 12の画像がありますが、その画像にOCRを適用すると、USDflが表示されます。
上で見ることができるように、OCRは12を私が望まないflに変換しました。12をOCRで無視したい。
USDflではなくUSDとして 結果を得る方法はありますか
そのための解決策を教えてください。どんな助けでもかなりあります。