私は Java で OCR プログラムを作成しています (Tesseract を使用してラベルからテキストを生成します)。データベースに格納されている W の代わりに VV や MR の代わりに NIR など、出力の一般的なエラーを認識したいと考えています。たとえば、"VVEIN, MIR Adam" のような文字列を取得した場合、"WEIN, MR Adam" に変更する必要があります。
文字列が一般的なエラー テキストのいずれかと一致するかどうかを確認する最も効率的な方法は何でしょうか? 現時点で考えられる唯一の方法は、既知のエラーごとに一連の正規表現を介して文字列を渡すことですが、もっと効率的な方法があることを願っています。ありがとう :)