辞書を使用して単語を照合するオープンソースのocr(おそらくtesseract)を探しています。たとえば、このocrは特定の名前の検索にのみ使用されることを私は知っています。マスターゲストリスト(作成済み)があり、このリストをocrで1秒以内にスキャンし、名前のデータベースと照合したいとします。
従来のocrはすべての文字を読み取ろうとし、結果を100個の名前と相互参照できることを理解していますが、これには時間がかかりすぎます。OCRがそれらの100語だけに焦点を合わせていて、他には何もなかった場合、これはすべて一瞬で実行できるはずです。つまり、「Jach」は私のデータベースの名前ではないので、単語が「Jach」である可能性があると推測しても意味がありません。これはデータベース内の実際の名前であるため、ocrはそれが「ジャック」であると推測できるはずです。
これは可能ですか?