多くの異なるフォントとOCR エンジンを試した後、 Consolasを使用して最良の結果を得る傾向があります。OCR-A のような等幅の書体ですが、人間にとって読みやすいです。Consolas は、いくつかの Microsoft 製品に含まれています。
また、 Consolas の影響を受けたオープンソースのフォントInconsolataもあります。Inconsolata は、特にライセンスの詳細を考慮すると、Consolas の優れた代替品です。
私のテストでは、Calibriフォントの数字とスペースが常に正しく認識されるとは限りませんでした。OCR-A では、多くの読み取りエラーが発生しました。MIRC はほとんどの人間にとって読みにくいため、試してみませんでした。
注: tesseract を信頼できるものにするためには、多くのテストと微調整が必要です。私たちの場合、特に信頼性が非常に重要であり、複数の (ヨーロッパの) 言語をサポートする必要があったため、商用ライセンスの OCR エンジン (ABBYY) に切り替えました。
更新: 2017 年 1 月 31 日 -著作権の問題が発生する可能性があるため、「 Consolas に基づく」を「Consolas の影響を受ける」に変更しました。