35

OCR 用にさまざまなフォントを使用した経験のある人はいますか? ID を生成してから、tesseract でスキャンしようとしています。現時点では、私はさまざまなフォントを T&E で使用していますが、これはかなり非効率的です。私は OCR* ファミリーのフォントと、Arial や Georgia などのさまざまなフォントを試しました。tesseract は、OCR* フォントと混同される傾向があります。

tesseract 用に特別に設計されたフォント、またはそれとうまく動作するシステム フォントはありますか?

4

8 に答える 8

19

さて、Google で検索すると、特定の OCR フォントである OCR Fontが表示されます。

1973年に採用された規格のようです。

于 2008-11-25T01:09:06.233 に答える
19

多くの異なるフォントとOCR エンジンを試した後、 Consolasを使用して最良の結果を得る傾向があります。OCR-A のような等幅の書体ですが、人間にとって読みやすいです。Consolas は、いくつかの Microsoft 製品に含まれています。

また、 Consolas の影響を受けたオープンソースのフォントInconsolataもあります。Inconsolata は、特にライセンスの詳細を考慮すると、Consolas の優れた代替品です。

私のテストでは、Calibriフォントの数字とスペースが常に正しく認識されるとは限りませんでした。OCR-A では、多くの読み取りエラーが発生しました。MIRC はほとんどの人間にとって読みにくいため、試してみませんでした。

: tesseract を信頼できるものにするためには、多くのテストと微調整が必​​要です。私たちの場合、特に信頼性が非常に重要であり、複数の (ヨーロッパの) 言語をサポートする必要があったため、商用ライセンスの OCR エンジン (ABBYY) に切り替えました。

更新: 2017 年 1 月 31 日 -著作権の問題が発生する可能性があるため、「 Consolas に基づく」を「Consolas の影響を受ける」に変更しました。

于 2011-01-02T13:12:29.590 に答える
5

Calibriが私に最適だと思います。自動システムで毎日OCRソフトウェアを使用し、数十のフォント(一部のOCR固有のフォントを含む)をテストした後、Calibriが一貫して最高であることがわかりました。

幸運を。

于 2010-02-02T21:42:44.267 に答える
4

銀行が小切手の下部にあるルーティング番号に使用するのと同じフォントをおそらく使用します。

http://morovia.com/font/micr.asp

明確に機械可読になるように特別に設計されています。

于 2008-11-25T01:08:17.047 に答える
2

私は常にタイムズニューローマンを使用するだけで成功していました..

于 2008-11-25T01:09:23.673 に答える
1

私は最近、Nuance OmniPage を使用する Laserfiche と呼ばれる ECM でこれを広範囲にテストしてきました。これらの古い OCR フォントは、より「通常の」見た目のフォントほどには機能しません。特に、ポイント 12 のような小さいフォント サイズの数字の文字列の場合。

他の誰かが Calibri で成功しているのは奇妙です。私のテストではパフォーマンスが非常に悪く、よく似た文字と数字が互いに混同されていました。(Office がインストールされた Windows コンピューターに付属するフォントの中で) 最適なフォントは、Consolas、Verdana、および Book Antiqua でした。文字と数字がはっきりと見えるすべての動的なセリフ フォント。コンソラスがチャンピオンでした。

于 2017-12-21T15:19:58.497 に答える