0

画像スキャン用のアプリケーションでtesseractライブラリを使用しています。私はどこかでそのライブラリが100DPIを超える画像に対して優れたパフォーマンスを提供することを読みました.iPhone4とiPadで写真をキャプチャし、それをtesseractライブラリの入力として提供していますが、それでもライブラリは読み取り不能な出力を提供します.iPhoneまたはiPadカメラ?tesseractライブラリのパフォーマンスを向上させるにはどうすればよいですか?

4

2 に答える 2

4

12 インチの定規とメジャーを用意します。定規をテーブルの上に置きます。電話を定規の上に置き、カメラを定規に向けます。巻尺を使用して、定規からカメラまでの距離を測定します。定規の写真を撮ります。

画像ビューアーまたはエディターで写真を開きます。(たとえば、Mac ではプレビューを使用できます。) イメージ ビューアー/エディターを使用して、定規のサイズをピクセル単位で測定します。

定規のサイズ (ピクセル単位) を 12 で割ります。これは、巻尺で測定した距離から撮影した定規の画像の 1 インチあたりのピクセル数 (別名、1 インチあたりのドット数または DPI) です。

100 DPIが必要な点は、OCR ライブラリが文字を認識するのに十分な解像度を必要とすることです。おそらく、文字の高さを 15 ~ 20 ピクセルにする必要があります (推測しています)。文字が小さすぎると、OCR ライブラリが機能するのに十分な情報が画像に含まれていない可能性があります。また、文字が大きすぎる可能性もあります。ライブラリは、高さ 100 ピクセルの文字を探すようにプログラムされていない可能性があります。また、文字が適切なサイズでもぼやけている場合、OCR ライブラリは文字を認識できない可能性があります。

小さすぎるテキストの写真を撮ろうとしているだけかもしれません。そのため、文字が適切なサイズになるようにカメラを近づけると、カメラの焦点が合わず、写真がぼやけてしまいます。その場合、おそらくそれを修正するためにできることは何もありません (より良いカメラを備えた電話を入手することを除いて)。

于 2012-08-08T08:23:18.747 に答える
0

それは72 dpiを持っています、少なくともこれはEXIFに保存するものです ここに画像の説明を入力

于 2012-08-08T07:24:43.197 に答える