3

プロジェクトに TessBaseAPI を使用して、単純な OCR Android アプリを作成しています。二値化や画像の強化など、いくつかの画像前処理手順を実行しました。しかし、その結果は 50% から 60% です。どうすれば認識率を改善できますか?

2 つのサンプル画像を含めます。

http://imageshack.us/photo/my-images/94/1school.jpg/

http://imageshack.us/photo/my-images/43/15071917.jpg/

4

3 に答える 3

3

上記のコマンドへの次の追加は、2 番目のイメージに対して機能します。

-negate \
-deskew 40% \
+repage \
-crop 393x110+0+0 \

結果に適切なレベルのデスキューとトリミングを追加するため、Tesseract の作業が少し楽になります...

したがって、完全なコマンドは次のようになります。これにより、システムで正しい結果が得られます。

convert 15071917.jpg            \
   -type grayscale              \
   -negate                      \
   -gamma 1                     \
   -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  \
   -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize \
   -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle \
   -negate                      \
   -deskew 40%                  \
   +repage                      \
   -crop 393x110+0+0            \
    15071917.png                \
&&                              \
tesseract 15071917.png OUT && cat OUT.txt

  Tesseract Open Source OCR Engine v3.01 with Leptonica
    Page 0
    TESCO

これは元の画像 (左) と変更されたコマンドの結果の画像 (右) です。  

于 2012-08-18T22:22:54.630 に答える
1

今日は何か新しいことを学びました。Tesseract 3.01では、OCRを機能させる最も簡単な方法は、最初にテキストをデスキューすることだったようです。

これは非常に単純なコマンドです。このコマンドは、画像を切り取って少しトリミングしますが、元の画像とのコントラストや色の変更操作は行いません。

  convert 15071917.jpg  \
      -background pink  \
      -shear -0x6       \
      -crop 350x80+0+24 \
       tesco.jpg        \
  &&                    \
  tesseract tesco.jpg a  &&  cat a.txt

     Tesseract Open Source OCR Engine v3.01 with Leptonica
     TESCO

 

于 2012-08-18T23:33:56.940 に答える
1

このコマンドは、最初の画像ファイルに対して機能します。私はImageMagickバージョンを使用してい6.7.9-0 2012-08-17 Q16ます:

convert 1school.jpg                           \
    -scale 1000%                              \
    -blur 1x65535 -blur 1x65535 -blur 1x65535 \
    -contrast                                 \
    -normalize                                \
    -despeckle                                \
    -despeckle                                \
    -type grayscale                           \
    -sharpen 1                                \
    -posterize 3                              \
    -negate 1school.tif                       \
&&                                            \
tesseract 1school.tif OUT && cat OUT.txt

  Tesseract Open Source OCR Engine v3.01 with Leptonica
    Page 0
     '
    SCHOOL
    ZONE

2 番目のイメージには別のコマンドが必要です。

convert 15071917.jpg            \
   -type grayscale              \
   -negate                      \
   -gamma 1                     \
   -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  -contrast  \
   -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize \
   -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle \
    15071917.tif                \
&&                              \
tesseract 1school.tif OUT && cat OUT.txt

  Tesseract Open Source OCR Engine v3.01 with Leptonica
    Page 0
    TE§§IO

わかりました、2番目のものはそれほど成功しませんでした. しかし、あなたはアイデアを得る...

これが結果の画像です。左はオリジナル、右はコマンドの結果です:

1stオリジナル 修正された最初のオリジナル
 

于 2012-08-18T06:18:09.293 に答える