プロジェクトに TessBaseAPI を使用して、単純な OCR Android アプリを作成しています。二値化や画像の強化など、いくつかの画像前処理手順を実行しました。しかし、その結果は 50% から 60% です。どうすれば認識率を改善できますか?
2 つのサンプル画像を含めます。
プロジェクトに TessBaseAPI を使用して、単純な OCR Android アプリを作成しています。二値化や画像の強化など、いくつかの画像前処理手順を実行しました。しかし、その結果は 50% から 60% です。どうすれば認識率を改善できますか?
2 つのサンプル画像を含めます。
上記のコマンドへの次の追加は、2 番目のイメージに対して機能します。
-negate \
-deskew 40% \
+repage \
-crop 393x110+0+0 \
結果に適切なレベルのデスキューとトリミングを追加するため、Tesseract の作業が少し楽になります...
したがって、完全なコマンドは次のようになります。これにより、システムで正しい結果が得られます。
convert 15071917.jpg \
-type grayscale \
-negate \
-gamma 1 \
-contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast \
-normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize \
-despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle \
-negate \
-deskew 40% \
+repage \
-crop 393x110+0+0 \
15071917.png \
&& \
tesseract 15071917.png OUT && cat OUT.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0
TESCO
これは元の画像 (左) と変更されたコマンドの結果の画像 (右) です。
今日は何か新しいことを学びました。Tesseract 3.01では、OCRを機能させる最も簡単な方法は、最初にテキストをデスキューすることだったようです。
これは非常に単純なコマンドです。このコマンドは、画像を切り取って少しトリミングしますが、元の画像とのコントラストや色の変更操作は行いません。
convert 15071917.jpg \
-background pink \
-shear -0x6 \
-crop 350x80+0+24 \
tesco.jpg \
&& \
tesseract tesco.jpg a && cat a.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
TESCO
このコマンドは、最初の画像ファイルに対して機能します。私はImageMagickバージョンを使用してい6.7.9-0 2012-08-17 Q16
ます:
convert 1school.jpg \
-scale 1000% \
-blur 1x65535 -blur 1x65535 -blur 1x65535 \
-contrast \
-normalize \
-despeckle \
-despeckle \
-type grayscale \
-sharpen 1 \
-posterize 3 \
-negate 1school.tif \
&& \
tesseract 1school.tif OUT && cat OUT.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0
'
SCHOOL
ZONE
2 番目のイメージには別のコマンドが必要です。
convert 15071917.jpg \
-type grayscale \
-negate \
-gamma 1 \
-contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast -contrast \
-normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize -normalize \
-despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle -despeckle \
15071917.tif \
&& \
tesseract 1school.tif OUT && cat OUT.txt
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0
TE§§IO
わかりました、2番目のものはそれほど成功しませんでした. しかし、あなたはアイデアを得る...
これが結果の画像です。左はオリジナル、右はコマンドの結果です: