2

OCRにtesseractオープンソースエンジンを使用して、画像からテキストを読み取ります。しかし、100% の結果が得られたのは 1 回だけではありません。tesseract を使用した OCR の品質向上について、ご意見をお聞かせください。ありがとう

4

1 に答える 1

2

tesseract から最良の結果を得る方法は次のとおりです。画像の前処理が完了していることを確認してください。OVR は、次のプロパティを持つ画像に対して最良の結果を生成します。

  1. DPI を修正 (必要な場合) 300 DPI が最小
  2. テキスト サイズを修正します (例: 12 pt で問題ありません)。
  3. テキスト行の修正を試みます (テキストの傾き補正と歪み補正)
  4. 画像の照明を修正してみてください (例: 画像の暗い部分をなくす)
  5. 画像の二値化とノイズ除去

https://groups.google.com/forum/?fromgroups=#!topic/tesseract-ocr/g5aE_OvgyTU

于 2012-09-05T09:15:20.103 に答える