0

現在、Tesseract-OCR を使用して画像内のテキストを認識していますが、質問があります。一部の単語を認識できないため、特別にトレーニングしましたが、まだ機能しませんでした。

DAWG ファイルなどの言語データをトレーニングするときに、追加のファイルが必要でしょうか。それについてはわかりません。単語がいくつかの特別な位置や方向に表示されたときに、それらのいくつかを認識できる場合があるためです。

本当に紛らわしいです。心からあなたの助けが必要です。前もって感謝します!

他の情報:

  1. 簡体字中国語を使用しています(中国語を使用するときに設定しなかったパラメータがあるかどうかはわかりません)。

  2. 私が認識したい絵はテーブルなので。その中にいくつかの行があります。精度を向上させるためにテーブルを認識するときに、この状況について何か考えを教えてください。

  3. 言葉の特殊な形が原因かどうかはわかりませんので。ここにいくつかの単語を直接貼り付けます。上下午一二三四五

どうもありがとう !

4

0 に答える 0