現在、Tesseract-OCR を使用して画像内のテキストを認識していますが、質問があります。一部の単語を認識できないため、特別にトレーニングしましたが、まだ機能しませんでした。
DAWG ファイルなどの言語データをトレーニングするときに、追加のファイルが必要でしょうか。それについてはわかりません。単語がいくつかの特別な位置や方向に表示されたときに、それらのいくつかを認識できる場合があるためです。
本当に紛らわしいです。心からあなたの助けが必要です。前もって感謝します!
他の情報:
簡体字中国語を使用しています(中国語を使用するときに設定しなかったパラメータがあるかどうかはわかりません)。
私が認識したい絵はテーブルなので。その中にいくつかの行があります。精度を向上させるためにテーブルを認識するときに、この状況について何か考えを教えてください。
言葉の特殊な形が原因かどうかはわかりませんので。ここにいくつかの単語を直接貼り付けます。上下午一二三四五
どうもありがとう !