私のTesseractが数字を含む一部の画像を認識できない理由と、それについて何かできることがあれば、誰かが教えてくれることを望んでいました. すべてがテストどおりに機能しており、必要なのは数字だけなので、英語のパターンで管理できると思っていましたが、7 セグメント ディスプレイから始めなければなりませんでした。
追加された画像で多くの問題を抱えていますが、独自の認識アルゴリズムの作業を開始する必要があるかどうか、または Tesseract 用に独自のデータセットを作成できるかどうかを知りたいです。制限は Tesseract にありますか?
試したこと:psmをone_line、one_word、one_charに設定しようとしました(そして画像を切り刻みました)。one_line と one_word では大きな変化はありませんでした。one_char を使用すると、認識が少し良くなりましたが、間隔が大きいために余分な数字が付けられ、それが台無しになりました。添付の画像を見ると、結果は 04 になりました。私自身二値化を行ったが、これにより認識が低下し、非常にリソースを消費していた. 写真を反転しようとしましたが、tesseract ではまったく違いはありません。
とりわけ、処理するために必要な写真を添付しました。
画像についての説明:
テッセラクトが問題なく認識できる画像ですが、動作中の画像を中心にアプリを構築するのに便利なように言葉で作成されています。
image_seven に一致する実際の画像です。しかし、これを認識できません。
認識してもらいたい別の画像です。はい、それをねじることができないことを知っています。テスト時にねじを外しました(ねじはここでの用語=="まっすぐにする"と考えてください)。