java - Tesseract (Tess4J) で色付きテキストを認識する

Question

Java と Tess4J を使用してテキスト認識を行っています。私は黒と赤の画像を（別々に）認識しています。両方とも白い背景で、非常に鮮明です。黒いものでは完璧に動作しますが、赤いものでは tesseract が狂ってしまいます。変数（「editor_image_text_color」、「RED」）を追加してみましたが、まったく役に立ちません。現在、赤いものに対して私がしていることは、画像全体をスキャンし、すべての赤いピクセルを黒に設定することです。これは非常に効率が悪いと思います。なぜなら、写真の赤の強度が異なるため、ピクセルごとにいくつかの計算が必要だからです。節約しなければなりません。どうもありがとう！

例: http://imageshack.us/photo/my-images/593/3eu9.png/は常に 9 を返しますが、 http://imageshack.us/photo/my-images/818/efxf.png /そうではありません。前処理で数値が失われたかのようです。これは、黒いものは非常にうまく機能しますが、赤いものは乱数よりも優れているわけではありません。

score 1 · Accepted Answer

答えてくれてありがとうnguyenq、私はその機能を試してみましたが、うまくいきませんでしたが、そのImageHelperクラスをチェックアウトした後、メソッドを使用しました：

ImageHelper.convertImageToBinary(BufferedImage image)

そしてそれは非常にうまく機能します、ありがとう！

java - Tesseract (Tess4J) で色付きテキストを認識する

2 に答える 2

Related

Reference