Java と Tess4J を使用してテキスト認識を行っています。私は黒と赤の画像を(別々に)認識しています。両方とも白い背景で、非常に鮮明です。黒いものでは完璧に動作しますが、赤いものでは tesseract が狂ってしまいます。変数(「editor_image_text_color」、「RED」)を追加してみましたが、まったく役に立ちません。現在、赤いものに対して私がしていることは、画像全体をスキャンし、すべての赤いピクセルを黒に設定することです。これは非常に効率が悪いと思います。なぜなら、写真の赤の強度が異なるため、ピクセルごとにいくつかの計算が必要だからです。節約しなければなりません。どうもありがとう!
例: http://imageshack.us/photo/my-images/593/3eu9.png/は常に 9 を返しますが、 http://imageshack.us/photo/my-images/818/efxf.png /そうではありません。前処理で数値が失われたかのようです。これは、黒いものは非常にうまく機能しますが、赤いものは乱数よりも優れているわけではありません。