tesseract-OCRエンジンを使用してテキストを抽出する前に、 ImageMagickを使用してレシート画像を前処理しています。を使用して画像からノイズを除去しました
convert input.png -colorspace gray \
\( +clone -blur 0x2 \) +swap -compose divide -composite \
-linear-stretch 5%x0% photocopy.png
ここで、テキストで領域を切り取る必要があります。ImageMagickには、画像から境界線を削除するマスキング機能がありますが、私の場合、レシート画像の背景が均一でないため、マスクの作成が機能していないようです。
ここから SWT ' Stroke Width Transform
'自然画像のテキストを識別する' を行ってきましたこれは imagemagick (他の便利な開発者向け画像処理ツールである可能性があります) を使用してテキストを識別し、境界線を省略できるようにすることはできますか? 前もって感謝します。