3

tesseract-OCRエンジンを使用してテキストを抽出する前に、 ImageMagickを使用してレシート画像を前処理しています。を使用して画像からノイズを除去しました

convert input.png -colorspace gray \
  \( +clone -blur 0x2 \) +swap -compose divide -composite \
  -linear-stretch 5%x0%   photocopy.png

ここで、テキストで領域を切り取る必要があります。ImageMagickには、画像から境界線を削除するマスキング機能がありますが、私の場合、レシート画像の背景が均一でないため、マスクの作成が機能していないようです。

ここから SWT ' Stroke Width Transform'自然画像のテキストを識別する' を行ってきましたこれは imagemagick (他の便利な開発者向け画像処理ツールである可能性があります) を使用してテキストを識別し、境界線を省略できるようにすることはできますか? 前もって感謝します。

4

0 に答える 0