tesseract-OCRエンジンを使用してテキストを抽出する前に、ImageMagickサービスを使用してレシート画像を前処理しています。領収書の背景を削除する必要があります。ここで境界線を削除するためにマスキングを行いました。しかし、領収書のマスクを作成できません。
ただし、レシート画像から影を取り除こうとしました。
初期画像(レシート例)
convert input.png -colorspace gray \
\( +clone -blur 0x2 \) +swap -compose divide -composite \
-linear-stretch 5%x0% photocopy.png
コードを適用した後:
以下のコードを試して、白を除くすべての色を黒にしましたが、これは photocopy.png の背景を完全に黒くしているようには見えません。
convert receipt.jpg -fill black -fuzz 20% +opaque "#ffffff" black_border.jpg
レシート画像の枠線を消す方法はありますか?または、画像から何らかの種類のマスクを作成しますか? 注:背景が異なる複数の画像のノイズと境界線を削除する必要があります。