ウェブカメラにかざした紙の写真があり、写真の領域を紙だけに最小化したいと考えています。このようにして、私の OCR プログラムは潜在的により正確になり、おそらくより高速になります。
これまでに、紙を背景から分離するためにいくつかの手順を実行しました。
まず、高いしきい値を設定した Canny Edge 検出を使用します。これにより、画像のエッジが 2 色で表現されます。その上に、背景に鋭いエッジを持つ他のアーティファクトの中に角丸長方形が表示されます。
次に、ハフ変換を使用して、黒の背景に極座標で 100 を超えるポイント ヒットを持つベクトルを描画します。結果の画像は次のとおりです。
中央にある大きな (最大の) ほぼ長方形の図が見えますか? それが私が持っている紙です。その台形を多角形として分離するか、何らかの方法でその頂点の座標を取得する必要があります。
元の画像でこれらの座標を使用して、紙の PNG だけを分離することができます。
また、これら 3 つのサブ質問のいずれかに回答していただければ幸いです。
-画像上でこれらの線の交点の位置をどのように見つけますか?
-中心の台形ポリゴンを形成しない線を取り除くにはどうすればよいですか?
-これらの点で、画像の台形/長方形の領域のみを取得できる凸包よりも優れたものはありますか?
私のプログラムがより良い画像を生成した別の例を次に示します。