機械学習の実験にMNIST 数字画像を使用しています。デフォルトで中央に配置されている重心ではなく、位置に基づいて各画像を中央に配置しようとしています。
regionprops クラスの BoundingBox メソッドを使用して画像を抽出しています。グレースケールの B&W コピーを作成し、これを使用して BoundingBox プロパティを決定し (regionprops は B&W 画像のみで動作します)、それをグレースケールのオリジナルに適用して、正確な画像の四角形を抽出します。これは、画像の ~ 98% で正常に機能します。
私が抱えている問題は、画像の残りの約 2% の左上隅に何らかのノイズまたは誤ったピクセルがあり、そのピクセルのみを抽出して残りの画像を破棄することです。
画像のすべての要素を単一の長方形に組み込むにはどうすればよいですか?
編集:さらなる調査により、この質問を「すべての領域の境界ボックスを見つけるにはどうすればよいですか?」と要約して言い換えることができることに気付きました。すべての領域が同じラベルになるようにラベル マトリックスを調整しようとしましたが、役に立ちませんでした。