工場で組立ラインから出てくる物の大きさを測るシステムを作りたいです。オブジェクトはほぼ長方形の石のスラブで、幅と高さが欲しいです。それぞれの石は同じ位置でフラッシュで撮影されているので、コンディションはかなりコントロールされています。トリッキーな部分は、石の表面にパターンがある場合があり(多くの場合、波紋や縞模様のある大理石)、ほとんど黒く、影に溶け込んでいる場合があります。
背景の参照画像から各画像を単純に差し引いてみましたが、照明やローラーの位置、機械の小さな部分に小さな変化が十分にあるため、出力にノイズが発生します。
次に試す予定のアプローチは、Cannyのエッジ検出アルゴリズムを使用してから、ある種の数値最適化(Nelder-Meadなど)を使用して、4辺のポリゴンをエッジに一致させることです。しかし、私が何かを自作する前に、この種の状況でうまく機能する既存のアプローチはありますか?
それが役立つ場合は、スラブ内にあることがわかっている画像のパッチ(常に隅に並んでいる)を使用してアルゴリズムを「シード」し、その表面パターンと色を識別するのに役立てることができます。必要に応じて、注釈付き画像のトレーニングセットを作成することもできます。
背景といくつかの石のスラブのいくつかのサンプル画像: