内部に複数のアイテムを含む画像 (例: 60x60) があります。アイテムは、たとえば 4x4 の寸法の正方形のボックスの形をしており、画像内にランダムに配置されます。ボックス (アイテム) 自体はランダムパターンで作成され、一部のランダム ピクセルはオンに切り替えられ、その他はオフに切り替えられます。そのため、画像内で同じボックスが 2 回 (または 2 つ以上のアイテムの場合はそれ以上) 繰り返されるか、まったく異なる可能性があります。
元の画像 (60x60) を取り込み、画像内のすべてのパッチを出力できるディープ ラーニング モデルを作成しようとしています。
今のところこれがすべてですが、議論が始まると、より多くの詳細を共有できることは間違いありません. この目的を達成するのに役立つさまざまなオプションを比較検討したいと思います。ありがとう。