人間の輪郭を検出するために、一連の画像でカスタムトレーニングされた deeplabv3 があります。トリミング サイズは 1025 x 513 です。トレーニング済みのモデルをトレーニングしてエクスポートできます。テストすると、入力画像のサイズが約 1025 x 450 の場合に適切なマスク出力が得られます。しかし、入力画像の幅を変更すると、一部の画像では出力が改善され、一部の画像では悪化します。しかし、変化はほとんどの場合、指や髪の毛などの入力画像の小さな部分で発生します。手の一部は出力から切り取られます。
指は入力画像からトリミングされています 画像 の入力サイズを変更すると、出力が良くなります
しかし、トリミングはランダムに変化しています。