Google の TensorFlowを使用した深層学習モデルに取り組んでいます。モデルは、シーンのセグメント化とラベル付けに使用する必要があります。
- 33 個のセマンティック クラスと256x256ピクセルの画像を持つSiftFlow データセットを使用しています。
- その結果、畳み込みとデコンボリューションを使用する最終層で、次の tensor(array) [256, 256, 33]に到達します。
- 次に、 Softmaxを適用し、結果をサイズ[256, 256]のセマンティック ラベルと比較します 。
質問:形状が[256,256,1]に なるように最終レイヤーに平均平均化または argmax を適用し、各ピクセルをループして、256x256 インスタンスを分類しているかのように分類する必要がありますか? 答えが「はい」の場合、そうでない場合はどのように、他にどのような選択肢がありますか?