問題タブ [spatial-transformer-network]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

7 問題

0 投票する

0 に答える

34 参照

python - PyTorch grid_sample を使用して、右の画像と逆深度から左の画像を再構築する

私はこの論文の基本的なアーキテクチャを実装しています: https://arxiv.org/pdf/1705.08260.pdf in PyTorch.

オートエンコーダーと Spatial Transformer で構成されます。オートエンコーダの出力は、右画像とともにST またはいわばバイリニアサンプラーに入力され、このバイリニア補間の出力は、左画像とそれ自体の間の L1 損失の計算に使用されます。

しかし、問題があります。このコードが私が望むことをするとは思えません。PyTorch の grid_sample 関数の公式ドキュメントは、グリッドが -1 と 1 の範囲内になければならないという事実を参照していますが、グリッド自体は 1 より大きい最大値を持っています。このコードが正しい場合、グリッドが正規化されている行を書き直す必要があります。 ?

私が最初に考えたのは、次のように書き直すことでした。(grid / torch.max(grid) - 0.5) * 2つまり、値が -1 から 1 の間にある場合、この範囲を超える値がないため、padding_mode 引数を削除する必要があります。

これが正しい場合はお知らせください。これが正しい道であることを確認できます。

2022-02-15T07:14:55.783

1 2 3 4 5 6 7 8 9 10

問題タブ [spatial-transformer-network]

python - PyTorch grid_sample を使用して、右の画像と逆深度から左の画像を再構築する

Reference