問題タブ [pytorch]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
1504 参照

python - ディープ ラーニング: さまざまなライブラリを介してユニバーサル マシン モデルを保存およびロードする

私の質問は 2 つの部分に分けることができます。

  • さまざまなライブラリで使用できる機械学習モデル ファイルの形式はありますか? たとえば、モデルを pytorch で保存してから、tensorflow を使用してロードしましたか?

  • そうでない場合、pytorch 機械学習モデルを keras で直接使用できるようにフォーマットを転送するのに役立つライブラリはありますか?

この質問をする理由は、最近、テンソルフローで以前にトレーニングしたモデルの一部を pytorch に調整する必要があるためです。

この質問の更新: Facebook と Microsoft は、ONNX と呼ばれるモデル標準を立ち上げる予定です。これは、Pytorch と Caffe2 の間など、異なるフレームワーク間でモデルを転送するために使用されます。以下にリンクします。

https://research.fb.com/facebook-and-microsoft-introduce-new-open-ecosystem-for-interchangeable-ai-frameworks/

この質問のさらなる更新: Tensorflow 自体は Protocol Buffer 形式を使用してモデル ファイルを保存します。これは、異なるモデル間の転送に使用できます。以下にリンクします。

https://www.tensorflow.org/extend/tool_developers/

0 投票する
8 に答える
55956 参照

python - PyTorchで範囲[r1、r2]の一様分布を取得するには?

PyTorchの一様分布 (範囲内) からの値で満たされたtorch.Tensorサイズの 2-D を取得したいと考えています。[a,b][r1,r2]

0 投票する
1 に答える
622 参照

python - 長いシーケンス seq2seq モデルで注目?

私はこの pytorch チュートリアルに従い、この原則を要約に適用しようとしています。ここで、エンコード シーケンスは約 1000 ワードで、デコーダーは 200 ワードをターゲットにします。

これはどのように申請すればよいseq2seqですか?1000 語のシーケンス全体を一度に実行するのは非常にコストがかかり、ほとんど実行不可能であることはわかっています。したがって、seq を 20 個の seq に分割し、並列に実行することが答えになる可能性があります。しかし、それを実装する方法がわかりません。そこにも注目したい。

0 投票する
3 に答える
6028 参照

python - PyTorch Linear 層の入力次元の不一致

PyTorch で入力データを Linear (Fully Connected Layer) に渡すと、次のエラーが発生します。

入力データの形状が (N、C、H、W) (Convolutional+MaxPool レイヤーから) であるため、問題を完全に理解しています。

  • N: データ サンプル
  • C: データのチャネル
  • H、W: 高さと幅

それにもかかわらず、私は PyTorch がデータ フォームの「再形成」を行うことを期待していました。

  • [ N , D1,...Dn] --> [ N, D] D = D1*D2*....Dn

Variable.data の形状を変更しようとしましたが、グラデーションが前の形状を保持するため、このアプローチは推奨されず、一般に Variable.data 形状を変更すべきではないことを読みました。

フレームワークに沿った簡単な解決策があると確信していますが、見つけられませんでした。

これに対する良い解決策はありますか?

PD: 全結合層は入力サイズとして値 C * H * W を持ちます