問題タブ [pytorch]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ディープ ラーニング: さまざまなライブラリを介してユニバーサル マシン モデルを保存およびロードする
私の質問は 2 つの部分に分けることができます。
さまざまなライブラリで使用できる機械学習モデル ファイルの形式はありますか? たとえば、モデルを pytorch で保存してから、tensorflow を使用してロードしましたか?
そうでない場合、pytorch 機械学習モデルを keras で直接使用できるようにフォーマットを転送するのに役立つライブラリはありますか?
この質問をする理由は、最近、テンソルフローで以前にトレーニングしたモデルの一部を pytorch に調整する必要があるためです。
この質問の更新: Facebook と Microsoft は、ONNX と呼ばれるモデル標準を立ち上げる予定です。これは、Pytorch と Caffe2 の間など、異なるフレームワーク間でモデルを転送するために使用されます。以下にリンクします。
この質問のさらなる更新: Tensorflow 自体は Protocol Buffer 形式を使用してモデル ファイルを保存します。これは、異なるモデル間の転送に使用できます。以下にリンクします。
python - PyTorchで範囲[r1、r2]の一様分布を取得するには?
PyTorchの一様分布 (範囲内) からの値で満たされたtorch.Tensor
サイズの 2-D を取得したいと考えています。[a,b]
[r1,r2]
python - 長いシーケンス seq2seq モデルで注目?
私はこの pytorch チュートリアルに従い、この原則を要約に適用しようとしています。ここで、エンコード シーケンスは約 1000 ワードで、デコーダーは 200 ワードをターゲットにします。
これはどのように申請すればよいseq2seq
ですか?1000 語のシーケンス全体を一度に実行するのは非常にコストがかかり、ほとんど実行不可能であることはわかっています。したがって、seq を 20 個の seq に分割し、並列に実行することが答えになる可能性があります。しかし、それを実装する方法がわかりません。そこにも注目したい。
python - PyTorch Linear 層の入力次元の不一致
PyTorch で入力データを Linear (Fully Connected Layer) に渡すと、次のエラーが発生します。
入力データの形状が (N、C、H、W) (Convolutional+MaxPool レイヤーから) であるため、問題を完全に理解しています。
- N: データ サンプル
- C: データのチャネル
- H、W: 高さと幅
それにもかかわらず、私は PyTorch がデータ フォームの「再形成」を行うことを期待していました。
- [ N , D1,...Dn] --> [ N, D] D = D1*D2*....Dn
Variable.data の形状を変更しようとしましたが、グラデーションが前の形状を保持するため、このアプローチは推奨されず、一般に Variable.data 形状を変更すべきではないことを読みました。
フレームワークに沿った簡単な解決策があると確信していますが、見つけられませんでした。
これに対する良い解決策はありますか?
PD: 全結合層は入力サイズとして値 C * H * W を持ちます