python - PyTorch で「CUDA のメモリ不足」を回避する方法

Question

これは、GPU メモリが少ない PyTorch ユーザーにとってかなり一般的なメッセージだと思います。

RuntimeError: CUDA out of memory. Tried to allocate  MiB (GPU ;  GiB total capacity;  GiB already allocated;  MiB free;  cached)

授業でオブジェクト検出アルゴリズムを研究したいと考えています。また、多くのディープラーニングアーキテクチャは大容量の GPU メモリを必要とするため、私のマシンではそれらのモデルをトレーニングできません。各レイヤーを GPU にロードしてからロードし直すことで、画像を処理しようとしました。

for m in self.children():
   m.cuda()
   X = m(X)
   m.cpu()
   torch.cuda.empty_cache()

しかし、あまり効果がないようです。GPU メモリをほとんど使用せずに大規模なディープラーニングモデルをトレーニングするためのヒントやコツはあるのでしょうか。前もって感謝します！

編集：私は深層学習の初心者です。ダミーの質問でしたら申し訳ありません:)

score 0 · Accepted Answer

実装：

技術的に:

を。モデルの圧縮、ネットワークの枝刈り、量子化などの手法を使用してネットワークを圧縮します。

b. mobileNetv1/2/3 のようなよりコンパクトなネットワーク構造を直接使用します。

c. ネットワークアーキテクチャ検索 (NAS)。

13 に答える 13