問題タブ [nvidia-smi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
70 参照

python - 次の正規表現の最も単純化された形式 / Extracting all values from nvidia-smi output

nvidia-smi の出力を含む非常に大きなテキスト文字列を Python で分析しようとしていますが、正規表現のスキルを磨くよりもデータの分析に多くの時間を費やしたいと思っています。次のように正規表現を取得しましたが、一部の行で永遠に時間がかかります(一部の行の入力データのバリエーションである可能性があります)が、おそらく私の正規表現パターンも非常に計算集約的であると思いました.

このパターンは、表の 3 行目に一致します。

これは下にあります⬇️

ほとんどの行で機能しますが、一部の行でランダムにハングします。この正規表現のより単純化されたバージョンは何でしょうか? または、より良い質問は、この表のすべての行 (各 GPU の対応するメトリック) の各値を取得するための最良の方法は何ですか?

切り詰められた入力文字列はこちら

PS次の値を抽出しようとしています

0 投票する
1 に答える
72 参照

bash - watch コマンドが特殊文字と引用符で機能しない

上記のコマンドは、2 つのサーバー GPU 統計を水平方向に積み重ねるために使用されます。watch コマンドなしで動作しますが、次のエラーが発生します

0 投票する
0 に答える
88 参照

python - Google Colab: Nvidia-Smi と Libtorch はもう互換性がありません

この問題は新しいもので、これまでに発生したことがないため、nvidia ドライバーまたは libtorch の更新があった可能性があります。問題:追加の GPU に Google Colab を使用しており、libtorch を必要とするプログラムをインストールしたいと考えています。そのため、ここ数週間、インストールは正常に機能していましたが、今日からプログラムをインストールできなくなりました。すでに何度か再起動、再起動などを試みましたが、何も機能していないようです。また、cuda 11.3 用の新しい libtorch バージョンをダウンロードし、cuda を更新して、ランタイムが cuda 11.3 で実行されるようにしました。電話すると

いつものように情報を提供します。それにもかかわらず、必要に応じて libtorch を環境変数として追加した後、次を使用して libtorch を使用します。

突然「NVML の初期化に失敗しました: ドライバー/ライブラリのバージョンが一致しません」と表示されます。そして、これが起こっているので、プログラムをインストールできなくなりました。

それで、rustcをインストールし(プログラムにはrustupが必要なので)、パスに追加します

環境変数として Libtorch を追加します。プログラムをカーゴインストールしようとしています。通常は問題なく動作していましたが、現在は失敗し、次のエラー メッセージが表示されます。

0 投票する
0 に答える
28 参照

cmd - NVML の初期化に失敗しました: 見つかりません

「nvidia-smi」コマンドの実行に問題があります-実行しようとするたびに。次のエラーが表示されます: NVML の初期化に失敗しました: 見つかりません

0 投票する
1 に答える
14 参照

memory - nvidia-smi がプロセス名を「-」と表示し、その PID を -9 で強制終了できないのはなぜですか?

nvidia-smi と入力すると、次の結果が得られます。

ここに画像の説明を入力

kill -9 25585 は機能しません。代わりに、Nvidia GPU を解放するために、すべての python プロセスを ps -ef して強制終了する必要があります。以前は、実際のプロセス名を表示していました

誰かが理由を説明して、毎回これを行う必要がないようにしてください。