1

ngspiceというツールを使用して一連のシミュレーションを実行する必要があります。100万回のシミュレーションを実行したいので、それらをマシンのクラスター (マスター + 開始するスレーブ、それぞれ 12 コア) に分散しています。

コマンドは次のとおり ngspice deck_1.spです。ngspice deck_2.sp等。、

ステップ 1: Python スクリプトを使用して、これらの sp ファイルを生成します。

ステップ 2: Python はGNU 並列を呼び出してマスター/スレーブ全体に sp ファイルを配布し、ngspice を使用してシミュレーションを実行します

ステップ 3: 結果を後処理します (Python スクリプト)。

ディスク容量を節約するために、一度に 1000 個のファイルのみを生成して処理します。したがって、100 万個のファイルがシミュレートされるまで、上記のステップ 1 から 3 がループで繰り返されます。

今、私の問題は次のとおりです。

初めてループを実行するときは問題ありません。1000 回のシミュレーションが完了するまで、ファイルはマスター/スレーブ全体に分散されます。ループが 2 回目に始まると、既存の sp ファイルを消去して再生成します (ステップ 1)。ここで、ステップ 2 を実行すると、奇妙な理由でいくつかのファイルが検出されません。いくつかのデバッグの後、ステップ1で作成された特定のspファイルに対して、「古いNFSファイルハンドル」および「そのようなファイルまたはディレクトリdeck_21.spはありません」などのエラーが表示されます。

Python スクリプトを一時停止lsし、ディレクトリで ' ' を実行したところ、ファイルが実際に存在することがわかりましたが、エラーが指摘しているように、古い NFS ファイル ハンドルが原因です。このリンクでは、クライアントなどを再マウントすることをお勧めしますが、マウントする管理者権限がないマシンにログインしています。これを解決する方法はありますか?

ありがとう!

4

1 に答える 1

1

いいえ。これを修正するには、管理者権限が必要です。

于 2013-04-25T07:50:35.317 に答える