問題タブ [supercomputers]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
performance - 簡単に並列化可能な DO ループ (F90) による MPI の高速化
個々の反復が互いに独立しており、ハードドライブとの間でデータの入出力のみを行う単純な DO ループ (Fortran 90) があります (プロセスは互いにメッセージ/MPI を交換しません)。 MPI を使用します。順次実行では、ループの 1 回の反復が完了するまでに約 1 日かかります。このような反復を 29 回並行して実行すると、約 2.5 日かかります。これは、スーパーコンピューターの 1 つのノード上にあります (つまり、ノード間通信はありません)。
単純に並列化可能なプログラム (ループ内の独立したステップ) の場合、合計実行時間は、ループ内で 1 つのステップのみを実行する場合の実行時間にほぼ近くなるはずだ、と人々が言っているのを聞いたことがあります。
質問: この高速化は問題ないように見えますか?
どうもありがとう。
linear-algebra - 解く線形方程式の最大サイズ? (X=AX+B)
これは、今日の最速のハードウェアで解かれる一連の線形方程式の最大サイズに関する非常に一般的な質問です。形式は次のとおりです。
X = AX + B
A: 浮動小数点数の NxN 行列で、スパースです。
B: 浮動小数点数の N-ベクトル。
X について解いてください。
これは X(IA) = B になり、ここで読んだように因数分解 (逆行列ではない) を使用して解決するのが最適です。
http://www.johndcook.com/blog/2010/01/19/dont-invert-that-matrix/
あなた自身を知っていますか、または今日の最速のハードウェアで N の最大値を与えるベンチマークまたは論文への参照を持っていますか? 私が見たほとんどのベンチマークは、N < 10,000 を使用しています。N>10x10^6以上を1ヶ月以内に処理しようと考えています。
計算次元だけでなく、A のストレージも考慮してください。問題になる可能性があります。たとえば、N = 1 x 10^6 と仮定すると、ストレージは 1x10^12 x 4 バイト / (1024x1024x1024) = 4 テラバイトになります。これは扱いやすいと思います。
最後に、システムを解決する方法を並列化して、並列化により N がかなり大きくなる可能性があると仮定できますか?
前もって感謝します、ブリアコ
cluster-computing - SLURM で現在のユーザーのキューを確認する方法
SLURM で管理されているクラスターで、現在のユーザー (およびクラスター) のキューを確認したい。通常、次のコマンドを使用する必要があります。
これの問題は、これが頻繁に使用するかなり長いコマンドであるという事実とは別に、ユーザー名が必要なことです。ある時点でユーザーのキューをチェックしたいスクリプトを作成しましたが、最初にユーザー名を取得する必要があります。
これらすべての回避策がありますが、LoadLeveller のそれぞれのようなコマンドを使用できれば素晴らしいと思います。
そのようなものはありますか?--user
または、どうにかしてフラグで「現在のユーザー」を指定できますか?
supercomputers - スーパーコンピュータでいうRmax/RPeak(Ratio)とは
私は top500 スーパーコンピューター データベースに取り組んでいます。( http://www.top500.org/ )
結果の比率はRmax
何かですか? RPeak
効率と言うような?または、スーパーコンピューターについて何か言えることなら何でも。
ライファクターのようなものでしょうか?
linux - Linuxシェルリモートサイトでシグナル11。どうすればトラブルシューティングできますか
私は最近、研究用の主要なコーディングを行っているバイオ専攻です。研究を支援するため、キャンパスには研究者用のスーパーコンピュータがキャンパス内に設置されています。私はこのスーパーコンピューターからリモートで作業しており、Linux シェルを使用してアクセスし、ジョブを送信しています。私は、Mauve というコンピューターにインストールされたプログラムを使用して、多数のゲノムを整列させるためのジョブ送信スクリプトを作成しています。今、私は以前に Mauve でジョブを実行したことがあり、そのジョブのスクリプトをこのジョブに合うように変更しました。今回だけ、このエラーが発生し続けます
したがって、これをトラブルシューティングする方法がわかりません。これが非常に基本的で時間を浪費している場合は申し訳ありませんが、リモート サイトでこれをトラブルシューティングする方法がわかりません。私がこれまで見てきた考えられる解決策はすべて、私が制御できないハードウェアまたはソフトウェアにアクセスする必要があります。私の現在の提出スクリプトはこれです。
parallel-processing - 並行してジョブを送信する
互いに関係のないさまざまなファイル (10 としましょう) のデータを分析したいと考えています。ジョブを並行して送信することと、10 台の端末を開いてジョブを 10 回送信することの違いを知りたいです。10 コア以上あると仮定して、実行時間に関する違いを知りたいです。ファイルが互いに依存していない場合の並列プログラミングの利点を理解しているかどうかはわかりません。