問題タブ [xeon-phi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Xeon Phi での Python の実行
パフォーマンスの向上を試すために、Python でスクリプト可能なセミ HPC コードを Xeon Phi に移植したいと考えています。オフロード モードで実行することはできません (データ転送が禁止されます)。コード全体をコプロセッサ上で実行する必要があります。
Xeon Phi アーキテクチャのすべてのライブラリ (Python を含む) を「クロスコンパイル」し、それらのライブラリを NFS 経由で Xeon Phi にマウントし、そこですべてを実行する必要があることを、知識のある人が確認できますか?
クロスコンパイルの場合: ターゲット アーキテクチャは何ですか? もちろん、数値演算の場合、組み込み関数が拡張されているため、xeon-phi は必須ですが、たとえば Python の場合、バイナリとライブラリは amd64 とバイナリ互換性がありますか? これにより、基本的に数値計算部分のいくつかのフラグのみを変更するだけで、はるかに簡単になります。
更新:記録として、インテルのフォーラムでのサポートは非常に悪いものでした。ソフトウェア スタックの技術的状態の悪さ (yocto がコンパイルできないなど)、ドキュメントがほとんどないことなどに気づき、この道を断念しました。さようなら、Xeon Phi。
gpu - GPU と比較したコプロセッサー・アクセラレーター
Intel Xeon-Phi のようなコプロセッサーは、GPU と同じように利用されることになっているので、単一のカーネルを実行する大量のブロックをオフロードして、コプロセッサーが処理する全体的なスループットのみがスピードアップするか、または独立したスレッドをオフロードします(タスク)も効率を上げますか?
bash - Xeon Phi がバイナリ ファイルを実行できない
xeon phi コプロセッサーでバイナリー・ファイルを実行しようとしていますが、「bash: バイナリー・ファイルを実行できません」というメッセージが表示されます。そのため、エラーログを表示する方法、または実行するように指示したときに何が起こっているのかを表示する方法を見つけようとしています。すでに試しbash --verbose
ましたが、追加情報は表示されませんでした。何か案は?
linux - 異なるプラットフォーム用に暗号通貨ファイルを再コンパイルする
cryptonight-algorithm 暗号通貨のいくつかのソース ファイルを微調整して、xeon phi に組み込まれた Linux uOS で実行できるようにしようとしていますが、1 つのバイナリを作成するさまざまなソース ファイルが多数ある場合にコンパイルする方法がわかりません。Intelコンパイラを使用してこれを行う方法、または実際にこれを行う他の方法についてのアイデアはありますか?
c++ - Intel MIC での Intel TBB および Cilk Plus スレッド アフィニティ
Intel TBB と Cilk Plus を使用して Intel Xeon Phi の並列コードを書きたいのですが、スレッド アフィニティに問題があります。1 つのスレッドを 1 つの論理コアにバインドしたい。OpenMP のようにアフィニティを設定することはできますか? つまり、KMP_AFFINITY="compact" です。前もって感謝します。:)
multithreading - CPU がコア間でベクトル レジスタを共有しているかどうか、または各コアに専用のレジスタがあるかどうかを知るにはどうすればよいですか?
CPU がコア間でベクトル レジスタを共有しているかどうか、または各コアに専用のレジスタがあるかどうかを知るにはどうすればよいですか?
リファレンスはどこで入手できますか?
マルチスレッドと SIMD を使用して、プログラムの浮動小数点計算を最適化したいと考えています。それらは衝突を引き起こしますか?
cpu - Xeon Phi のコア使用率を 10Hz で監視するにはどうすればよいですか?
Xeon Phi (Knights Corner、インオーダー プロセッサ) の 60 コアすべての使用率を、比較的高い周波数で、たとえば少なくとも 0.1 秒ごとに測定/監視しようとしてきました。これは 10Hz になります。
最新の PAPI ライブラリを試しました。ただし、完了した命令のカウンターである PAPI_TOT_INS のみをサポートします。0.1秒ごとに発行される命令に関連する何かが実際に必要であり、完了していないため、これは機能しません。異なるサイクルで発行されたいくつかの命令は、同じサイクルで終了する場合があります。命令の発行は、コアが停止しているかどうかによって影響を受けます。
「top」や「perf」などの他のコマンドは 1 Hz で動作しますが、これは私の測定には遅すぎます。より高い周波数が必要です。また、測定をコードの重要なフェーズと同期させる必要もあります。そのため、インテル Vtune プロファイルも機能しません。
Xeon Phi に関する指示の問題や、それらの使用に関連するその他の活動を監視する方法はありますか? これらのハードウェア カウンターがあることは理解していますが、それらを読み取るのは非常に難しいように思えます。各スレッドの CPU 時間を測定することで、この使用率を推測できるでしょうか?
ありがとう。
xeon-phi - スレッド番号を変更してもコードには影響しません
私は xeon-phi を学習しようとしています。Intel Xeon-Phi Coprocessor HPC book を勉強しながら、ここでコードを実行しようとしました。(本より)
コードは openmp と 2 つのスレッドを使用します。
しかし、私が取っている結果は、1 つのスレッドで実行した場合と同じです。(openmp は一切使用しない)
私はマイクのさまざまな組み合わせでも使用しましたが、それでも同じです:
どういうわけかopenmpが有効になっていないようです?ここで何か不足していますか?
1スレッドのみを使用したコードはこちら
私は以下を使用してコンパイルしました:
ありがとう!
openmp - スレッド数と時間結果の一貫性
私はxeon phiプログラミングを学ぼうとしています。
私はこのコードを CPU で実行しており、コプロセッサーで実行したい部分にオフロード プラグマを使用しています。
私はCPUでコンパイルしていて、 offloads を使用しているので、次を使用しています:
スレッド番号を指定するため。
私の問題:
1) コードを実行すると、常に 40 個のスレッドが使用されていることが示されます。
2)コンパイルせずにコードを何度も実行すると、異なる時間結果が得られます。
コード:
私はコンパイルしています: