問題タブ [xeon-phi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1654 参照

python - Xeon Phi での Python の実行

パフォーマンスの向上を試すために、Python でスクリプト可能なセミ HPC コードを Xeon Phi に移植したいと考えています。オフロード モードで実行することはできません (データ転送が禁止されます)。コード全体をコプロセッサ上で実行する必要があります。

Xeon Phi アーキテクチャのすべてのライブラリ (Python を含む) を「クロスコンパイル」し、それらのライブラリを NFS 経由で Xeon Phi にマウントし、そこですべてを実行する必要があることを、知識のある人が確認できますか?

クロスコンパイルの場合: ターゲット アーキテクチャは何ですか? もちろん、数値演算の場合、組み込み関数が拡張されているため、xeon-phi は必須ですが、たとえば Python の場合、バイナリとライブラリは amd64 とバイナリ互換性がありますか? これにより、基本的に数値計算部分のいくつかのフラグのみを変更するだけで、はるかに簡単になります。

更新:記録として、インテルのフォーラムでのサポートは非​​常に悪いものでした。ソフトウェア スタックの技術的状態の悪さ (yocto がコンパイルできないなど)、ドキュメントがほとんどないことなどに気づき、この道を断念しました。さようなら、Xeon Phi。

0 投票する
1 に答える
657 参照

gpu - GPU と比較したコプロセッサー・アクセラレーター

Intel Xeon-Phi のようなコプロセッサーは、GPU と同じように利用されることになっているので、単一のカーネルを実行する大量のブロックをオフロードして、コプロセッサーが処理する全体的なスループットのみがスピードアップするか、または独立したスレッドをオフロードします(タスク)も効率を上げますか?

0 投票する
2 に答える
961 参照

bash - Xeon Phi がバイナリ ファイルを実行できない

xeon phi コプロセッサーでバイナリー・ファイルを実行しようとしていますが、「bash: バイナリー・ファイルを実行できません」というメッセージが表示されます。そのため、エラーログを表示する方法、または実行するように指示したときに何が起こっているのかを表示する方法を見つけようとしています。すでに試しbash --verboseましたが、追加情報は表示されませんでした。何か案は?

0 投票する
1 に答える
79 参照

linux - 異なるプラットフォーム用に暗号通貨ファイルを再コンパイルする

cryptonight-algorithm 暗号通貨のいくつかのソース ファイルを微調整して、xeon phi に組み込まれた Linux uOS で実行できるようにしようとしていますが、1 つのバイナリを作成するさまざまなソース ファイルが多数ある場合にコンパイルする方法がわかりません。Intelコンパイラを使用してこれを行う方法、または実際にこれを行う他の方法についてのアイデアはありますか?

0 投票する
1 に答える
437 参照

c++ - Intel MIC での Intel TBB および Cilk Plus スレッド アフィニティ

Intel TBB と Cilk Plus を使用して Intel Xeon Phi の並列コードを書きたいのですが、スレッド アフィニティに問題があります。1 つのスレッドを 1 つの論理コアにバインドしたい。OpenMP のようにアフィニティを設定することはできますか? つまり、KMP_AFFINITY="compact" です。前もって感謝します。:)

0 投票する
2 に答える
246 参照

multithreading - CPU がコア間でベクトル レジスタを共有しているかどうか、または各コアに専用のレジスタがあるかどうかを知るにはどうすればよいですか?

CPU がコア間でベクトル レジスタを共有しているかどうか、または各コアに専用のレジスタがあるかどうかを知るにはどうすればよいですか?

リファレンスはどこで入手できますか?

マルチスレッドと SIMD を使用して、プログラムの浮動小数点計算を最適化したいと考えています。それらは衝突を引き起こしますか?

0 投票する
0 に答える
577 参照

cpu - Xeon Phi のコア使用率を 10Hz で監視するにはどうすればよいですか?

Xeon Phi (Knights Corner、インオーダー プロセッサ) の 60 コアすべての使用率を、比較的高い周波数で、たとえば少なくとも 0.1 秒ごとに測定/監視しようとしてきました。これは 10Hz になります。

最新の PAPI ライブラリを試しました。ただし、完了した命令のカウンターである PAPI_TOT_INS のみをサポートします。0.1秒ごとに発行される命令に関連する何かが実際に必要であり、完了していないため、これは機能しません。異なるサイクルで発行されたいくつかの命令は、同じサイクルで終了する場合があります。命令の発行は、コアが停止しているかどうかによって影響を受けます。

「top」や「perf」などの他のコマンドは 1 Hz で動作しますが、これは私の測定には遅すぎます。より高い周波数が必要です。また、測定をコードの重要なフェーズと同期させる必要もあります。そのため、インテル Vtune プロファイルも機能しません。

Xeon Phi に関する指示の問題や、それらの使用に関連するその他の活動を監視する方法はありますか? これらのハードウェア カウンターがあることは理解していますが、それらを読み取るのは非常に難しいように思えます。各スレッドの CPU 時間を測定することで、この使用率を推測できるでしょうか?

ありがとう。

0 投票する
3 に答える
274 参照

xeon-phi - スレッド番号を変更してもコードには影響しません

私は xeon-phi を学習しようとしています。Intel Xeon-Phi Coprocessor HPC book を勉強しながら、ここでコードを実行しようとしました。(本より)

コードは openmp と 2 つのスレッドを使用します。

しかし、私が取っている結果は、1 つのスレッドで実行した場合と同じです。(openmp は一切使用しない)

私はマイクのさまざまな組み合わせでも使用しましたが、それでも同じです:

どういうわけかopenmpが有効になっていないようです?ここで何か不足していますか?

1スレッドのみを使用したコードはこちら

私は以下を使用してコンパイルしました:

ありがとう!

0 投票する
1 に答える
101 参照

openmp - スレッド数と時間結果の一貫性

私はxeon phiプログラミングを学ぼうとしています。

私はこのコードを CPU で実行しており、コプロセッサーで実行したい部分にオフロード プラグマを使用しています。

私はCPUでコンパイルしていて、 offloads を使用しているので、次を使用しています:

スレッド番号を指定するため。

私の問題:

1) コードを実行すると、常に 40 個のスレッドが使用されていることが示されます。

2)コンパイルせずにコードを何度も実行すると、異なる時間結果が得られます。

コード:

私はコンパイルしています: