問題タブ [xeon-phi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opencl - Intel Xeon Phi と Nvidia Tesla K20 を比較するベンチマーク
驚いたことに、 rodiniaやSHOCなどのオープン ソース OpenCL ベンチマーク スイートを使用したこれらの製品の比較が見つかりません。このような比較は、私が見つけた理論上のピーク パフォーマンスや単純な行列乗算カーネルのパフォーマンスの比較よりも興味深いものになる可能性があります。
そのような結果がどこで入手できるか知っている人はいますか? それができない場合、スタック オーバーフロー ユーザーはいずれかまたは両方の製品にアクセスでき、ベンチマークを実行して結果を共有する時間と傾向がありますか? どちらのカードのどのバージョンの結果も興味深いものになるでしょう。
vectorization - XeonPhiのloaddup_pd/unpacklo_pd
Xeon Phiレジスタのように、512幅のSIMDベクトルに次のdoubleがある場合:
それを次のようにすることは可能ですか?
単一の命令を使用しますか?また、doubleのビット単位の組み込み関数がないため、これは上記を達成するための有効な方法ですか?
vectorization - XeonPhiでの散布/収集
Xeon Phi命令セットに関するIntelのマニュアルを参照していましたが、スキャッター/ギャザー命令がどのように機能するかを理解できませんでした。
次のdoubleのベクトルがあるとします。
次のように4つのベクトルを作成することは可能ですか?
これらの手順を使用しますか?これを達成する他の方法はありますか?
scala - JVM ベースの言語で Xeon Phi を使用する
Scala などの JVM ベースの言語を使用して Xeon Phi を使用することはできますか? 例はありますか?
mpi - Xeon Phi で open_shm によって作成された共有メモリを使用する場合のセグメンテーション違反
単一の Xeon Phi ノード (61 コアを搭載) 用のコードを作成しました。私は2つのファイルを持っています。他の mpi 呼び出しを呼び出す前に、MPI_Init(2) を呼び出しました。ntasks を見つけました。mpi 呼び出しも使用してランク付けします。必要なライブラリもすべて含めました。それでもエラーが発生します。これで私を助けてもらえますか?
ファイル 1:
ファイル 2:
次に、この recvbuff のファイル 1 で計算を行っています。 sharedRegion 変数を使用しているときに、このセグメンテーション違反が発生します。
c# - C# でインテル® Xeon Phi をプログラミングするには?
私は C# プログラマーであり、C++ の経験があり、すべて Windows を使用しています。
このスキル セットを使用して、インテル Xeon Phi プロセッサー向けに開発するオプションはありますか?
このリンクを見つけましたが、それが最善/唯一の方法かどうかはわかりません。
アドバイスありがとうございます。