5

Desktop i7-4770k @ 4GHz のコアのピーク GFLOPS は、4GHz * 8 (AVX) * (4 FMA) * 4 コア = 512 GFLOPSです。しかし、最新の Intel IGP (Iris Pro 5100/5200) のピークは800 GFLOPSを超えています。したがって、一部のアルゴリズムは IGP でさらに高速に実行されます。コアと IGP を組み合わせるとさらに効果的です。さらに、IGP はより多くのシリコンを消費し続けます。Iris Pro 5100 は現在、シリコンの 30% 以上を占めています。インテルのデスクトップ・プロセッサーがどちらに向かっているかは明らかです。

しかし、Intel IGP を見た限りでは、OpenCL/OpenGL を除いて、ほとんどのプログラマーは無視されています。OpenCL を使用せずに Intel HD グラフィックス ハードウェア (SGEMM など) をコンピューティング用にプログラムする方法を知りたいです。

コメントを追加: HD グラフィックスと Linux 上の OpenCL に対するインテルのサポートはありません。少なくとも Ivy Bridge HD グラフィックスのサポートを Linux に追加しようとするオープン ソースのbeignetを見つけました。私はそれを試していません。Beignet を開発している人々は、おそらく OpenCL を使用せずに HD グラフィックス ハードウェアをプログラムする方法を知っているでしょう。

4

3 に答える 3

4

ベンダーが低レベルの ISA を使用してプログラミングできるようにすることは、もはや意味がありません。

  1. これは非常に難しく、ほとんどのプログラマーは使用しません。
  2. これにより、将来の改訂で ISA を調整できなくなります。

したがって、プログラマーは言語 (OpenCL の C99 など) を使用し、ランタイムはユーザーのマシン上で ISA 固有の最適化を行います。

これにより何が可能になるかの例: AMD は VLIW ベクター マシンからスカラー マシンに切り替えましたが、既存のカーネルは引き続き実行されました (ほとんどはより高速に実行されました)。ISAを直接書いた場合、これはできませんでした。

于 2013-08-23T00:40:26.607 に答える
4

データをビデオ カードにコピーして元に戻すにはパフォーマンス ヒットがあることに注意してください。これを考慮する必要があります。AMD は、CPU と GPU のメモリを同じダイに統合した APU チップのリリースに近づいています。これは、この問題を軽減するのに大いに役立ちます。

CUDA と OpenCL が登場する前に GPU が使用されていた方法は、DirectX または OpenGL を使用して、操作対象のメモリをテクスチャとして表現することでした。ありがたいことに、もうそれを行う必要はありません。

AMD は実際に APU / OpenCL モデルを推し進めているため、より多くのプログラムが OpenCL 経由で GPU を利用する必要があります (パフォーマンスのトレードオフがある場合)。現在、GPU コンピューティングは、ウェブ ブラウジングやワード プロセッシングには必要のない、ハイ パフォーマンス コンピューティングや数値処理に追いやられているニッチ市場です。

于 2013-08-20T17:07:36.667 に答える