ここが質問するのに適切な場所かどうかは本当にわかりません。さまざまな種類のハードウェアのさまざまなプログラミング モデルに興味があります。
このように始まります。NVIDIA CUDA で行っていたいくつかの作業を紹介していました。GPU をコプロセッサーとして使用する際の主な問題の 1 つは、ホストと GPU の間でデータを転送する必要があるという事実です。その後、何人かの人々が AMD の「APU」と、グラフィックス コアが通常の CPU コアと同じダイ上にあるという事実について私に質問し始めました。
Intel/AMD CPU+GPU チップには、専用の NVIDIA カードほど多くのグラフィックス コアが搭載されることはないことを指摘して、質問をかわしました。
問題は、AMD APU や Intel Sandy/Ivy Bridge チップのプログラミング モデルがどのようなものか、よくわかりません。
私の質問は次のとおりです。
- AMD/Intel チップのグラフィックス コアを利用するために、プログラムはどのように作成されますか?
- これらのグラフィックス コアは本当にホスト メモリに直接アクセスできますか?
- SP および DP FLOPS で、これらのチップのパフォーマンスの種類に関する情報はありますか?
- CUDA から来て、NVIDIA GPU のプログラミングと問題の他のチップとの間にどのような類似点がありますか?
- Cell プロセッサの SPE はどのようにメモリにアクセスしたのか、またはそのプログラミング モデルは現在の Intel/AMD チップと比べてどうだったのでしょうか?