大量のデータを必要とするシミュレーション プログラムがあります。計算のために GPU にデータをロードしますが、データには多くの依存関係があります。1 GPU ではデータが足りなかったので、2 GPU にアップグレードしました。ただし、他の GPU にデータが必要な場合は、最初にホストへのコピーが必要であるという制限がありました。
では、GPU ダイレクト P2P を使用する場合、PCI バスは GPU 間のやり取りの多くを処理しますか? デッドロックが発生しませんか?
私はこれが初めてなので、助けと洞察が必要です。