永続的な GPU 関数を記述できるかどうか疑問に思っています。疑問がありますが、スケジューラーがどのように機能するかわかりません。
不明な数のデータ ポイント (約 5000 万) を処理しようとしています。データは 20 程度のチャンクで到着します。これらの 20 ポイントを GPU の「バケット」にドロップし、この「永続的な」操作でそれらを取得して処理できるようにするとよいでしょう。完了したら、結果を取得します。
バケットが空の間、GPU をダミー データでビジー状態に保つことができます。しかし、部分的に空のバケットでの競合状態が問題になると思います。
この永続的な操作が実行されている間、GPU で他の操作を実行することはできないと思います。つまり、他の専用でない SM を機能させます。
これは実行可能な (fermi) GPU アプローチですか、それとも単に悪い考えですか?