nVidia Geforce で多数 (数千) の小さな最適化ジョブを実行しようとしています。
小さなジョブとは、3 ~ 6 次元で、それぞれ約 1000 データ ポイントが入力されることを意味します。基本的には曲線フィッティングを目的としているため、最小化する目的関数は、連続 (自明ではない) 分析関数の二乗和であり、その一次導関数を分析的に計算できます。各次元は、下限と上限の間に制限されます。
これらのジョブの唯一の共通点は、異なる 1000 個のデータ ポイントを取得する元のデータ シリーズです。
これは、CPU で 1 つずつ実行することで、GPU で現在よりもはるかに高速になると思われるため、リアルタイムの監視に使用できます。
ただし、私が見た GPU ライブラリは、GPU で (より高速に) 単一の関数評価を計算することにのみ焦点を当てています。
nvidia CUDA フォーラムで私の特定の質問に関するスレッドがあり、より多くのユーザーがこれを探していましたが、フォーラムはしばらくの間ダウンしています。既存の C ライブラリ (例: levmar) を CUDA 言語に移植することについて言及していましたが、これは失われました...
GPU で多くの最適化を並行して実行する既存のライブラリを知っていますか?
ありがとう!