CUDA を使用して、MATLAB で記述されたコードの最適化を試みます。私は最近 CUDA のプログラミングを始めましたが、それがどのように機能するかについての一般的な考えを持っています。
たとえば、2 つの行列を足し合わせたいとします。CUDA では、スレッドを使用して結果行列の各要素の答えを計算するアルゴリズムを作成できました。しかし、この手法はおそらく MATLAB が既に行っている手法と似ているのではないでしょうか? その場合、効率は技術に依存せず、ハードウェア レベルのみに起因するのではないでしょうか。