データをCudaに送信して処理するプロセスがあり、特定の基準に一致するデータを出力します。問題は、出力された配列のサイズがわからないことが多いことです。私に何ができる?
数百行のデータを送信し、Cuda で 2 万以上の方法で処理します。結果が私が持っているいくつかのルールと一致する場合、結果を保存したいと思います。問題は、Cudaでリンクリストを作成できないことです(できるかどうか教えてください)、カードのメモリが小さいため、ゼロコピーを使用してCudaにホストメモリに直接書き込むことを考えていました. これでメモリ サイズの問題は解決しますが、unknown に対処する方法はまだありません。
私の最初のアイデアは、可能な最大の結果を把握し、そのサイズの配列をmallocすることでした。問題は、それが巨大になり、ほとんどが使用されないことです (800 行のデータ * 20K の可能な結果 = 配列内の 1600 万のアイテム..これはありそうにありません)。
Cudaで可変サイズの配列を処理するより良い方法はありますか? 私はプログラミングに慣れていないので、理想的にはそれほど複雑ではないものになるでしょう(ただし、そうであれば、喜んで学びます)。