sort_by_key
サイズ8000万のキーと値のint配列を使用しています。デバイスは2GB VRAMを搭載したGTX 560 Tiです。sort_by_key の前に使用可能な (空き) メモリが の場合、 でソートを終了します。ただし、使用可能なメモリが に低下すると、同じキーと値の配列の sort_by_key は!1200MB
200ms
600MB
1.5-3s
Compute Visual Profilerの下でプログラムを実行しました。GPU タイムスタンプが、前の最後のカーネルsort_by_key
と内部の最初のカーネル呼び出しsort_by_key
(
RakingReduction
.
sort_by_key
最初の内部カーネルを呼び出す前に、内部でメモリ割り当てが行われていると思われます。必要なメモリsort_by_key
は (利用可能なメモリがであっても600MB
)
利用可能ですsort_by_key
。これが発生すると、コンピューターが 1 秒間フリーズすることがわかります。Process Explorerを開いたままにしておくと、CPU物理メモリグラフにも隆起が見られ
ます。
sort_by_key
使用可能なメモリが少ない場合に、この作業を同じくらい速くするためにできることはありますか? また、メモリ バンプと一時的なフリーズを引き起こしているデバイスとホストの間で何が起こっているのでしょうか?