cuda - 最新の nVIDIA GPU は作業のサブワープスケジューリングを実行しますか?

翻译自：https://stackoverflow.com/questions/48099537 2018-01-04T16:29:39.490

421 次

最近の nVIDIA GPU uarchitectures では、単一のストリーミングマルチプロセッサが 4 つのサブユニットに分割されているようです。それぞれに、整数演算、32 ビットフロップ、64 ビットフロップ、ロード/ストアなど、さまざまな機能単位に対応する 8 つの「正方形」の水平または垂直の「バー」があります。1 つのワープスケジューラが、そのような「クォーター SM」ごとに関連付けられているようです。

現在、CUDA プログラミングモデルでは、各ワープのスレッド (= 32 スレッド) は一緒に命令ロックされています。ただし、実際に作業を実行する場合、たとえばワープの後半または後半のスレッドのみがアクティブな状況では、これらのサブワープを 2 つまたは 3 つのクォーター SM にスケジュールし、残りのクォーターをスケジュールすることはできますか? -SMは他の仕事をしていますか?

cuda - 最新の nVIDIA GPU は作業のサブワープ スケジューリングを実行しますか?

1 に答える 1

Related

Reference

cuda - 最新の nVIDIA GPU は作業のサブワープスケジューリングを実行しますか?