c - CPU FLOPをテストするためにCPUで実行されるようにmakefile CUDAを作成する方法は?

Question

GPU と CPU の FLOP をカウントしようとしていますが、ここからソースを入手しました

名前を cudaflops.cu に変更し、この makefile でコンパイルしました

################################################################################
#
# Build script for project
#
################################################################################

# Add source files here 
EXECUTABLE  := benchmark
# Cuda source files (compiled with cudacc) 
CUFILES     := cudaflops.cu
# C/C++ source files (compiled with gcc / c++) 
CCFILES     := 


################################################################################
# Rules and targets

include ../../common/common.mk

#########################################

Tt は正常に動作し、結果として 367 GFIOPS が得られます

しかし今、私はこのソースを CPU でテストする方法を知りません。これを読んで、ソースは CPU 上で実行できると書かれていました。

では、修正されたメイクファイルはどのようにそれを行うのでしょうか??

score 0 · Accepted Answer

x86 でコードを実行するには、ポートランドグループコンパイラが必要です: hxxp://www.prnewswire.com/news-releases/pgi-to-develop-compiler-based-on-nvidia-cuda-c -architecture-for-x86-platforms-103457159.html

さらに、その記事では、コンパイラのデモンストレーションが 2010 年 11 月 13 ～ 15 日に行われると述べているため、いつ公開されるかはわかりません (おそらくベータ版が出回っています)。(つまり、x86 で CUDA をネイティブに実行することはまだできません)。

現時点で最も簡単なのは、そのベンチマークとまったく同じことを行う C/C++ 関数を作成することです (移植は非常に簡単なはずです)。SDK には、CPU と GPU を比較する CUDA の例がいくつかあります (行列の乗算を見てください)。最初にそれを試してください (「実世界」の場合を除いて、基本的にベンチマークコードとまったく同じことを行う必要があります)。 GPU/CPU のパフォーマンスを求めているだけです。

さらに簡単: NVIDIA フォーラムにあなたのグラフィックスカードについて尋ねてみてください。NVIDIA フォーラムは、GPU と CPU のパフォーマンスを比較するのが大好きです (「私は x GPU を持っていて、私は y GFLOPS を持っています。他の人は GPU と CPU を比較して何を得ていますか?」と言ってください)。

c - CPU FLOPをテストするためにCPUで実行されるようにmakefile CUDAを作成する方法は?

1 に答える 1

Related

Reference