0

GPU と CPU の FLOP をカウントしようとしていますが、ここからソースを入手しました

名前を cudaflops.cu に変更し、この makefile でコンパイルしました

################################################################################
#
# Build script for project
#
################################################################################

# Add source files here 
EXECUTABLE  := benchmark
# Cuda source files (compiled with cudacc) 
CUFILES     := cudaflops.cu
# C/C++ source files (compiled with gcc / c++) 
CCFILES     := 


################################################################################
# Rules and targets

include ../../common/common.mk

#########################################

Tt は正常に動作し、結果として 367 GFIOPS が得られます

しかし今、私はこのソースを CPU でテストする方法を知りません。これを読んで、ソースは CPU 上で実行できると書かれていました。

では、修正されたメイクファイルはどのようにそれを行うのでしょうか??

4

1 に答える 1

0

x86 でコードを実行するには、ポートランド グループ コンパイラが必要です: hxxp://www.prnewswire.com/news-releases/pgi-to-develop-compiler-based-on-nvidia-cuda-c -architecture-for-x86-platforms-103457159.html

さらに、その記事では、コンパイラのデモンストレーションが 2010 年 11 月 13 ~ 15 日に行われると述べているため、いつ公開されるかはわかりません (おそらくベータ版が出回っています)。(つまり、x86 で CUDA をネイティブに実行することはまだできません)。

現時点で最も簡単なのは、そのベンチマークとまったく同じことを行う C/C++ 関数を作成することです (移植は非常に簡単なはずです)。SDK には、CPU と GPU を比較する CUDA の例がいくつかあります (行列の乗算を見てください)。最初にそれを試してください (「実世界」の場合を除いて、基本的にベンチマーク コードとまったく同じことを行う必要があります)。 GPU/CPU のパフォーマンスを求めているだけです。

さらに簡単: NVIDIA フォーラムにあなたのグラフィックス カードについて尋ねてみてください。NVIDIA フォーラムは、GPU と CPU のパフォーマンスを比較するのが大好きです (「私は x GPU を持っていて、私は y GFLOPS を持っています。他の人は GPU と CPU を比較して何を得ていますか?」と言ってください)。

于 2010-10-22T13:19:15.300 に答える