ここの初心者。ハイ パフォーマンス コンピューティングで実行する必要がある大きな有限解析コードがあります。人々は、Intel コンパイラーの方が通常は速度が速いと言い続けます (以前は gcc を使用していました)。そして、私たちの Intel クラスターにも当てはまることがわかりました。しかし最近、新しい AMD クラスターができました。icpc
のコンパイル オプションを使用してプログラムを最適化する方法について混乱しています。
基本的に、2 つの質問があります。
質問 1
AMDチップを搭載したクラスターは次のとおりです。
processor : 63
vendor_id : AuthenticAMD
cpu family : 21
model : 2
model name : AMD Opteron(tm) Processor 6378
stepping : 0
cpu MHz : 2399.837
cache size : 2048 KB
physical id : 2
siblings : 16
core id : 7
cpu cores : 8
apicid : 79
initial apicid : 79
fpu : yes
fpu_exception : yes
cpuid level : 13
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nonstop_tsc extd_apicid amd_dcm aperfmperf pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 popcnt aes xsave avx f16c lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs xop skinit wdt lwp fma4 nodeid_msr tbm topoext perfctr_core cpb npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold
bogomips : 4799.73
TLB size : 1536 4K pages
clflush size : 64
cache_alignment : 64
address sizes : 48 bits physical, 48 bits virtual
power management: ts ttp tm 100mhzsteps hwpstate [9] [10]
を使用して小さなコードをコンパイルするときicpc hello.cpp -O3 -xP
、どのオプションを使用すればよいか正確にわかりません。エラーは次のとおりです。
$ /usr/bin/time -p ./a.out
Fatal Error: This program was not built to run on the processor in your system.
The allowed processors are: Intel(R) Pentium(R) 4 and compatible Intel processors with Intel(R) Streaming SIMD Extensions 3 (Intel(R) SSE3) instruction support.
real 0.00
user 0.00
sys 0.00
質問2
Intel チップ クラスタと AMD チップ クラスタの両方でバイナリを使用したい場合、コードをコンパイルするために別のオプションを使用する必要がありますか?