2

メモリ駆動型の大規模プログラム(数十ギガバイトのメモリ)について、Linuxでパフォーマンス分析を行っています。

そのような大規模なプログラムを実行するのにより適したものになるように linux/hardware を構成することが可能かどうかを考えています。しかし、私はこの面に精通していません。

誰でも設定方法についてポイントがあります

  1. OSのメモリ割り当て戦略
  2. CPU のキャッシュ構成
  3. そうしないと...

どんなコメントでも大歓迎です..

これは典型的な CPU モデルです (4 つの Opteron プロセッサがそれぞれデュアル コアを備えています)。

processor       : 3
vendor_id       : AuthenticAMD
cpu family      : 15
model           : 65
model name      : Dual-Core AMD Opteron(tm) Processor 2218
stepping        : 2
cpu MHz         : 2600.000
cache size      : 1024 KB
physical id     : 1
siblings        : 2
core id         : 1
cpu cores       : 2
fpu             : yes
fpu_exception   : yes
cpuid level     : 1
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt rdtscp lm 3dnowext 3dnow pni cx16 lahf_lm cmp_legacy svm extapic cr8_legacy
bogomips        : 5200.09
TLB size        : 1088 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 40 bits physical, 48 bits virtual
power management: ts fid vid ttp tm stc
4

1 に答える 1

0

マルチソケットシステムでのメモリ/キャッシングの調査に役立ちます。

  • hwloclstopo):

    lstopo
    
  • numactl / libnuma(ただし、実際にNUMAシステムである場合のみ)

    numactl --hardware
    numactl --show
    
  • sysfsprocfs

    sudo grep . /sys/devices/system/cpu/cpu*/cpufreq/*
    grep . /sys/devices/system/cpu/cpu*/topology/physical_package_id
    sudo grep . /proc/irq/*/smp_affinity # compare w/ /proc/interrupts
    
于 2011-11-02T18:55:43.030 に答える