0

私のテストソースは次のとおりです。

volatile int gl = 0;

void * InternalHandler( void * param )
{
  for ( int i = 0; i < 100000; ++i ) { ++gl; }
  return 0;
}

int main()
{
  pthread_t ths[100] = { 0 };
  for ( int i = 0; i < 100; ++i)
  {
    pthread_create( &ths[ i ], 0, InternalHandler, 0 );
  }
  for ( int i = 0; i < 100; ++i)
  {
    pthread_join( ths[ i ], 0 );
  }
  std::cout << gl << std::endl;
  return 0;
}

このコードを Debian で (VirtualBox 経由で) コンパイルして実行すると、毎回正確に 10000000 になりますが、競合状態でなければなりません。

uname -a:

Linux debian-dev 3.2.0-4-amd64 #1 SMP Debian 3.2.46-1 x86_64 GNU/Linux

gcc -v:

Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/4.7/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Debian 4.7.2-5' --with-bugurl=file:///usr/share/doc/gcc-4.7/README.Bugs --enable-languages=c,c++,go,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-4.7 --enable-shared --enable-linker-build-id --with-system-zlib --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --with-gxx-include-dir=/usr/include/c++/4.7 --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --enable-gnu-unique-object --enable-plugin --enable-objc-gc --with-arch-32=i586 --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 4.7.2 (Debian 4.7.2-5)

他のいくつかのシステムでは、異なる結果が得られます。競合状態はその仕事をします。しかし、私の仮想 Debian では、「暗黙のアトミック」です。なぜでしょうか?

4

1 に答える 1

4

間違いなくデータ競合があります。

仮想マシンが単一のコアしか使用していないため、おそらく表示されません。また、単一の CPU 命令を使用してインクリメントを実行するアーキテクチャで実行されています (つまり、途中でタスク スイッチが発生することはありません)。

マルチコア マシン、またはメモリ内の値を直接変更するための CPU 命令を持たないアーキテクチャ (ARM など) で実行すると、期待どおりに一貫性のない結果が表示されます。

たとえば、8 コア マシンで実行すると、次のようになります。

$ ./a.out 
1666121
$ ./a.out 
1632606

それを単一のコアに制約しながら、

$ taskset -c 0 ./a.out 
10000000
$ taskset -c 0 ./a.out
10000000

を使用してデータ競合を修正できますstd::atomic<int>。C++11 が利用できない場合は、GCC などのプラットフォーム固有のアトミック操作を使用する__sync_fetch_and_addか、(パフォーマンスへの影響が許容できる場合) 変数をミューテックスで保護します。

于 2013-07-17T13:53:42.287 に答える