最後に問題が何であるかを見つけました。RHEL 5.4では、sem_initを呼び出してsem_timedwaitを実行すると、コードの場所、sem_tを所有するオブジェクトがヒープ上にあるかスタック上にあるかなどに応じて、時間指定待機の動作がややランダムになります。時間指定待機がすぐに返される場合があります。 errno = 38(ENOSYS)の場合、戻る前に正しく待機することがあります。
valgrindを介して実行すると、次のエラーが発生します。
==32459== Thread 2:
==32459== Syscall param futex(op) contains uninitialised byte(s)
==32459== at 0x406C78: sem_timedwait (in /lib/libpthread-2.5.so)
==32459== by 0x8049F2E: TestThread::Run() (in /home/stsadm/semaphore_test/semaphore_test)
==32459== by 0x44B2307: nxThread::_ThreadProc(void*) (in /home/stsadm/semaphore_test/libcore.so)
==32459== by 0x4005AA: start_thread (in /lib/libpthread-2.5.so)
==32459== by 0x355CFD: clone (in /lib/libc-2.5.so)
RHEL 5.2でまったく同じコードを実行すると、問題は解決し、valgrindはエラーを報告しません。
sem_initを呼び出す前にsem_t変数でmemsetを実行すると、RHEL5.4で問題が解決します。
memset( &_semaphore, 0, sizeof( sem_t ) );
そのため、RHEL5.4または内部で使用されるセマフォにバグが導入されたようであり、sem_initがsem_tメモリを正しく初期化していないようです。または、sem_timed waitが、以前とは異なる方法でこれに敏感になるように変更されました。
興味深いことに、sem_initが機能しなかったことを示すエラーを返すことはありません。
あるいは、予想される動作がsem_initがsem_tのメモリを初期化せず、それが呼び出し元次第である場合、動作はRHEL5.4で確実に変更されています。
pxb
更新-他の誰かが試してみたい場合のテストケースコードは次のとおりです。この問題は、sem_timedwaitが.soから呼び出され、RHEL5.4(5.3ではテストされていない可能性があります)のみ、および32ビットバイナリ(もちろん32ビットライブラリに対してリンク)としてビルドされた場合にのみ発生することに注意してください。
1)semtest.cpp内
#include <semaphore.h>
#include <stdio.h>
#include <string.h>
#include <errno.h>
#include <time.h>
void semtest( int semnum, bool initmem )
{
sem_t sem;
if ( initmem )
{
memset( &sem, 0, sizeof( sem_t ) );
printf( "sem %d: memset size = %d\n", semnum, sizeof( sem_t ) );
}
errno = 0;
int res = sem_init( &sem, 0, 0 );
printf( "sem %d: sem_init res = %d, errno = %d\n", semnum, res, errno );
timespec ts;
clock_gettime( CLOCK_REALTIME, &ts );
ts.tv_sec += 1;
errno = 0;
res = sem_timedwait( &sem, &ts );
printf( "sem %d: sem_timedwait res = %d, errno = %d\n\n", semnum, res, errno );
}
2)main.cpp内(.so内からの実行とexe内からの実行を比較できるように重複テスト関数に注意してください)
#include <semaphore.h>
#include <stdio.h>
#include <string.h>
#include <errno.h>
#include <time.h>
extern void semtest( int semnum, bool initmem );
void semtest_in_exe( int semnum, bool initmem )
{
sem_t sem;
if ( initmem )
{
memset( &sem, 0, sizeof( sem_t ) );
printf( "sem %d: memset size = %d\n", semnum, sizeof( sem_t ) );
}
errno = 0;
int res = sem_init( &sem, 0, 0 );
printf( "sem %d: sem_init res = %d, errno = %d\n", semnum, res, errno );
timespec ts;
clock_gettime( CLOCK_REALTIME, &ts );
ts.tv_sec += 1;
errno = 0;
res = sem_timedwait( &sem, &ts );
printf( "sem %d: sem_timedwait res = %d, errno = %d\n\n", semnum, res, errno );
}
int main(int argc, char* argv[], char** envp)
{
semtest( 1, false );
semtest( 2, true );
semtest_in_exe( 3, false );
semtest_in_exe( 4, true );
}
3)これがMakefileです
all: main
semtest.o: semtest.cpp
gcc -c -fpic -m32 -I /usr/include/c++/4.1.2 -I /usr/include/c++/4.1.2/i386-redhat-linux semtest.cpp -o semtest.o
libsemtest.so: semtest.o
gcc -shared -m32 -fpic -lstdc++ -lrt semtest.o -o libsemtest.so
main: libsemtest.so
gcc -m32 -L . -lsemtest main.cpp -o semtest
テストケースは次のとおりです。
- memsetを実行せずに.so内から実行
- .so内から実行し、memsetを実行します
- memsetを実行せずにexeファイル内から実行
- exe内から実行し、memsetを実行します
そして、これがRHEL5.4で実行された結果です
sem 1: sem_init res = 0, errno = 0
sem 1: sem_timedwait res = -1, errno = 38
sem 2: memset size = 16
sem 2: sem_init res = 0, errno = 0
sem 2: sem_timedwait res = -1, errno = 110
sem 3: sem_init res = 0, errno = 0
sem 3: sem_timedwait res = -1, errno = 110
sem 4: memset size = 16
sem 4: sem_init res = 0, errno = 0
sem 4: sem_timedwait res = -1, errno = 110
ケース1がerrno=38ですぐに戻ることがわかります。
RHEL5.2でまったく同じコードを実行すると、次のようになります。
sem 1: sem_init res = 0, errno = 0
sem 1: sem_timedwait res = -1, errno = 110
sem 2: memset size = 16
sem 2: sem_init res = 0, errno = 0
sem 2: sem_timedwait res = -1, errno = 110
sem 3: sem_init res = 0, errno = 0
sem 3: sem_timedwait res = -1, errno = 110
sem 4: memset size = 16
sem 4: sem_init res = 0, errno = 0
sem 4: sem_timedwait res = -1, errno = 110
すべてのケースが期待どおりに機能することがわかります。