ここ数日でこの問題が発生し始めました。Ganglia gemtad プロセスが SIGSEGV (segfault) で開始から 5 分以内に終了する
これはここ数か月から安定していたので、何が変わったのかわかりません。
Version - gmetad 3.7.1
/var/log/messagesまたは/var/log/secure のどちらにも、コア ダンプや gmetad に固有のものは見当たりません。
今回のイベント時のシステムスナップ(上から)
load average: 1.97, 0.99, 0.42
メモリーも結構良さそう
free -m
total used free shared buffers cached
Mem: 7989 3624 4364 0 333 2562
-/+ buffers/cache: 728 7260
Swap: 4095 0 4095
gmetadをフォークして監視するスーパーバイオードプロセスがあります-
ここにスーパーバイザーのログがあります
2016-10-20 14:34:55,707 INFO exited: gmetad (terminated by SIGSEGV; not expected)
2016-10-20 14:34:55,707 INFO received SIGCLD indicating a child quit
2016-10-20 14:34:57,712 INFO spawned: 'gmetad' with pid 24561
2016-10-20 14:34:59,929 INFO exited: gmetad (terminated by SIGSEGV; not expected)
2016-10-20 14:34:59,929 INFO received SIGCLD indicating a child quit
2016-10-20 14:35:02,932 INFO spawned: 'gmetad' with pid 24593
2016-10-20 14:35:04,897 INFO exited: gmetad (terminated by SIGSEGV; not expected)
2016-10-20 14:35:04,897 INFO received SIGCLD indicating a child quit
2016-10-20 14:35:08,903 INFO spawned: 'gmetad' with pid 24618
2016-10-20 14:35:11,257 INFO exited: gmetad (terminated by SIGSEGV; not expected)
2016-10-20 14:35:11,257 INFO received SIGCLD indicating a child quit
2016-10-20 14:35:12,257 INFO gave up: gmetad entered FATAL state, too many start retries too quickly
特に gmetad でこの種の問題に直面した人はいますか? ポインタに感謝します。