2

2 ノード クラスタ ノード A 、ノード B 。

ノード A で実行されているサービス X、ノード B は DC です。

Pacemaker でスタック corosync を使用しています。失敗タイムアウトは 10 秒です。Target-Role が開始されました。

イベントは次のように発生します ノード A がノード B にイベントを送信します サービス X がダウンしています ノード B が出力します サービス X の期限切れの障害を無視します この後、サービス X はクラスターによって再起動されません。

質問は次のとおりです。

  1. ノード B (DC) が期限切れの障害を無視するのはなぜですか?
  2. この間も DC は無視されましたが、サービス X がダウンしているため、ノード A はサービスを監視し、再び障害ステータスをノード B に送信し、その時点でノード B はサービスを再起動する必要があります。なぜこれが起こらないのですか?
4

2 に答える 2

3

この理由の 1 つは、2 つのサーバー (DC とその他のマシン) 間の時間差である可能性があります。

したがって、DC はこのイベントを古いものと見なし、無視します。時刻を同期してから、問題の再現を試みてください。

于 2017-09-28T18:29:36.153 に答える
1

次のプロパティを crm 構成に追加すると、失敗した期限切れのリソースを開始しようとします。

 start-failure-is-fatal="false"
于 2015-10-05T05:18:59.337 に答える