1

クラスター環境では、特定のサーバーへのチャネルが異常終了し、1 日に頻繁に再開されます。
例: QMGR A にはいくつかの QMGRS(B、C、D、E、F) が接続されています。(それぞれが異なるサーバーにあります)
QMGR B、C、D、E、F からのクラスター受信チャネルが QMGR A で異常終了し、再開します。一日にかなりの頻度で。

QMGR A ログ

    -------------------------------------------------- ------------------------------  
08/04/12 08:44:41 - プロセス (1720412.1165) ユーザー (mqad) プログラム (amqrmppa)  
AMQ9209: ホスト 'HOST.B (139.120.210.19)' への接続が閉じられました。  

説明:  
TCP/IP 経由で「HOST.B (139.120.210.19)」からデータを受信中にエラーが発生しました。  
 リモート ホストへの接続が予期せず終了しました。  
アクション:  
システム管理者に伝えてください。  
----- amqccita.c: 3094 ---------------------------------------- ---------------  
08/04/12 08:44:41 - プロセス (1720412.1165) ユーザー (mqad) プログラム (amqrmppa)  
AMQ9999: チャネル プログラムが異常終了しました。  

説明:  
チャネル プログラム 'CHANNEL.TO.B' が異常終了しました。  
アクション:  
チャネル プログラム 'CHANNEL.TO.B' の以前のエラー メッセージを参照してください。  
エラー ファイルを参照して、失敗の原因を特定します。  
----- amqrccca.c: 777 ---------------------------------------- ----------------  
08/04/12 08:44:41 - プロセス (1720412.1175) ユーザー (mqad) プログラム (amqrmppa)  
AMQ9209: ホスト 'HOST.C (155.10.186.20)' への接続が閉じられました。  

説明:  
TCP/IP 経由で「HOST.C (155.10.186.20)」からデータを受信中にエラーが発生しました。  
リモート ホストへの接続が予期せず終了しました。  
アクション:  
システム管理者に伝えてください。  
----- amqccita.c: 3094 ---------------------------------------- ---------------  
08/04/12 08:44:41 - プロセス (1720412.1175) ユーザー (mqad) プログラム (amqrmppa)  
AMQ9999: チャネル プログラムが異常終了しました。  

説明:  
チャネル プログラム 'CHANNEL.TO.C' が異常終了しました。  
アクション:  
チャネル プログラム 'CHANNEL.TO.C' の以前のエラー メッセージを参照してください。  
エラー ファイルを参照して、失敗の原因を特定します。  
    -------------------------------------------------- ------------------------------  

ホスト B の QMGR ログ

2012/08/04 08:44:09 AM - プロセス (17174.16023) ユーザー (mqad) プログラム (amqrmppa)
AMQ9259: ホスト 'HOST.A' からの接続がタイムアウトしました。

説明:
ホスト 'HOST.A' からの TCP/IP 経由の接続がタイムアウトしました。
アクション:
予期した時間内にデータが受信されなかった理由を確認してください。修正
問題。チャネルを再接続するか、再試行中のチャネルが再接続するのを待ちます
自体。
----- amqccita.c: 3546 ---------------------------------------- ---------------
2012/08/04 08:44:09 AM - プロセス (17174.16023) ユーザー (mqad) プログラム (amqrmppa)
AMQ9999: チャネル プログラムが異常終了しました。

説明:
チャネル プログラム 'CHANNEL.TO.B' が異常終了しました。
アクション:
チャネル プログラム 'CHANNEL.TO.B' の以前のエラー メッセージを参照してください。
エラー ファイルを参照して、失敗の原因を特定します。


ホスト C の QMGR ログ

-------------------------------------------------- ------------------------------
08/04/12 08:44:35 - プロセス (462890.4658) ユーザー (mqad) プログラム (amqrmppa)
AMQ9259: ホスト 'HOST.A' からの接続がタイムアウトしました。

説明:
ホスト 'HOST.A' からの TCP/IP 経由の接続がタイムアウトしました。
アクション:
予期した時間内にデータが受信されなかった理由を確認してください。修正
問題。チャネルを再接続するか、再試行中のチャネルが再接続するのを待ちます
自体。
----- amqccita.c: 3341 ---------------------------------------- ---------------
08/04/12 08:44:35 - プロセス (462890.4658) ユーザー (mqad) プログラム (amqrmppa)
AMQ9999: チャネル プログラムが異常終了しました。

説明:
チャネル プログラム 'CHANNEL.TO.C' が異常終了しました。
アクション:
チャネル プログラム 'CHANNEL.TO.C' の以前のエラー メッセージを参照してください。
エラー ファイルを参照して、失敗の原因を特定します。
----- amqrmrsa.c: 468 ---------------------------------------- ----------------

私はこれを引き起こしているものを理解しようとしています?? キュー マネージャ A が多くの接続で過負荷になっている場合に発生しますか?? qmgr ログに TCP/IP エラー コードが記録されていません。

4

1 に答える 1

4

MQ の V7.1 より前のバージョンを実行しているように見えますか? MQ V7.1 では、そのエラー メッセージは以下から更新されました。

AMQ9259: Connection timed out from host 'HOST.A'.

EXPLANATION:
A connection from host 'HOST.A' over TCP/IP timed out.
ACTION:
Check to see why data was not received in the expected time. Correct the
problem. Reconnect the channel, or wait for a retrying channel to reconnect
itself.

AMQ9259: Connection timed out from host 'HOST.A'.

EXPLANATION:
A connection from host 'HOST.A' over TCP/IP timed out.
ACTION:
The select() [TIMEOUT] 60 seconds call timed out. Check to see why data was
not received in the expected time. Correct the problem. Reconnect the channel,
or wait for a retrying channel to reconnect itself.

例として。AMQ9259 エラー メッセージの原因として最も可能性が高いのは、受信タイムアウトの設定により、チャネルが受信から飛び出し、チャネルが閉じられたことです。qm.ini ファイルの受信タイムアウト設定を見直して、ハートビート間隔よりも短い値に設定されていないかどうかを確認することをお勧めします。

チャネルには再試行間隔が定義されているため、チャネルは自動的に再始動します。これはいい!

于 2014-09-15T12:36:23.183 に答える