MainProcess がブローカーとの接続を失うと、Celery で奇妙な問題が発生します。Celery は以下のエラーを生成し、100% の CPU を使用し始めます。労働者はまだうまく働き続けます。RabbitMQ が接続がタイムアウトしていると考えていることがわかります。celery 3 にアップデートした後、これらのエラーが頻繁に発生しています。
ノンブロッキングメッセージの消費と関係があると感じていますが、コードの理解が進んでいません。
これらを早期に検出する方法や、セロリが 100% CPU を使用しないようにする方法はありますか?
- セロリ: 3.0.4
- AMQP: 1.0.10
- うさぎ MQ: 2.8.4
RabbitMQ は GMT とセロリの現地時間を報告するため、タイムスタンプは 2 時間ずれています。
セロリエラー
[2013-05-09 18:20:20,204: ERROR/MainProcess] Consumer: Connection to broker lost. Trying to re-establish the connection...
Traceback (most recent call last):
File "/usr/local/lib/python2.7/site-packages/celery/worker/consumer.py", line 369, in start
self.consume_messages()
File "/usr/local/lib/python2.7/site-packages/celery/worker/consumer.py", line 450, in consume_messages
readers[fileno](fileno, event)
File "/usr/local/lib/python2.7/site-packages/kombu/connection.py", line 290, in drain_nowait
self.drain_events(timeout=0)
File "/usr/local/lib/python2.7/site-packages/kombu/connection.py", line 279, in drain_events
return self.transport.drain_events(self.connection, **kwargs)
File "/usr/local/lib/python2.7/site-packages/kombu/transport/pyamqp.py", line 91, in drain_events
return connection.drain_events(**kwargs)
File "/usr/local/lib/python2.7/site-packages/amqp/connection.py", line 266, in drain_events
chanmap, None, timeout=timeout,
File "/usr/local/lib/python2.7/site-packages/amqp/connection.py", line 328, in _wait_multiple
channel, method_sig, args, content = read_timeout(timeout)
File "/usr/local/lib/python2.7/site-packages/amqp/connection.py", line 299, in read_timeout
return self.method_reader.read_method()
File "/usr/local/lib/python2.7/site-packages/amqp/method_framing.py", line 187, in read_method
raise m
IOError: Socket closed
RabbitMQ エラー
=ERROR REPORT==== 9-May-2013::16:20:20 ===
closing AMQP connection <0.1813.0> (192.168.201.104:12809 -> 192.168.201.104:5672):
{timeout,running}