ログをローカルの splunk インストールにプッシュしています。最近、次のエラーが頻繁に繰り返されることがわかりました (毎分約 1 回)。
エラー L10 (出力バッファー オーバーフロー): 2013-06-26T19:19:52+00:00.134 <13>1 2013-07-08T14:59:47.162084+00:00 ホスト アプリ web.1 - [\ x1B[37minfo\x1B[0m] アプリケーション - パフォーマンス - 行 ID のフェッチに 31 ミリ秒かかりました...
エラーは非常に頻繁に繰り返され、ドキュメントでは、アプリケーションが大量のログを生成するときにこれらのエラーが発生すると言われています。
実際には、1 秒あたり 20 ~ 30 個のログがほとんどありませんが、これはあまり考慮されていません。他のドレーン (組み込みの papertrail プラグインを追加) でテストしましたが、これらのエラーはそこでは発生しません。したがって、これらのエラーは発信 Splunk ドレーンに固有のものです。
splunk マシンがロードされているため、ログを十分に高速に受け入れていない可能性があると思いましたが、その CPU はアイドル状態であり、十分なディスクとメモリがあります。
また、アプリ (Play 2 アプリ) は常にログをコンソールに自動フラッシュしていると思います。そのため、フラッシュされていないログが大量に蓄積されてからリリースされることはありません。
発信 Splunk ドレーンのドレーン速度が遅い原因は何ですか? どのようにデバッグすればよいですか?