8

PDF/Word ドキュメントのインデックス作成を開始したばかりですが、一部のドキュメントはかなり大きくなる可能性があります。さらに悪いことに、私はインデックス アナライザーで n-gram を使用しています。私はElasticSearch専用の8GBのRAMを持っていますが、私たちのインデックスは現在約45GBの大きさです(ドキュメントなしでは約6GBしかありませんでした)。これが私の問題につながります...

インデックスにドキュメントを追加した後、すべてのインデックスの再作成に時間がかかり始めましたが、これは予想されることですが、一般的なタイムアウト エラーでランダムに失敗するようにもなりました。デフォルトのタイムアウトが 10 秒の http クライアント (HTTParty ruby​​ gem) に問題があることを突き止めました。私はそれを 480 秒に増やし、再インデックスはより多くのドキュメントを取得しますが、それでも最終的にはタイムアウトします。

私の質問は、

  1. Elasticsearch がインデックス リクエストに応答するのにそんなに時間がかかるのでしょうか?
  2. 問題を解決するにはどうすればよいですか?
4

0 に答える 0