1

elasticsearch には、ドキュメントを送信するための API がいくつかあります (http、thrift、memcached)。使用されるリソースの観点から、文書を提出する最も効率的な方法は何ですか?

私のユースケースでは、かなり集中的なドキュメントの流れが発生しようとしています。また、(PUT を実行する代わりに) ファイルをマルチパート形式にパックすることは、一種のリソース浪費です。AFAIK thrift は、すべてのファイルを再処理して、thrift transport にパックします。memcached のような API の方が効率的でしょうか?

4

1 に答える 1

0

それはあなたのケースに依存します。少なくとも 2 つの方法があります。

  1. 検索バックエンドの前にドキュメント抽出を行います。次に、HTTP PUT を実行します。トラフィックを節約します。

  2. データ転送をさまざまなメカニズム (NFS/HTTP PUT/FTP など) にアウトソーシングできます。データが配信された後、 FS Riverでインポートできます。

于 2013-06-20T23:45:31.420 に答える