問題タブ [elasticsearch-curator]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1637 参照

elasticsearch - Elasticsearch クラスターがシャードを未割り当てのままにしている

ロギング用にelasticsearchクラスターを実行しており、logstashを使用して複数の場所からのログにインデックスを付けています。最近、クラスターの拡張用の追加のハードウェアを待っている間、容量を追加するために 2 つのノードを追加しました。最終的には、SSD で実行される「リアルタイム」データ用に 2 つのノードを用意して、最近のデータへの高速アクセスを提供し、古い指標のためにデータを HDD にエージングすることを目指しています。私たちが入れた新しいノードは、既存のボックスよりもはるかに少ないメモリ (700 GB 対 5 TB) でしたが、これは SSD を実装したときの状況と似ているため、大きな問題になるとは予想していませんでした。 .

最初の試みとして、新しいディスク容量ベースの割り当てルールを信頼してノードをクラスターに投入しました。これは、ノードがすぐにいっぱいにならないことを意味します。残念ながら、これは事実ではありませんでした.99% を超えて、クラスターが新しいノードにシャードを陽気に再割り当てしていることに気付きました. 設定を少し調整した後、これらのノードからすべてのデータを削除し、クラスターを以前の状態 (すべてのシャードが割り当てられ、クラスターの状態が緑色) に戻すことができました。

次のアプローチとして、SSD を実装するときの計画と同様に、インデックス/ノードのタグ付けを実装しようとしました。これにより、次の構成が残りました。

  • ノード 1 - 5 TB、タグ: リアルタイム、アーカイブ
  • ノード 2 - 5 TB、タグ: リアルタイム、アーカイブ
  • ノード 3 - 5 TB、タグ: リアルタイム、アーカイブ
  • ノード 4 - 700 GB、タグ: リアルタイム
  • ノード 5 - 700 GB、タグ: リアルタイム

(elasticsearch 1.3.1 および oracle Java 7 u55 を実行しているすべてのノード)

キュレーターを使用して、10 日以上前のインデックスを「アーカイブ」としてタグ付けし、最近のものは「リアルタイム」としてタグ付けしました。これはバックグラウンドで、インデックス シャードの割り当てを "Require" に設定します。私の理解では、ノードにタグが必要ですが、そのタグだけではありません。

残念ながら、これは望ましい効果があったようには見えません。最も心配なのは、アーカイブとしてタグ付けされたインデックスがレプリカ シャードを割り当てておらず、295 個の未割り当てのシャードが残っていることです。さらに、リアルタイムでタグ付けされたインデックスは、ノード 4、5、および奇妙なことに 3 のみを使用しています。ノード 3 には、最新のインデックスといくつかの kibana-int シャードを除いてシャードがありません。

タグを削除し、exclude._ip を使用して新しいノードからシャードをプルすると、(ゆっくりと) クラスターをグリーンに戻すことができます。これは、新しいノードが完全にいっぱいになったときに取ったアプローチだからです。新しいキットが到着したときに SSD 構成が機能することを確信できるように、このセットアップを整理したいと思っています。

私は有効にしようとしました: 私も試しました: cluster.routing.allocation.enable をすべてに有効にしましたが、これも目に見える影響はありませんでした。

私は明らかに間違ったことをしましたか?または、私が使用できる何らかの診断がありますか? Elasticsearch Head プラグインを使用して、シャードの割り当てを視覚化してきました。

簡単に修正できるばかげた間違いであることを願っています。

前もって感謝します

0 投票する
1 に答える
49 参照

elasticsearch - ElasticSearch: インデックス付きアイテムのバッチ全体を置き換える

ElasticSearch を使用してデータ項目のインデックスを作成したいと考えています。これらのアイテムは、(外部ソースから) バッチで毎日更新されます。各バッチは、前日のバッチを置き換えます。新しいバッチが挿入された後、昨日の古いバッチを削除できます。

データ項目はファイルで受信され、スケジュールされたジョブによって解析された後、ElasticSearch に永続化される必要があります。ElasticSearch のみでシンプルに保ち、プロセスに別の DB を追加したくありません。

どのようにしますか?

0 投票する
1 に答える
416 参照

elasticsearch - ElasticSearch からのキュレーターの「アトミック エイリアス移動」でローリング インデックスは可能ですか?

昔、私は独自のプラグイン ' rollindex ' を作成して使用し、ログ データなどの 'ローリング' を処理していました。それからキュレーターを見て、エイリアスを追加および削除できるので、これは良い代替品だと思いました。しかし、どうすればエイリアスをアトミックに移動できますか?

ドキュメントによると、これは可能ではないと思います。ドキュメントは、2 つのインデックスを 1 つのエイリアスに追加し、古いインデックスをエイリアスから削除するパターンを提案しています。ただし、これは、ElasticSearch の制限により、すべての書き込みが一時的に失敗することを意味します。私のrollindexプラグインには、これが起こらないアトミックムーブ(同時に追加+削除)があります。

キュレーターとどうやってこれを行うのですか?

0 投票する
1 に答える
996 参照

elasticsearch - Elasticsearch Marvel は .marvel-2015-* インデックスを最大数に設定します

ちょっと私はmarvel一緒に使用していて、「.marvel-2015-*」のようなクリーンなインデックスをelasticsearch使用しないようにしていますが、これを達成するために使用できる特定の構成または構成のセットがあります。curator

注:ノードをプロビジョニングするためにchefを使用しており、logstashクックブック内でdefault.rbの属性を次のように設定しています

これにより、これらのインデックスの最大数が 14 に設定されると思います。

curatorマーベルとそれ自体を操作するためのツールについて話していることは理解していますmarvelが、これらのツールは初めてなので、これらの点をつなぐ助けが必要です.

理想的には、マーベルにこれらのインデックスを単独で削除するロジックを持たせたいのですが、plugins/marvel/marvel-1.3.1.jar でこれを達成するためのオプションがあるかどうかはわかりません

どんな助けでも大歓迎です。

0 投票する
1 に答える
1434 参照

elasticsearch - Curator を使用した Elasticsearch のスナップショットが失敗する

タイプの名前を持つ ES インデックスのスナップショットを取得し、以下のキュレーターコマンドreincarnation.2015.07.21を使用して Amazon S3 に保存しようとしています。

しかし、私は以下のエラーが発生しています:-

以下に示すように、elasticsearch.yaml に aws キーを追加しました。その後、elasticsearchを再起動しました。

AWS Plugin も ES ノードに追加され、その後ノードを再起動しました。

以下のコマンドを使用してレポを作成しましたが、成功しました

誰か教えてくれませんか

  1. 私が間違っていることは何ですか?
  2. この接続失敗の意味は? キュレーターがelasticsearchに接続できないのか、elasticsearchがS3に接続できないのか? Elasticsearch ログには何も見つかりませんでした。

    • キュレーター バージョン 3.3.0
    • ES バージョン 1.5.1
0 投票する
2 に答える
659 参照

elasticsearch - スナップショットが作成されている間、elasticsearch での削除/作成中の要求タイムアウト

nodejs を使用して Elasticsearch に接続し、curator を使用して 1 時間ごとのスナップショットを作成しています。

スナップショップ操作の実行中に、多くの作成/削除リクエストが 30 秒間待機した後にタイムアウトになりました。さらに深刻な問題は、削除中にリクエストのタイムアウトが発生し、クライアントが削除に失敗したと想定していたが、タイムアウトが発生した後に成功した可能性があることです。これにより、データが破損しました。

また、スナップショットを作成する時間が直線的に増加し続けていることにも気付きました。バックアップが増分プロセスであると主張しているにもかかわらず、6 か月後には 4 分かかります。

次のコマンドを使用してバックアップを取得しました

ありがとうございました