Cloudera CDH 5.3 で管理されている Hadoop クラスターがあります。
マスター マシン (10.44.162.169) に ElasticSearch 1.4.4 がインストールされています。
marvel プラグインをダウンロードしたので、次の方法で ES にアクセスし ます。
後でデータをプッシュするために、mytype という名前のタイプを持つ myindex という名前のセンスを介してインデックスを作成しました。
また、kibana 4 をインストールし、kibana.yml を次のように変更しました。
# The host to bind the server to
host: "10.44.162.169"
# The Elasticsearch instance to use for all your queries.
elasticsearch_url: "http://10.44.162.169:9200"
ポート 5601 (10.44.162.169:5601) 経由でアクセスします
ここで、hdfs にあるデータを ElasticSearch にロードしたいと考えています。
es-hadoop jar をダウンロードしてパスに追加した後。
これが私が進めた方法です:
REGISTER /usr/elasticsearch-hadoop-2.0.2/dist/elasticsearch-hadoop-pig-2.0.2.jar
--load the CDR.csv file
cdr= LOAD '/user/omar/CDR.csv' using PigStorage(';')
AS TRAFFIC_TYPE_ID:int,APPELANT:int,CALLED_NUMBER:int,CALL_DURATION:int,LOCATION_NUMBER:chararray,DATE_HEURE_APPEL:chararray);
STORE cdr INTO 'myindex/mytype' USING org.elasticsearch.hadoop.pig.PigRunner.run('es.nodes'='10.44.162.169');
これを実行すると; 仕事は成功です!!!
しかし、私の ES には何も表示されないようです!
1) marvel にアクセスすると、 myindex にドキュメントが見つかりません!
2)私のKibanaプラグインにもありません!
3) さらに、HUE でログを参照したいのですが、何も見つかりません。
- ES にデータがプッシュされないのはなぜですか?
- 可視化するにはどうすればいいですか?
- 作成したジョブが成功したのに、何が起こっているのかを確認できるログがないのはなぜですか?
何か助けはありますか?ありがとうございました !