問題タブ [cloudera-quickstart-vm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
627 参照

hadoop - 特定のフォルダーで変更が発生した場合、OOZIE ジョブをスケジュールする方法は?

フォルダー ie に基づいて oozie ジョブをスケジュールしたい

HDFS の場所にフォルダーがあり、毎日 1 つのファイルが date.txt (exp :20160802.txt) の形式でそのフォルダーに追加されます。

そのフォルダーに新しいファイルが追加された場合は、OOZIE バッチをスケジュールします。

これについて私を助けてください、私のユースケースシナリオでどのようにスケジュールできますか。

前もって感謝します。

0 投票する
3 に答える
5814 参照

hadoop - テーブルに主キーがあるにもかかわらず、インポート中に Sqoop --split-by エラーが発生する

dept_id を主キーとする MySQL テーブル

Sqoop クエリ

コンソールでのエラーの結果:

クエリ結果を並行してインポートする場合は、次を指定する必要があります--split-by

---質問ポイント!---
テーブルには主キーがあり、分割は 2 つのマッパー間で均等に分散できますが、--spit-byまたは-m 1の必要性は何ですか??

同じように私を導いてください。
ありがとう。

0 投票する
1 に答える
143 参照

apache-spark - Cloudera Quickstart 5.7 を使用した Apache Spark GraphX

この Web サイトから Cloudera Quickstart 5.7 を使用して Spark GraphX を使用しようとしています: http://kukuruku.co/hub/algorithms/social-network-analysis-spark-graphx

私が行った手順: 1) ターミナルを開く 2) 実行spark-shell 3) 実行import org.apache.spark.graphx._

このコードを送信すると、次のエラーが表示されます。

このエラーを返すために私が見逃しているものについて誰か考えがありますか?

ありがとう!

0 投票する
2 に答える
610 参照

amazon-web-services - AWS 認証情報のセットアップ - Cloudera クイックスタート Docker コンテナ

Cloudera の Quickstart Docker コンテナーを使用して、単純な Hadoop/Hive ジョブをテストしようとしています。S3 のデータに対してジョブを実行できるようにしたいのですが、これまでのところ問題があります。

以下のプロパティを core-site.xml、hive-site.xml、hdfs-site.xml に追加しました。

とにかく、Hive で S3 の場所を指す外部テーブルを作成しようとすると、次のエラーが発生します。

0 投票する
1 に答える
2159 参照

hadoop - Sqoop export inserting duplicate entries

I am trying to understand how sqoop export works.I have a table site in mysql which contains two columns id and url and contains two rows

The table has no primary key

When i am exporting the entries from HDFS to mysql site table by executing below command its inserting duplicate entries

I have below entries in HDFS

sqoop export --table site --connect jdbc:mysql://localhost/loudacre -- username training --password training --export-dir /site/ --update-mode allowinsert --update-key id

So instead of updating already existing id its inserting duplicate id again (meaning two 1 , 1 for www.one.com and 1 for www.yahoo.com)

even if I remove the --update-key the outcome is same.Does its happening because the table doesn't have primary key

I am using sqoop 1.4.5 in Cloudera quickstart VM

Any help ?

0 投票する
1 に答える
379 参照

cloudera - Cloudera クイックスタートのドメイン名を変更する

Cloudera Quick start VM をローカル サーバーにインストールし、ローカル マシンからアクセスしています。使用しているドメイン名はquickstart.cloudera. そのため、リモート アクセスの場合は、毎回手動でローカル IP アドレスに変更する必要があります。この設定をどこで編集して、そこに自分の IP を与えることができますか?

0 投票する
1 に答える
847 参照

cloudera - Cloudera Quickstart VM へのノードの追加

Cloudera Quickstart VM がインストールされており、単一ノードです。マルチノードを追加してクラスターとして作成するにはどうすればよいですか? 私は現在 Virtualboax を使用しており、ベースのクイックスタート VM のクローンを作成してから、それをネットワーク化し、Cloudera マネージャーの [クラスターの追加] ウィザードを使用しようとしました。しかし、それは失敗しています。複数のノードを追加する方法を知っている人はいますか?