問題タブ [apache-crunch]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

51 問題

0 投票する

3 に答える

738 参照

java - "の起源をたどる方法()V" Avro で失敗？

apache crunch を使用していますが、Avro から不可解なエラーメッセージが表示されます。

「init()V」エラーの意味は何ですか? 具体的には、クランチでもこの問題を修正したいと思います。これは、ジョブに Maprece パイプラインオプションを使用する場合にのみ発生しますが、MemPipeline を使用すると発生することはありません。

2014-01-06T14:15:33.687

0 投票する

2 に答える

1378 参照

java - Apache Crunch で、PCollection または PTable に要素が含まれているかどうかを調べる方法は? もしそうなら、いくつですか？

ブレークポイントを設定して、ウォッチウィンドウで次の操作を実行しようとしました。.materialize() を使用して、Java オブジェクトを確認できるかどうかを確認します。

.getSize() は 0 より大きい数値を示しますが、それが PTable に要素があることを示しているかどうかは疑問です。.materialize() には、要素の存在を示すものは何も表示されませんでした。

前もって感謝します。

java hadoop collections mapreduce apache-crunch

2014-08-25T19:48:29.017

0 投票する

1 に答える

482 参照

hadoop - Hive パーティションを Apache Crunch パイプラインに読み込む方法は?

hdfs のテキストファイルを apache crunch パイプラインに読み込むことができます。しかし今、ハイブパーティションを読み取る必要があります。問題は、私たちの設計によると、ファイルに直接アクセスすることは想定されていないことです。したがって、HCatalog などを使用してパーティションにアクセスできる方法が必要です。

hadoop hive pipeline hcatalog apache-crunch

2014-10-20T08:20:10.097

0 投票する

1 に答える

482 参照

java - HBase Standalone への Apache Crunch を使用した WordCount

現在、Apache Crunch を評価しています。簡単なWordCount MapReduce ジョブの例に従いました。その後、結果をスタンドアロンの HBase に保存しようとしました。ここで説明されているように、HBase が実行されています (jps および HBase シェルでチェック): http://hbase.apache.org/book/quickstart.html

ここで、HBase への書き込みの例を採用します。

「例外:java.lang.illegalArgumentException: HBaseTarget は Put と Delete のみをサポートしています」という例外が発生します。

何が悪かったのか手がかりはありますか？

java hadoop mapreduce hbase apache-crunch

2014-12-17T14:57:15.990

0 投票する

2 に答える

3326 参照

hive - スキーマのない avro ファイル用のハイブテーブルを作成する

複数の avro ファイルがあり、各ファイルには STRING が含まれています。各 avro ファイルは 1 つの行です。単一のディレクトリにあるすべての avro ファイルを消費するハイブテーブルを作成するにはどうすればよいですか。各ファイルには大きな番号が含まれているため、関連付けることができる json の種類のスキーマもありません。schema less と言うのは間違っているかもしれません。しかし、ハイブがこのデータを理解する方法が見つかりません。これは非常に単純かもしれませんが、成功せずにさまざまな方法を試したので迷っています。json スキーマを avro uri として指すテーブルを作成しましたが、ここではそうではありません。より多くのコンテキストファイルについては、crunch api を使用して書き込まれました

テーブルを作成するがデータを正しく読み取らない次のクエリを試しました

hive avro apache-crunch

2015-01-23T04:34:03.340

0 投票する

1 に答える

464 参照

java - Hadoop InputFormat はキーを入力ファイルパスに設定します

私の Hadoop ジョブは、各レコードの派生元である入力パスを認識する必要があります。

たとえば、S3 オブジェクトのコレクションに対してジョブを実行しているとします。

などのキーと値のペアを減らしたい

org.apache.hadoop.mapreduce.InputFormatこれを達成する拡張機能はありますか？または、カスタム入力形式を使用するよりも良い方法はありますか?

MapContextマッパーでは、この情報は( Hadoop プログラムのマッパーで入力ファイル名を取得する方法は? )からアクセスできることは知っていますが、Apache Crunch を使用していて、ステップのいずれかが Maps になるか Reduces になるかを制御できません。ただし、InputFormat を確実に制御できるので、これを行う場所のように思えました。

java hadoop apache-crunch

2015-03-05T19:43:00.693

1 2 3 4 5 6 7 8 9 10

問題タブ [apache-crunch]

java - "の起源をたどる方法()V" Avro で失敗？

java - Apache Crunch で、PCollection または PTable に要素が含まれているかどうかを調べる方法は? もしそうなら、いくつですか？

hadoop - Hive パーティションを Apache Crunch パイプラインに読み込む方法は?

java - HBase Standalone への Apache Crunch を使用した WordCount

hive - スキーマのない avro ファイル用のハイブ テーブルを作成する

java - Hadoop InputFormat はキーを入力ファイル パスに設定します

Reference

hive - スキーマのない avro ファイル用のハイブテーブルを作成する

java - Hadoop InputFormat はキーを入力ファイルパスに設定します