“biginsights”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

3375 参照

java - Hadoop レデューサー > 1 を設定できません

私は大学の課題に Hadoop を使用していますが、コードは動作していますが、小さな問題が発生しています。

レデューサーの数を19に設定しようとしています（ドキュメントが示唆するように、これは0.95 *容量です）。ただし、タスクトラッカーで自分のジョブを表示すると、合計で 1 つのレデューサーと表示されます。

予想通りの収量:

しかし、最終出力では次のようになります。

私が上書きした mapreduce の部分は次のとおりです。

マッパー
レデューサー
パーティショナー
グループ化コンパレータ。

私が最初に考えたのは、パーティショナーがすべてのキーに対して同じ値を返しているということでした。これを確認しましたが、そうではありませんでした。

また、グルーパーが正しく動作することも確認しました。

他に何が原因なのかわかりません。誰かがそれを助けることができれば、それは大歓迎です。

私は非常にアンチ Java の人なので、できれば非常に明確な例を試してみてください。

PS: 私はこのクラスターをセットアップしていません。これは大学によってセットアップされたものであるため、構成変数については不明です。PS: 投稿するにはコードが多すぎたので、特に見たいコードがあれば教えてください。

編集: TejasP から次の質問を受けました。

本当にコードを Hadoop またはローカルモードで実行していますか? （ジョブがジョブトラッカーとタスクトラッカーに表示されるかどうかを確認してください）。

はい、jobtracker UI で表示できます。これは、1 つのレデューサーも報告します。注：これには、settings.xmlで1としてリストされているレデューサーがあります

環境で HADOOP 変数をエクスポートしましたか?

はい、それらはenvに表示され、設定するまでコードはコンパイルされません。

クラスターは単一ノードですか、それとも複数ノードですか? およびクラスタが複数のノードからなる場合でも、すべてのノードは正常ですか? 他のノードに問題はありますか?

はい、複数のノードがあります (10) ジョブトラッカーレポート:

setNumReduceTasks を正しく使用していますか? 上で述べたように、set を呼び出してから get を呼び出し、(19) であるとされていた値を取得しましたが、最終的なコードではまだ 1 しか使用されていません。

詳細を削除することで、コードを小さな map-reduce コードに減らすことができます (これはデバッグ用です)。それを実行します。何が起こるか見てください。同じ問題に直面している場合は、元の質問で削減されたコードを提供してください。

結果を元にもう一度編集してみます

2012-05-16T11:26:34.787

0 投票する

0 に答える

266 参照

hadoop - 豚のセキュリティ問題

PIG 0.7.1 と Biginsights 1.0 を使用している Embedded Pig プログラムがうまく機能しています。今度は、新しいバージョンの PIg(0.9.1) と Biginsights(1.4) で同じプログラムを実行したいと考えています。しかし、私が実行していると、次のエラーが表示されます。

参考までに、java プログラムを使用して hdfs ファイルを読み取ることができます。問題はPIGだけだと思います。この問題を解決するのを手伝ってくれる人はいますか?

これは私のサンプルコードです:

hadoop apache-pig biginsights

2012-09-27T07:41:46.627

0 投票する

1 に答える

157 参照

bigdata - Jaql-トップオペレーターのデフォルトの順序

IBMの資料によると-http://publib.boulder.ibm.com/infocenter/bigins/v1r1/index.jsp?topic= % 2Fcom.ibm.swg.im.infosphere.biginsights.doc%2Fdoc%2Fc0057749.html Jaqlの最上位オペレーターのデフォルトの順序は昇順です。しかし、実行すると、デフォルトの順序が降順であることがわかります。BigInsightsバージョン1.4を使用しています。これがドキュメントの問題なのか、このように見える不一致の背後にある他の理由なのかを誰かが知っているのだろうかと思っていました-

bigdata jjaql biginsights

2012-11-15T09:11:27.677

0 投票する

1 に答える

672 参照

biginsights - Java API/Python による gpfs ファイルアクセス

IBM-GPFS は初めてです。Java API 経由で HDFS にアクセスできるため、Python スクリプトを使用します。GPFS ファイルにアクセスする同様の方法はありますか? 解決策を教えてください。

biginsights

2013-09-18T15:26:41.983

0 投票する

2 に答える

560 参照

bigdata - vmware イメージを使用する IBM InfoSphere BigInsights にはスクリプトがありません

IBM からの vmware イメージを使用して IBM InfoSphere BigInsights をインストールしようとしています。イメージが正常にロードされ、この doc biginsight reademeに従って redhat 画面が表示されました。

すべてが完全に機能しましたが、デスクトップに「BigInsight サービスの開始」アイコンが表示されません。しかし、webconsole と eclipse がインストールされています。「BigInsight サービスの開始」でターミナルにアクセスする次のステップがスタックしているためです。

bigdata biginsights

2013-12-17T06:25:11.917

0 投票する

2 に答える

6535 参照

hadoop - Hiveを使用して情報スキーマを表示するには?

information_schemaHive を使用して実装できる方法はありますか? また、Hive でデータプロファイリングを行うプロセスは何ですか?
次のように使用する SQL の例Information_Schema:

hadoop hive information-schema biginsights

2013-12-19T15:52:46.397

0 投票する

1 に答える

79 参照

apache-pig - フィルタが機能していません

Pig クエリを使用して hdfs データをフィルタリングしようとしています。二重引用符で囲まれたデータがあります。例: "AAA"、"BBB"、"YYY"。ここで YYY をフィルタリングしようとしています。次のフィルタリング方法を試しました。

あなたの助けを楽しみにしています。

apache-pig biginsights

2014-02-24T11:37:55.317

問題タブ [biginsights]

Reference