“azure-hdinsight”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

282 参照

bigdata - HDInsight - 複数のストレージを使用していますか?

複数のアカウントストレージを同じ HDInsight クラスターに関連付けることは可能ですか? どうやってやるの？

それが不可能な場合、200 TB を超える情報をアップロードして HDInsight で処理するにはどうすればよいですか?

ありがとう。

bigdata azure-hdinsight

2013-07-24T23:45:30.700

0 投票する

4 に答える

18108 参照

c# - C# を使用して HBase / Hadoop データベースに接続する方法

最近、Microsoft HDInsight Hadoop for Windows を探索していますが、どこから始めればよいかわからず、c# / asp.net mvc で Apache Hadoop を使い始めました。

http://hadoopsdk.codeplex.com/が開始するのに最適なリソースであることはわかっていますが、最初から開始するためのドキュメントが見つかりませんか? クラスター、データベースを作成し、それを C# アプリに接続するようなものです。

c#hadoop hbase hive azure-hdinsight

2013-07-25T19:03:00.327

0 投票する

2 に答える

290 参照

java - HDInsight Hadoop 用のこの Java の何が問題になっていますか?

Hadoopで実行しようとすると、以下のJavaが機能しない理由を見つけようとしています。

エラーは次のとおりです。

c:\hadoop-training\tutorial02-jobtracker>hadoop jar PageStat.jar PageStat jobtracker/input/visit_5000000.txt jobtracker/output 13/07/29 11:24:50 INFO input.FileInputFormat: プロセスへの合計入力パス: 1 log4j:ERROR [c:\Hadoop\hadoop-1.1.0-SNAPSHOT\logs/hadoop.log] の名前を [c:\Hadoop\hadoop-1.1.0-SNAPSHOT\logs/hadoop.log.2013-07] に変更できませんでした-26]。13/07/29 11:24:51 INFO util.NativeCodeLoader: ネイティブ Hadoop ライブラリをロードしました 13/07/29 11:24:51 警告 snappy.LoadSnappy: Snappy ネイティブライブラリがロードされていません 13/07/29 11:24: 54 情報 mapred.JobClient: 実行中のジョブ: job_201307261340_0001 13/07/29 11:24:55 情報 mapred.JobClient: マップ 0% 削減 0% 13/07/29 11:25:24 情報 mapred.JobClient: マップ 1% 削減0% 13/07/29 11:25:27 INFO mapred.JobClient: マップ 6% 削減 0% 13/07/29 11:25:30 INFO mapred.JobClient:

13/07/29 11:26:56 INFO mapred.JobClient: マップ 100% 削減 0% 13/07/29 11:27:05 INFO mapred.JobClient: マップ 100% 削減 8% 13/07/29 11:27 :08 情報 mapred.JobClient: マップ 100% 削減 33% 13/07/29 11:27:10 情報 mapred.JobClient: タスク ID: 試行_201307261340_0001_r_0 00000_1、ステータス: 失敗しました java.lang.NullPointerException at PageStat$PageStatReducer.reduce(PageStat) .java:120) で PageStat$PageStatReducer.reduce(PageStat.java:96) で org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:177) で org.apache.hadoop.mapred.ReduceTask.runNewReducer( ReduceTask.java:651 ) で org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:418) で org.apache.hadoop.mapred.Child$4.run(Child.java:271) で java.security. javax.security の AccessController.doPrivileged(Native Method)。auth.Subject.doAs(Subject.java:396) org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1135) org.apache.hadoop.mapred.Child.main(Child.java:265) )

13/07/29 11:27:11 INFO mapred.JobClient: マップ 100% 削減 0% 13/07/29 11:27:20 INFO mapred.JobClient: マップ 100% 削減 8% 13/07/29 11:27 :23 INFO mapred.JobClient: map 100% reduce 25% 13/07/29 11:27:25 INFO mapred.JobClient: Task Id: attempts_201307261340_0001_r_0 00000_2, Status: FAILED java.lang.NullPointerException at PageStat$PageStatReducer.reduce(PageStat) .java:120) で PageStat$PageStatReducer.reduce(PageStat.java:96) で org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:177) で org.apache.hadoop.mapred.ReduceTask.runNewReducer( ReduceTask.java:651 ) で org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:418) で org.apache.hadoop.mapred.Child$4.run(Child.java:271) で java.security. javax.security の AccessController.doPrivileged(Native Method)。auth.Subject.doAs(Subject.java:396) org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1135) org.apache.hadoop.mapred.Child.main(Child.java:265) )

13/07/29 11:27:26 INFO mapred.JobClient: マップ 100% 削減 0% 13/07/29 11:27:38 INFO mapred.JobClient: マップ 100% 削減 25% 13/07/29 11:27 :41 INFO mapred.JobClient: map 100% reduce 0% 13/07/29 11:27:43 INFO mapred.JobClient: Job complete: job_201307261340_0001 13/07/29 11:27:43 INFO mapred.JobClient: Counters: 24 13/07/29 11:27:43 INFO mapred.JobClient: ジョブカウンター 13/07/29 11:27:43 INFO mapred.JobClient: 起動された reduce tasks=4 13/07/29 11:27:43 INFO mapred。 JobClient: SLOTS_MILLIS_MAPS=179086 13/07/29 11:27:43 INFO mapred.JobClient: スロットを予約した後の待機時間の短縮 (ms)=0 13/07/29 11:27:43 INFO mapred.JobClient :
スロットを予約した後にすべてのマップが待機していた合計時間 (ミリ秒)=0 13/07/29 11:27:43 INFO mapred.JobClient: Launched map tasks=4 13/07/29 11:27:43 INFO mapred.JobClient : データローカルマップタスク = 4 13/07/29 11:27:43 INFO mapred.JobClient: タスクの削減に失敗しました = 1 13/07/29 11:27:43 INFO mapred.JobClient:
SLOTS_MILLIS_REDUCES=106513 13/07/ 29 11:27:43 INFO mapred.JobClient:
FileSystemCounters 13/07/29 11:27:43 INFO mapred.JobClient:
FILE_BYTES_READ=179504086 13/07/29 11:27:43 INFO mapred.JobClient:
HDFS_BYTES_READ=254931072 13/ 07/29 11:27:43 INFO mapred.JobClient:
FILE_BYTES_WRITTEN=359099432 13/07/29 11:27:43 INFO mapred.JobClient: ファイル入力形式カウンター 13/07/29 11:27:43 INFO mapred.JobClient:
読み取ったバイト数 = 254930544 13/07/29 11:27:43 INFO mapred.JobClient:
Map-Reduce Framework 13/07/29 11:27:43 INFO mapred.JobClient: マップ出力のマテリアライズドバイト = 17949 9502 13/07/29 11:27:43 INFO mapred.JobClient: 出力レコードの結合 = 0 13/07/ 29 11:27:43 情報 mapred.JobClient: マップ入力レコード=5000000 13/07/29 11:27:43 情報 mapred.JobClient: 物理メモリ (バイト) スナップショット=85 1607552 13/07/29 11:27:43情報 mapred.JobClient: こぼれたレコード = 10000000 13/07/29 11:27:43 情報 mapred.JobClient: マップ出力バイト = 169499478 13/07/29 11:27:43 情報 mapred.JobClient: CPU 時間 (ミリ秒) =81308 13/07/29 11:27:43 INFO mapred.JobClient: コミットされた合計ヒープ使用量 (バイト)= 746323968 13/07/29 11:27:43 INFO mapred.JobClient: 仮想メモリ (バイト) スナップショット=988 401664 13/07/29 11:27:43 INFO mapred.JobClient: 入力レコードを結合 = 0 13/07/29 11:27:43 INFO mapred。JobClient: マップ出力レコード = 5000000 13/07/29 11:27:43 INFO mapred.JobClient:
SPLIT_RAW_BYTES=528

ありがとう！！！

java hadoop azure-hdinsight

2013-07-30T18:33:11.847

0 投票する

1 に答える

3357 参照

c# - Hive を asp.net プロジェクトに接続する方法

こんにちは、Hadoop は初めてです。

Microsoft HDInsight をローカルシステムにインストールしました。ここで、ハイブと HBase に接続したいのですが、HIVE 接続の場合、接続文字列、ポート、ユーザー名、パスワードを指定する必要があります。

しかし、この値を取得する方法がわかりません。ポートとして localhost と 8085 を試しましたが、うまくいきません。また、localhost IP とシステム IP も指定して実行しました。

これを手伝ってください。HBase 接続の進め方を教えてください。

c#hadoop hbase hive azure-hdinsight

2013-08-07T12:38:07.670

0 投票する

1 に答える

4463 参照

hadoop - エラー security.UserGroupInformation: PriviledgedActionException

HDInsights で Hadoop バージョン 1.1.0 を学習しようとしています。段階的な指示に従って、Hadoop コマンドラインでコマンドを実行しました。最初に Java コードをコンパイルし、jar ファイルを作成してから map reduce コマンドを実行しました。しかし、mapreduce コマンドを実行すると、以下のエラーが表示されます。エラーの意味と、それを修正するために何をする必要があるかを理解するのを手伝ってくれる人はいますか?

どんな助けにも感謝します！ありがとう、ラムヤ

hadoop mapreduce azure-hdinsight

2013-08-12T22:19:45.793

0 投票する

2 に答える

339 参照

c# - ストリーミングマップ削減ジョブを Azure でリモートで実行することはできますか?

C# を使用して Azure クラスターでストリーミング Map Reduce ジョブをリモートで実行するにはどうすればよいですか? 私のマッパーとレデューサーは Java または C++ で書かれています。.Net C# SDK のジョブ実行メソッドは入力で JobType を受け取るため、C++ および Java ベースのマッパー/リデューサーのタイプを指定できません。

StreamingProcessExecutor私の場合に適していると思われる別のクラスがありますが、入力で資格情報を受け取る場所がないため、リモート実行には使用できないと思います。

ストリーミングマップ削減ジョブをリモートおよびプログラムで実行する方法を知っている人はいますか?

c#azure hadoop mapreduce azure-hdinsight

2013-08-19T07:36:56.943

0 投票する

2 に答える

1427 参照

c# - Azure + HDInsight のローカルエミュレーション

タスクは、 ETLプロジェクトのT部分 (変換) をAzure クラウドに実装することです。HDInsight はそのために使用するのに適したサービスだと思いますが、よくわかりません。この選択を承認または反論してください。

私はこの分野にまったく慣れていないので、誰かが私をここで正しい方向に向けることができれば幸いです.

変換サービス (ジョブ) を開発し、 Azure Storage/Compute EmulatorsとVisual Studio 2012 (理想的には C#)を使用してローカルでテストできるようにしたいと考えています。私は、HDInsightがこの図にどのように適合するかを確信しています (もしあったとしても)。変換ジョブは、BLOB ストレージからテキストファイルを読み取り、Azure テーブルストレージにデータを生成 (マップリデュース) します。

c#azure etl azure-hdinsight

2013-08-22T18:32:01.933

0 投票する

1 に答える

517 参照

c# - HDInsight は ASV (ブロブストレージ) でのみ機能しますか?

hdinsight の map reducer によって生成されたデータを、簡単にレポートできる形式で保存したいと考えています。テーブル構造 (Azure テーブルストレージ) が理想的です。いくつかの調査を行ったところ、HDInsight サービスは Azure Storage Vault (ASV) (読み取りと書き込みの両方) でのみ機能するようです。あれは正しいですか？

C# で hdinsight マッパー/リデューサーを実装したいと思います。

Hive や pig についてはよくわかりませんが、ASV 以外の外部 (Azure テーブル) データストレージにレデューサーの結果を保持できる機能があるのだろうか?

c#azure mapreduce azure-hdinsight

2013-08-23T21:49:16.310

0 投票する

1 に答える

814 参照

c# - ローカルストレージエミュレーターで Azure Storage Vault (ASV) を指すように HDInsight の入力/出力パスを設定する方法を教えてください。

hdinsight の単純なマップ/リデューサージョブを作成しようとしていますが、 ASV://経由でローカルの hdinsight Hadoop クラスターのジョブをローカルの Azure ストレージエミュレーターに接続する際に問題が発生しています。

次のようなサンプルコード:

また

ここで、testcontainerは、ローカルエミュレーターの BLOB ストレージ内の既存のコンテナーです。このコードを実行すると、StreamingException "Process failed ('Streaming Job Failed!')" が発生します。

コンソール出力に次のエラーが表示されます。

ヒントはありますか？

c#azure azure-hdinsight azure-storage-emulator

2013-08-26T19:37:15.517

問題タブ [azure-hdinsight]

Reference