問題タブ [azure-hdinsight]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
765 参照

c# - HDInsight エミュレーターへの接続

私はc#で接続しようとしています。

これは、Hive クエリをリモート HDInsight クラスターに正常に送信するクラスです。ローカル エミュレーターに接続するには、ここで何を変更する必要がありますか

0 投票する
1 に答える
5651 参照

powershell - Hadoop Hive クエリでの二重引用符

次のクエリで二重引用符を使用できます->

しかし、次の PowerShell コマンドで引用符を使用できません -

次のエラーが表示されます-

ここに画像の説明を入力

この散発的な動作の理由を教えてください。両方の実装がジョブを作成します。次に、一方の実装が二重引用符を受け入れ、もう一方の実装が受け入れない理由。

0 投票する
1 に答える
5876 参照

hadoop - ハイブに存在しない場所に挿入

ansi sqlでこれに相当するハイブ構文が必要です

そのため、tablea には重複が含まれず、tableb からの新しい ID のみが挿入されます。

0 投票する
1 に答える
309 参照

azure - Azure HDInsight パラメーターが正しく引用されていません

Hadoop (HDInsight) で Azure SQL データベースのデータを使用しようとしています。

データを取得してジョブを実行するために、C# コンソール プログラムで次のコードを実行します。

エラーメッセージ:

注意事項:

  • --query パラメータなしで動作します。つまり、単純にテーブル全体を選択した場合
  • コマンドは Powershell で実行すると機能します
  • クエリにスペースが含まれていない場合 (つまり --query \"SELECT\" )、エラーは発生しませんが、明らかにあまり役に立ちません。
  • 一重引用符 (--query 'SELECT ... $Conditions' ) は機能しますが、ジョブは出力を生成しません
  • @ と二重引用符の使用が機能しない
  • 問題はHadoop Hive Query の Double quotes に似ているようですが、答え (ジョブ名の指定) は役に立ちませんでした

質問: クエリ内のスペースでこのエラーが発生するのはなぜですか?

よろしくお願いいたします。

0 投票する
1 に答える
153 参照

hive - Azure Storage 使用時の HDInsight のスケーラビリティ

こんにちは、HDInsight をいじっています。ログ ファイルを Azure ストレージに配置し、Hive 外部テーブルを使用してそれらにマップしています。データを失うことなくクラスターを削除して再作成できるように、Microsoft は HDFS に Azure ストレージを推奨していると思います。スケーラビリティと HDFS の比較。HDFS についての私の理解では、HDFS は複数のノードに分散されており、並列処理を可能にしています。これは Azure ストレージとどのように比較されますか。

0 投票する
1 に答える
881 参照

.net - プログラムによる HDInsight ジョブの実行 - BLOB ストレージではなく、クラスター ノード上の .jar ファイル

このチュートリアルに従って、mapreduce ジョブを .NET コンソール アプリから HDInsight に送信しました。

正常に動作しますが、次の行について疑問に思っています:

"wasb:///example/jars/hadoop-examples.jar" は、Azure ストレージ アカウントを新しい HDInsight クラスターに接続したときに自動的に配置された、Azure ストレージ アカウント内の jar を指します。

例を超えて (Mahout を使用したい)... クラスター ノードに追加した jar を参照できますか? RDP で mahout を apps/dist ディレクトリにインストールしました。そこから Mahout ジョブを問題なく実行できますが、これら 2 つのステップをまとめることはできません。

jar ファイルを使用するために blob ストレージに追加する必要はないように思えます。

0 投票する
1 に答える
573 参照

powershell - HDInsight PowerShell ジョブの送信では、ストリーミング C# ジョブでカスタム libjar を定義する方法がありません

Microsoft Azure HDInsight サービスによってホストされている Hadoop クラスターで C# ジョブを実行しています。カスタム Java 入力形式を使用するには、hdinsight サーバーで hadoop コマンド ラインを直接使用する必要がありました。

bin\hadoop jar lib\hadoop-streaming.jar -D "mapred.max.split.size=33554432" を呼び出します -libjars "../mycustom-hadoop-streaming.jar" -inputformat "mycustom.hadoop.CombinedInputFormat" .. .(コマンドの残りをカットしました)

今、私はpowershellコマンドライン(別のAzureマシンからのリモートジョブ送信)を介したジョブ送信で同じことをしようとしています:

$jobDefinition = New-AzureHDInsightStreamingMapReduceJobDefinition -Defines @{ "mapred.max.split.size"="33554432", "mapred.input.format.class"="mycustom.hadoop.CombinedInputFormat" } ... (残りはカットしましたコマンドの)

しかし、powershell コマンドラインで -libjars を定義する方法はどこにありますか? Microsoft はその機能について考えていなかったようです: http://msdn.microsoft.com/en-us/library/windowsazure/dn527638.aspx

誰かがそれを実行しようとしましたか、または HDInsight ストリーミング ジョブの送信で libjars を定義するための回避策がありますか?