問題タブ [spark-shell]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
2176 参照

windows - Windows の Git Bash で Spark-shell をセットアップする

mysystem の他のソフトウェアでこの問題に直面したことはありません。ウィンドウターミナル/コマンドプロンプトとGit-Bashですべてをインストールして実行できます

最近、Sparkの学習を始めました。すべての JAVA_HOME、SCALA_HOME、hadoop winutils ファイルを設定する Spark をインストールしました。Spark-shell と pyspark-shell は両方とも、コマンド プロンプト/ウィンドウ ターミナル、および pyspark lib を介した Jupyter で完璧に動作しています。

しかし、Git Bashの場合はわかりません(管理者権限で試しました)。spark-shell または pySpark を実行しようとすると、次のエラーが発生します。

解決策を検索したところ、.bashrc または spark-env-sh で環境変数を設定していることがわかりました。pySpark シェルに次のように設定します。

それもうまくいきませんでした。spark-class ファイルでエラーをトレースバックすると。そのとおりです: 96行目

私の質問、

  1. このエラーの理由は何ですか?どうすれば解決できますか?
  2. Git Bash for Windows で spark-shell をセットアップするための明確に定義された手順はありますか (ネット上でしっかりしたものを見つけることができません)?

ありがとう。

0 投票する
0 に答える
112 参照

apache-spark - Spark 構成、org.apache.spark.shuffle.FetchFailedException 接続に失敗しました

Hadoop 3.1.0 と spark 2.4.7 を 4 つの仮想マシンにインストールしました。全部で 32 個のコア、128G のメモリがあります。スパークシェルテストを実行しています

私は次のパラメータで遊んでいます

ぶつかっorg.apache.spark.shuffle.FetchFailedException Failed to connect 192.168.0.XXX たり、WARN TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources

これらのパラメーターやその他のパラメーターを微調整するための一般的なガイドはありますか?