問題タブ [sparkling-water]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
156 参照

apache-spark - H20 機械学習ライブラリに対する Sparking Water の利点はどれですか

Sparkling Water は Spark 環境で実行される H20 であるため、Spark Engine (およびすべての Spark 分散構造) を使用してコンピューティングを分散できることを理解しましたが、H2O はすでに分散型でスケーラブルであるため、パフォーマンスの点でメリットがあります。機械学習用ライブラリ?

さらに、H2O のスタンドアロン バージョンは、コンピューターのクラスター上で分散処理を管理できるのでしょうか?

0 投票する
1 に答える
1003 参照

pyspark - Python Notebook を使用して Databricks で Sparkling Water Cloud を作成する

Databricks を使用して、Spark 内で Sparkling Water クラウドを起動しようとしています。H2O ライブラリ (3.16.0.2)、PySparkling (pysparkling 0.4.6)、Sparkling Water jar (sparkling-water-assembly_2.11-2.1.10-all.jar) を実行中のクラスターにアタッチしました(Spark 2.1、自動更新 Scala 1.1.1)。

以下の必要なライブラリを正常にインポートします。

それでも、次のコマンドを使用して Sparkling Water クラウドを初期化しようとすると:

hc = H2OContext.getOrCreate(spark)

また

H2OContext.getOrCreate(sc)

同じエラーが表示されます:

NameError: name 'H2OContext' is not defined

価値があるのは、このScala ドキュメントを使用して Sparkling Water クラウドを初期化できることです。

ただし、このパイプラインは常に Databricks を使用するとは限らないため、すべて PySpark である必要があり、Databricks には対応する PySpark の例がありません。

前もって感謝します。

0 投票する
0 に答える
314 参照

python - NullPointerException PySparkling H2OFrame から Spark DataFrame へ

ピスパークリング2.1

次のコードを実行します。

ドキュメントと同じように、問題なく動作します。

しかし、次のコードを試すと:

次のエラーが表示されます。

唯一の違いは、H2OFrame を初期化する方法です。この不一致の原因は何ですか? 足りないものはありますか?H2OFrame の作成方法が重要なのはなぜですか?

どんな助けでも大歓迎

編集:

some_list: