問題タブ [sparkling-water]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-spark - H20 機械学習ライブラリに対する Sparking Water の利点はどれですか
Sparkling Water は Spark 環境で実行される H20 であるため、Spark Engine (およびすべての Spark 分散構造) を使用してコンピューティングを分散できることを理解しましたが、H2O はすでに分散型でスケーラブルであるため、パフォーマンスの点でメリットがあります。機械学習用ライブラリ?
さらに、H2O のスタンドアロン バージョンは、コンピューターのクラスター上で分散処理を管理できるのでしょうか?
pyspark - Python Notebook を使用して Databricks で Sparkling Water Cloud を作成する
Databricks を使用して、Spark 内で Sparkling Water クラウドを起動しようとしています。H2O ライブラリ (3.16.0.2)、PySparkling (pysparkling 0.4.6)、Sparkling Water jar (sparkling-water-assembly_2.11-2.1.10-all.jar) を実行中のクラスターにアタッチしました(Spark 2.1、自動更新 Scala 1.1.1)。
以下の必要なライブラリを正常にインポートします。
それでも、次のコマンドを使用して Sparkling Water クラウドを初期化しようとすると:
hc = H2OContext.getOrCreate(spark)
また
H2OContext.getOrCreate(sc)
同じエラーが表示されます:
NameError: name 'H2OContext' is not defined
価値があるのは、このScala ドキュメントを使用して Sparkling Water クラウドを初期化できることです。
ただし、このパイプラインは常に Databricks を使用するとは限らないため、すべて PySpark である必要があり、Databricks には対応する PySpark の例がありません。
前もって感謝します。
python - NullPointerException PySparkling H2OFrame から Spark DataFrame へ
ピスパークリング2.1
次のコードを実行します。
ドキュメントと同じように、問題なく動作します。
しかし、次のコードを試すと:
次のエラーが表示されます。
唯一の違いは、H2OFrame を初期化する方法です。この不一致の原因は何ですか? 足りないものはありますか?H2OFrame の作成方法が重要なのはなぜですか?
どんな助けでも大歓迎
編集:
some_list
: