問題タブ [h2o]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-ec2 - EC2 で H2O を使用するデフォルトの RStudio サーバー ユーザー
H2O に付属の RStudio サーバー インストールを使用しようとしています。EC2 で起動する手順はこちらです。これはすべて正常に完了し、ポート 8787 で RStudio が動作するようになりましたが、デフォルトのログオン資格情報が何であるかはわかりません。いずれかがあります?EC2 インスタンスにログインしてユーザーを手動で構成する必要がありますか?
scala - ScalaでDataframeをH2Oに変換するにはどうすればよいですか?
私の質問をしてくれてありがとう。現在、RDD を DF から H2O に変換する作業を行っています。私はH2Oの部分にかなりこだわっています。Scala DataFrame を H2O に変換するにはどうすればよいですか?
h2o - h2o.auc( perf , xval =TRUE) - この呼び出しは何を返しますか?
私のコードは次のとおりです
perf <- h2o.performance(gbm.fit.hex , tr.hex)
a = h2o.auc(perf , xval = TRUE)
auc 呼び出しは何を返しますか? トレーニング データセットまたは相互検証結果の AUC を返しますか?
scala - ScalaのH2OFrameの既存の列に基づいて列を追加するにはどうすればよいですか
ScalaのH2OFrameの既存の列に基づいて列を追加するにはどうすればよいですか?
既存の列のログである新しい列を追加したい。どうやってやるの?ありがとう
r - h2o ランダム フォレストのエラー メトリックの説明
次のパラメーター設定でh2oランダムフォレストを実行しています
実行後、次の出力が得られます。
以下は私の質問です。
1) MSE と R2 は何を意味しますか?
2) 平均二乗誤差または同様の場合、分類設定でこれらのメトリックを取得するのはなぜですか?
3) gini や auc などの他の指標を取得するにはどうすればよいですか?
4) これら 2 つのパラメーターが異なるパラメーター設定で減少した場合、モデルのパフォーマンスが向上したと言えますか?
r - h2oランダムフォレストで分類を指定するにはどうすればよいですか
h2o.randomForestで分類を指定する方法について、インターネット全体を見ています。私が見つけたものは何でも、TRUE に設定できるパラメータ「分類」があると言っています。しかし、h2o パッケージのドキュメントによると、それはもうありません。
こちらをご覧ください https://cran.r-project.org/web/packages/h2o/h2o.pdf
ターゲット変数がバイナリ 1-0 変数であるデータに対してこの h2o.randomForest を実行すると、回帰が想定されます。
分類したいことをどのように伝えればよいかわかりません。
どんな助けでも大歓迎です。
ありがとう
r - RにおけるH2oオブジェクトのランダム離散値生成
以下の例に示すように、H2o オブジェクト (3GB データ) のランダムな離散値を生成したいと考えています。
例 :
以下のように R-h2o コードを書きましたが、結果を得ることができません。
以下は私のH2oクラスターの詳細です
これは、R と H2o オブジェクトの間のデータ型の問題で発生していると思います。つまり、R は h2o オブジェクトの数値を数値として読み取っていません。他の条件付き操作でも同じ問題に直面しています。
r - h2o ランダム フォレスト モデル オブジェクトを再度読み込んだ後、テスト データをスコアリングできません
h2o
パッケージインを使用しR
てランダム フォレスト モデルを構築しています。私のタスクでは、テスト データを後で繰り返しスコアリングする必要があるため、ランダム フォレスト モデル オブジェクトを次のように保存します。
データをスコアリングするために、後で次のようにモデル オブジェクトをメモリに再度ロードします。
しかし、私が使用して得点するとき
次のエラーが表示されます
R パッケージを使用してモデルを構築すると、保存、読み込み、およびスコアリングのアプローチ全体がうまく機能しますが、ここではどういうわけか失敗します。誰かがそれに対する解決策を提供してもらえますか? データをスコアリングするたびにモデルを再構築し続けることはできません。
モデルが新しく構築され、まだメモリに存在する場合、スコアリングはスムーズに行われるため、H2o 接続は問題ないようです。
r - h2o.randomforestは欠損値をどのように処理しますか
h2o に関する調査の結果、h2o.randomForest は R randomForest パッケージとは異なり、変数の欠損値を処理できることがわかりました。
http://h2o.ai/blog/2014/04/sjsu-tutorial-h2o-random-forest/を参照してください。
しかし、どこを見ても、欠落している値がh2o.randomForestによってどのように処理されているかがわかりませんか? R gbm() パッケージによるミスイン値の処理とどの程度似ていますか?
上記の 2 つの質問に関するヘルプをいただければ幸いです。
ありがとう、
r - Rでh2oの2つのインスタンスを作成する
h2o.randomForest() を使用したランダム フォレスト モデルがあります。
ここで、h2o.predict() を使用して大量のデータをスコアリングする必要があります。いくつかの制約により、すべてのデータを一度にスコア付けすることはできません。基本的に、ループ内のさまざまなデータセットにスコアを付けたいと考えています。したがって、プロセスを高速化するために、2 つの異なる R インスタンスで同じスクリプトを実行して、複数のデータセットを同時にスコアリングしたいと考えています。しかし、それを行うと、1 つのインスタンスは正常に動作しますが、他のインスタンスでは次のエラーが発生します。両方のインスタンスでこのエラーが発生する場合があります。
上記のエラーには一貫性さえありません。
私はh2oを初期化し、すべてのRインスタンスで次のように予測しています。
どうすればこれを達成できますか?2 つの異なる R インスタンスを介して h2o クラウドを使用するにはどうすればよいですか?
ありがとう、