“h2o”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

175 参照

amazon-ec2 - EC2 で H2O を使用するデフォルトの RStudio サーバーユーザー

H2O に付属の RStudio サーバーインストールを使用しようとしています。EC2 で起動する手順はこちらです。これはすべて正常に完了し、ポート 8787 で RStudio が動作するようになりましたが、デフォルトのログオン資格情報が何であるかはわかりません。いずれかがあります？EC2 インスタンスにログインしてユーザーを手動で構成する必要がありますか?

2015-08-27T18:04:22.407

0 投票する

1 に答える

637 参照

scala - ScalaでDataframeをH2Oに変換するにはどうすればよいですか?

私の質問をしてくれてありがとう。現在、RDD を DF から H2O に変換する作業を行っています。私はH2Oの部分にかなりこだわっています。Scala DataFrame を H2O に変換するにはどうすればよいですか?

scala rdd h2o

2015-09-04T14:24:38.837

0 投票する

1 に答える

749 参照

h2o - h2o.auc( perf , xval =TRUE) - この呼び出しは何を返しますか?

私のコードは次のとおりです

perf <- h2o.performance(gbm.fit.hex , tr.hex) a = h2o.auc(perf , xval = TRUE)

auc 呼び出しは何を返しますか? トレーニングデータセットまたは相互検証結果の AUC を返しますか?

h2o

2015-09-05T18:51:01.830

0 投票する

1 に答える

772 参照

scala - ScalaのH2OFrameの既存の列に基づいて列を追加するにはどうすればよいですか

ScalaのH2OFrameの既存の列に基づいて列を追加するにはどうすればよいですか?

既存の列のログである新しい列を追加したい。どうやってやるの？ありがとう

scala h2o

2015-09-09T14:42:59.607

0 投票する

1 に答える

872 参照

r - h2o ランダムフォレストのエラーメトリックの説明

次のパラメーター設定でh2oランダムフォレストを実行しています

実行後、次の出力が得られます。

以下は私の質問です。

1) MSE と R2 は何を意味しますか?

2) 平均二乗誤差または同様の場合、分類設定でこれらのメトリックを取得するのはなぜですか?

3) gini や auc などの他の指標を取得するにはどうすればよいですか?

4) これら 2 つのパラメーターが異なるパラメーター設定で減少した場合、モデルのパフォーマンスが向上したと言えますか?

r random-forest h2o

2015-09-15T10:40:24.250

0 投票する

1 に答える

2684 参照

r - h2oランダムフォレストで分類を指定するにはどうすればよいですか

h2o.randomForestで分類を指定する方法について、インターネット全体を見ています。私が見つけたものは何でも、TRUE に設定できるパラメータ「分類」があると言っています。しかし、h2o パッケージのドキュメントによると、それはもうありません。

こちらをご覧ください https://cran.r-project.org/web/packages/h2o/h2o.pdf

ターゲット変数がバイナリ 1-0 変数であるデータに対してこの h2o.randomForest を実行すると、回帰が想定されます。

分類したいことをどのように伝えればよいかわかりません。

どんな助けでも大歓迎です。

ありがとう

r random-forest h2o

2015-09-15T12:58:14.230

0 投票する

1 に答える

52 参照

r - RにおけるH2oオブジェクトのランダム離散値生成

以下の例に示すように、H2o オブジェクト (3GB データ) のランダムな離散値を生成したいと考えています。

例：

以下のように R-h2o コードを書きましたが、結果を得ることができません。

以下は私のH2oクラスターの詳細です

これは、R と H2o オブジェクトの間のデータ型の問題で発生していると思います。つまり、R は h2o オブジェクトの数値を数値として読み取っていません。他の条件付き操作でも同じ問題に直面しています。

r bigdata h2o

2015-09-16T09:48:57.980

0 投票する

1 に答える

826 参照

r - h2o ランダムフォレストモデルオブジェクトを再度読み込んだ後、テストデータをスコアリングできません

h2oパッケージインを使用しRてランダムフォレストモデルを構築しています。私のタスクでは、テストデータを後で繰り返しスコアリングする必要があるため、ランダムフォレストモデルオブジェクトを次のように保存します。

データをスコアリングするために、後で次のようにモデルオブジェクトをメモリに再度ロードします。

しかし、私が使用して得点するとき

次のエラーが表示されます

R パッケージを使用してモデルを構築すると、保存、読み込み、およびスコアリングのアプローチ全体がうまく機能しますが、ここではどういうわけか失敗します。誰かがそれに対する解決策を提供してもらえますか? データをスコアリングするたびにモデルを再構築し続けることはできません。

モデルが新しく構築され、まだメモリに存在する場合、スコアリングはスムーズに行われるため、H2o 接続は問題ないようです。

r random-forest h2o

2015-09-18T12:50:58.340

0 投票する

1 に答える

1964 参照

r - h2o.randomforestは欠損値をどのように処理しますか

h2o に関する調査の結果、h2o.randomForest は R randomForest パッケージとは異なり、変数の欠損値を処理できることがわかりました。

http://h2o.ai/blog/2014/04/sjsu-tutorial-h2o-random-forest/を参照してください。

しかし、どこを見ても、欠落している値がh2o.randomForestによってどのように処理されているかがわかりませんか? R gbm() パッケージによるミスイン値の処理とどの程度似ていますか?

上記の 2 つの質問に関するヘルプをいただければ幸いです。

ありがとう、

r random-forest h2o

2015-09-24T14:29:42.117

0 投票する

1 に答える

751 参照

r - Rでh2oの2つのインスタンスを作成する

h2o.randomForest() を使用したランダムフォレストモデルがあります。

ここで、h2o.predict() を使用して大量のデータをスコアリングする必要があります。いくつかの制約により、すべてのデータを一度にスコア付けすることはできません。基本的に、ループ内のさまざまなデータセットにスコアを付けたいと考えています。したがって、プロセスを高速化するために、2 つの異なる R インスタンスで同じスクリプトを実行して、複数のデータセットを同時にスコアリングしたいと考えています。しかし、それを行うと、1 つのインスタンスは正常に動作しますが、他のインスタンスでは次のエラーが発生します。両方のインスタンスでこのエラーが発生する場合があります。

上記のエラーには一貫性さえありません。

私はh2oを初期化し、すべてのRインスタンスで次のように予測しています。

どうすればこれを達成できますか？2 つの異なる R インスタンスを介して h2o クラウドを使用するにはどうすればよいですか?

ありがとう、

r parallel-processing multiple-instances h2o

2015-09-28T09:12:43.707

問題タブ [h2o]

Reference