1

「h2o」パッケージは、R 経由でアクセスできる楽しい ML Java ツールです。「h2o」にアクセスするための R パッケージは「h2o」と呼ばれます

入力手段の 1 つは、「h2o」に csv ファイルの場所を伝え、「h2o」に生の CSV をアップロードさせることです。フォルダーを指定して、コマンドを使用して「その中のすべて」をインポートするように「h2o」に指示する方が効果的h2o.importFolderです。

「gzip」または「bzip」csv ファイルのフォルダーを指定し、「h2o」でそれらをインポートする方法はありますか?

このリンク (ここ) によると、h2o は圧縮ファイルをインポートできます。importFolder アプローチでこれを指定する方法がわかりません。

圧縮フォームをインポートする方が速いですか、遅いですか? 出力を作成する別のプログラムがある場合、圧縮されている場合、h2o インポート プロセスの速度が向上しますか? 生のテキストの場合は?ガイドラインとパフォーマンスのベスト プラクティスを歓迎します。

いつものように、コメント、提案、およびフィードバックを求めています。

4

1 に答える 1

0

@screechOwl のアドバイスを受けて、0xdata.atlassian.net ボードで h2o について質問したところ、明確な回答が得られました。

ユーザー"cliff"によって提供されました。

こんにちは、はい H2O - フォルダーをインポートするとき - フォルダー内のすべてのファイルを取得します。必要に応じて gzip または zip されたファイルを解凍し、それらすべてを 1 つの大きな CSV に解析します。すべてのファイルは、CSV の意味で互換性がある必要があります。列の数と種類は同じです。

H2O は現在、bzip ファイルを処理しません。

于 2015-02-21T18:42:55.250 に答える