私はH2OFrame
CSVファイルから読んでいます:
val h2oFrame = new H2OFrame(new File(inputCsvFilePath))
操作に相当するものを実行するにはどうすればよいですか.filter()
(SparkDataFrame
またはで利用可能RDD
)。たとえば、H2OFrame
「ラベル」(列名) がどこにあるかを取得するにはどうすればよい>1
ですか?
以下のように変換しようとしましたorg.apache.spark.sql.DataFrame
(簡略化された例):
val df = asDataFrame(h2oFrame)
val dff = df.filter(s"label > 1")
print(dff.toString(0,15))
しかし、これは以下のようにスローさOutOfMemoryError
れるようです:
例外: スレッド "Executor task launch worker-2" の UncaughtExceptionHandler から java.lang.OutOfMemoryError がスローされる