2

H2O の入力データ (データ フレーム) で項目のセット/リストを表すにはどうすればよいですか?

H2O Flow の炭酸水 1.6.5 を使用しています。入力データ (CSV ファイルの列) は次のようになります。

age: numeric
gender: enum
hobbies: ?
sports: ?

趣味とスポーツはリスト/セットで、エントリ数が制限されています (各 20 まで)。H2O には、これに適したデータ型がないようです。これらを H2O Flow で処理できる CSV ファイルにエクスポートするにはどうすればよいですか?

4

1 に答える 1

3

彼らの主な趣味または主なスポーツを記録するだけの場合、それは 20 レベルの趣味などの 1 つの列挙列になります。csv ファイルに文字列フィールドとして書き込むだけで、H2O がそれを読み取ります。

しかし、あなたが求めているのは、各人が20の趣味から0以上の選択肢を持っているところだと思いますか? その場合、趣味ごとに 1 つずつ、csv ファイルに 20 の列が必要です。それぞれが 2 値の列挙型になります。Y/N、T/F、Y/空白、趣味名/空白など、2 つの値が何であるかは関係ありません。csv ファイルは次のようになります。

name,gender,football?,running?,data mining?,sleeping?
Tom,M,Y,,,Y
Dick,M,,,Y,
Suzy,F,,Y,Y,

Tom はフットボールと睡眠が好きで、Dick はデータ マイニングのために生きており、Suzy はランニングとデータ マイニングに夢中です。

ちなみに、 を使用deeplearningすると、同じネットワーク構成になります。単一の 20 レベルの列挙型入力が 20 のバイナリ入力ノードに変換されます。

于 2016-06-26T20:33:53.080 に答える