更新: 問題はわかりましたが、解決策はわかりませんでした。これは、新しい Java バージョンの問題です。最新のJavaに更新すると、この問題が発生し始めました。
h2o とディープ ラーニング パッケージをしばらく問題なく使用しています。今日もそれを使用しましたが、ディープラーニング モデルから特徴を抽出すると、特定の列のすべての行で同じ値を取得し続けます。以前は正常に動作していました。うまくいかなかった別のデータセットを使用してみました。だから私はそれが私のデータセット(以前は機能していた)か、それよりも深いものだと推測しています。
これは私のコードです。どんな助けでも大歓迎です。
library(h2o)
localH20=h2o.init(nthreads = -1)
data=h2o.importFile(localH20, path="smsAllWords.csv", header=T)
model= h2o.deeplearning(x=1:107, training_frame = data, shuffle_training_data=TRUE, activation = "Tanh", hidden = c(100,75,50,25), epochs= 5,autoencoder = TRUE)
dl.data=h2o.deepfeatures(model,data,4)`
これは、データと出力がどのように見えるかのサンプルです。
data[1:10,1:10]
H2OFrame with 10 rows and 10 columns
a1 a2 a3 a4 a5 a6 a7 a8 a9 a10
1 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 -0.28192 -0.13307 -0.27609
2 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 2.13240 -0.13307 1.80440
3 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 6.59090 -0.28192 -0.13307 -0.27609
4 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 -0.28192 -0.13307 -0.27609
5 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 -0.28192 -0.13307 4.40510
6 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 -0.28192 -0.13307 -0.27609
7 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 -0.28192 -0.13307 -0.27609
8 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 -0.28192 -0.13307 -0.27609
9 -0.31289 -0.10442 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 -0.28192 -0.13307 -0.27609
10 -0.31289 8.16410 -0.14504 -0.1143 -0.11115 -0.12753 -0.10413 -0.28192 -0.13307 -0.27609
dl.data[1:10,1:10]
H2OFrame with 10 rows and 10 columns
DF.L4.C1 DF.L4.C2 DF.L4.C3 DF.L4.C4 DF.L4.C5 DF.L4.C6 DF.L4.C7 DF.L4.C8 DF.L4.C9 DF.L4.C10
1 -1 -1 1 -1 1 1 1 1 -1 -1
2 -1 -1 1 -1 1 1 1 1 -1 -1
3 -1 -1 1 -1 1 1 1 1 -1 -1
4 -1 -1 1 -1 1 1 1 1 -1 -1
5 -1 -1 1 -1 1 1 1 1 -1 -1
6 -1 -1 1 -1 1 1 1 1 -1 -1
7 -1 -1 1 -1 1 1 1 1 -1 -1
8 -1 -1 1 -1 1 1 1 1 -1 -1
9 -1 -1 1 -1 1 1 1 1 -1 -1
10 -1 -1 1 -1 1 1 1 1 -1 -1
編集:同じデータセットと別のデータセットを複数回実行しましたが、異なる結果が得られます。コードをまったく変更していませんが、機能する場合と機能しない場合があります。これを制御できるパラメーターがありませんか?
更新:別のマシンで同じデータセットを試してみたところ、正しく機能しました。したがって、他のマシンの問題であるとほぼ確信しています。R を削除し、それに関連するすべてを削除してから再インストールしようとしましたが、問題は解決しませんでした。