式を使用して入力データをモデル行列に変換できるJavaライブラリを探しています。この式は単純な算術方程式ではなく、変数間の相互作用を記述し、カテゴリ変数を適切な数値範囲にマッピングし、入力ベクトル/行列で変換を生成します。
たとえば、Rには次のmodel.matrix
関数があります。これを使用すると、変数間の相互作用を高レベルで記述することにより、入力データを変換できますformula
。
Rの簡単な例
入力データ:
electric_usage,temperature,time_of_day
30,85,morning
35,80,evening
式:
electric_usage ~ temperature * time_of_day
これは式の省略形です:
electric_usage ~ temperature + time_of_day + (temperature : time_of_day)
たとえば、Rでは:
> model.matrix(
electric_usage ~ temperature * time_of_day,
data.frame(
electric_usage=c(30,35),
temperature=c(85,80),
time_of_day=c("morning", "evening")
)
)
(Intercept) temperature time_of_daymorning temperature:time_of_daymorning
1 85 1 85
1 80 0 0
Rドキュメントを参照してください: http ://stat.ethz.ch/R-manual/R-patched/library/stats/html/model.matrix.html