0

すでに機能している以下のコードを関数に変換しようとしています。

同様の状況である dcast + DT は、すでにここで議論されています。しかし、私はそのような問題を解決することができませんでした。

私が達成したいことは次のとおりです。

  • 複数行のコードに対して 2 つの引数のみを変更し、
  • 関数内の各行で作成されたオブジェクトを作業ディレクトリに書き込みます

これはすでに動作するコードです:

result1 <- dcast(setDT(data), customer_id ~ paste0("num_of_oranges",period), value.var = "num_of_oranges", sum)
result2 <- dcast(setDT(data), customer_id ~ paste0("num_of_oranges",period) + paste0("SIGN_",sign), value.var = "num_of_oranges", sum)
result3 <- dcast(setDT(data), customer_id ~ paste0("num_of_oranges",period) + paste0("SIGN_",sign) + paste0("ORIGIN_",origin), value.var = "num_of_oranges", sum)

関数に対する私の試み:

create.Feature <- function(col1, stat) {

  test1 <- dcast(df, df[[id]] ~ paste0("col1",df[[period]]), value.var = df[["col1"]], stat)  
 return(test1)
  test2 <- dcast(df, df[[id]] ~ paste0("col1",df[[period]]) + paste0("SIGN",df[[sign]]), value.var = df[["col1"]], stat)
  return(test2)
  test3 <- dcast(df, df[[id]] ~ paste0("col1",df[[period]]) + paste0("SIGN",df[[sign]]) + paste0("ORIGIN",df[[origin]]), value.var = df[["col1"]], stat)
  return(test3)

そして呼び出し:

test_result <- create.Feature("num_of_oranges", sum)

次のエラーが表示されます: Error in .subset2(x, i, exact = exact) : no such index at level 1

誰?

4

1 に答える 1

1

データセットを使用しmtcarsて関数を再現してみました。

コード:

cars <- mtcars

result1 <- dcast(setDT(cars), cyl ~ paste0("disp", gear), 
                 value.var = "disp", 
                 sum)
result2 <- dcast(setDT(cars), cyl ~ paste0("disp", gear) + 
                       paste0("am", am),
                 value.var = "disp", 
                 sum)
result3 <- dcast(setDT(cars), cyl ~ paste0("disp", gear) + 
                       paste0("am", am) +
                       paste0("vs", vs),
                 value.var = "disp", 
                 sum)

create.Feature <- function(df, id, col1) {
      test1 <- dcast(df,
                     df[[id]] ~ paste0(col1, df[["gear"]]),
                     value.var = col1,
                     sum)
      test2 <- dcast(df,
                     df[[id]] ~ paste0(col1, df[["gear"]]) + 
                           paste0("am", df[["am"]]),
                     value.var = col1,
                     sum)
      test3 <- dcast(df,
                     df[[id]] ~ paste0(col1, df[["gear"]]) +
                           paste0("am", df[["am"]]) +
                           paste0("vs", df[["vs"]]),
                     value.var = col1,
                     sum)
      list(test1, test2, test3)
}

tr <- create.Feature(df = cars, 
                     id = "cyl", 
                     col1 = "disp")

出力:

tr
[[1]]
   df  disp3 disp4 disp5
1:  4  120.1 821.0 215.4
2:  6  483.0 655.2 145.0
3:  8 4291.4   0.0 652.0

[[2]]
   df disp3_am0 disp4_am0 disp4_am1 disp5_am1
1:  4     120.1     287.5     533.5     215.4
2:  6     483.0     335.2     320.0     145.0
3:  8    4291.4       0.0       0.0     652.0

[[3]]
   df disp3_am0_vs0 disp3_am0_vs1 disp4_am0_vs1 disp4_am1_vs0
1:  4           0.0         120.1         287.5             0
2:  6           0.0         483.0         335.2           320
3:  8        4291.4           0.0           0.0             0
   disp4_am1_vs1 disp5_am1_vs0 disp5_am1_vs1
1:         533.5         120.3          95.1
2:           0.0         145.0           0.0
3:           0.0         652.0           0.0

ただし、いくつかのポイント:

  1. いくつかの変数を関数にハードコーディングしました (私が推測します)、たとえばdf[[sign]]df[[origin]]、私は同じことをしました。
  2. 関数にを取得できないようです。そのため、 の代わりに を関数statに追加しました。何が問題なのかわかりません。試してみましたが、動作しないようです。sumstatmatch.fun()do.call
  3. あなたの関数でtest3は、最後のステートメントでした.3つすべてが必要だと仮定test1test2test3ので、それらをリストに結合し、それを出力(最後のステートメント)にしました。

これがあなたが望むものかどうかわからない場合は、そうでない場合は、すぐに入手できることを願っています. 私は個人的に を使用しません。data.tableより多くの を使用しますdplyr

于 2017-01-30T13:59:41.473 に答える