0

ゴール

予期しない無関係な最初の列を持つ xlsx ファイルのリストをインポートしてバインドします。(削除する必要がありますが、無関係な最初の列がどのファイルに含まれているかわかりません。)

# sample : remind that the xlsx file originally don't have any column names

    DT1 = data.table(a = c("TYPE","X","Y","Z"), b = c("MONTH","Jan","Feb","Mar"))
    DT2 = data.table(a = c(NA,NA,NA,"random_irrelevant_vale") ,b = c("TYPE","X","Y","W"), c = c("MONTH","Apr","Feb","May"))

# give "idcol" & col_names = FALSE is a must
    PATH_LIST<- list.files(path = "PATH",
                               pattern = "*.xlsx",full.names = TRUE)
    names(PATH_LIST) <- basename(PATH_LIST)

    rbindlist(lapply(PATH_LIST,import,col_names = FALSE,
                             col_types = "text"),
                      idcol = "source",fill = TRUE) 

    # EXPECTED OUTPUT
    TYPE MONTH
    X    Jan
    Y    Feb
    Z    Mar
    X    Apr
    Y    Feb
    W    May
  • "random_irrevelevant_value" はランダムな値であるため、単に !grepl("random_irrevelevant_value",x) を使用することはできません。

import と rbind のステップの間にこれを達成するにはどうすればよいですか?

4

1 に答える 1