年 (2016、2015、2014 など) でラベル付けされた複数のタブを含む Excel ファイルをコンパイルしたいと考えています。各タブには同じデータがありますが、列名のスペルは年ごとに異なる場合があります。
結合する前に、各シートの列を標準化したいと思います。
これは、そのようなタスクを使用してpurrr
とを組み合わせる一般的な方法です。readxl
combined.df <- excel_sheets(my.file) %>%
set_names() %>%
map_dfr(read_excel, path = my.file, .id = "sheet")
...ただし、前述のように、これにより、同じデータを持つ「COLUMN ONE」と「Column One」の別々の列が作成されます。
パイプラインに挿入make.names
することがおそらく最善の解決策です。
すべてをまとめておくのが理想的です...次のようなものです:
combined.df <- excel_sheets(my.file) %>%
set_names() %>%
map(read_excel, path = my.file) %>%
map(~(names(.) %>% #<---WRONG
make.names() %>%
str_to_upper() %>%
str_trim() %>%
set_names()) )
..しかし、構文はすべて間違っています。