パッケージreadxlを使用してExcelファイルをロードしています。デフォルトでは、空白を削除する必要がありますが、そうしていません。
このファイルは、以下のリンクから直接ダウンロードするか、別の方法として、付録 B にある Web サイトからダウンロードできます。
http://www2.nationalgrid.com/WorkArea/DownloadAsset.aspx?id=8589937799
require(readxl);require(tidyverse)
test <- read_excel("ETYS 2016 Appendix B.xlsx", skip = 1, sheet = 22, trim_ws = TRUE)
print(test$`MVAr Generation`)
test$`MVAr Generation` %>% str_count(patter = "\\s")
test$`MVAr Generation` %>% table #all are numeric
test$`MVAr Generation` %>% class #however the class is characer
test$`MVAr Generation` %>% str_count(patter = "\\s") %>%
sum(na.rm = T) #It should be 0 however it is 2
この問題は、数値列が文字であるこの例でわかるように、分析で問題を引き起こしています。助けていただければ幸いです