データを中央に配置する機能があります:
center_colmeans <- function(x) {
xcenter = colMeans(x)
x - rep(xcenter, rep.int(nrow(x), ncol(x)))
}
mtcars$cyl <- as.character(mtcars$cyl)
center_colmeans(mtcars)
これは、cyl を削除すると問題なく実行されます (文字列であるため)。次のように:
center_colmeans(mtcars[4:8])
しかし、cylをそのまま維持しながら、すべての数値変数で「center_colmeans」を実行したいと思います。私のデータには、そのまま保持しない複数の文字列列があります。中央平均を使用して、最終的なデータセットにそれらが必要です。どんなアイデアでも大歓迎です!