2

私がすることができます:

data <- read.csv("data.csv")
p1 <- subset(data, player_name == 'Player1')
p2 <- subset(data, player_name == 'Player2')

dist(rbind(p1[,c("gp","points")], p2[,c("gp","chances_for","chances_for_help")]))

そして距離をとります。しかしdata、そこには1000行以上あり、GPとポイントに基づいて各行に最も類似した10個のレコードが必要ですが、よくわかりません。

何かのようなもの:

apply(data, 1, function(p) {
    dist(rbind(p, data))
})

しかし、明らかにそれは機能していません。ここで簡単な修正はありますか?

サンプルデータ:

player_name,gp,points
Player 1,82,95
Player 2,80,88
Player 3,81,84
Player 4,82,90
Player 5,82,77
4

1 に答える 1