私がすることができます:
data <- read.csv("data.csv")
p1 <- subset(data, player_name == 'Player1')
p2 <- subset(data, player_name == 'Player2')
dist(rbind(p1[,c("gp","points")], p2[,c("gp","chances_for","chances_for_help")]))
そして距離をとります。しかしdata
、そこには1000行以上あり、GPとポイントに基づいて各行に最も類似した10個のレコードが必要ですが、よくわかりません。
何かのようなもの:
apply(data, 1, function(p) {
dist(rbind(p, data))
})
しかし、明らかにそれは機能していません。ここで簡単な修正はありますか?
サンプルデータ:
player_name,gp,points
Player 1,82,95
Player 2,80,88
Player 3,81,84
Player 4,82,90
Player 5,82,77