0

NBA プレーヤー データセットに 2 つの列を追加しようとしています。最初の列は、データセット内のすべてのプレーヤーの中でプレーヤーの年齢がどの四分位にあるかを示します。2 番目の追加の列は、個々のプレーヤーの年齢がポジションの中でどの四分位にあるかを示します (つまり、ポイント ガード、スモール フォワード、センターなど)。dplyr パッケージを使用して、プレーヤーの位置に基づいてサブセットの年齢の四分位数を計算することはできますが、それを元のデータセットに戻す方法や、これが正しいアプローチであるかどうかはわかりません。

dplyr を使用して、位置に基づいてサブセットの年齢四分位数を計算しました。fuzzyjoin などの他のパッケージを使用しようとしましたが、快適に作業できません。

#Incorporate necessary packages
library(ballr)
library(magrittr)
library(dplyr)
library(tidyverse)


#Establish full player table
players <- NBAPerGameAdvStatistics(season = 2018)

#Calculates Quartiles for Each Position

Pos_quartiles <- players %>% 
  group_by(pos) %>% 
  summarise(age = list(enframe(quantile(age, probs=c(0.25,0.5,0.75,1.0))))) %>% 
  unnest

プレーヤーのデータセットには 664 の観測値と 32 の変数が含まれていると予想されます。最後の 2 つは、この手順の結果として追加されています。追加の行には、含まれるすべてのプレーヤーに基づくプレーヤーの年齢の四分位と、ポジションに基づくプレーヤーの年齢の四分位が表示されます。

4

1 に答える 1