私は、基本的にさまざまな都市 (約 150 都市) による毎日の使用状況データ (変数 X と Y としましょう) であるデータセットを使用しています。150 の都市から 3 つだけを選択して、特定の都市のみのデータのサブセットを作成しました。
次に、tapply
都市ごとに行うと、3 つの都市の平均値が得られますが、データ セットに含まれていた他の 147 都市すべての NA も得られます。以下のコーディングを使用しています
df<-read.csv(...)
df_sub<-subset(df,df$City==1|df$City==3|df$City==19)
X_Breakdown<-tapply(X,df_sub$City, mean, na.rm=TRUE)
Print(X_Breakdown)
それは私に与えます:
City 1 City 2
15 NA
City 3 City 4
12 NA
City 5 City 6
NA NA
アイデアが得られることを願っています。関心のある 3 つの都市のみを含むデータセットを取得したいと考えています。
変数のセットが R でエンコードされているようですが、これを修正する方法はありますか?