Kaggle でタイタニックの災害競争に Python を使用しています。データセット (df) には、各乗客に対応する 3 つの属性 (「Gender」(1/0)、「Age」、「Pclass」(1/2/3)) が含まれています。Gender-Pclass の各組み合わせに対応する年齢の中央値を取得したいと考えています。
最終結果は次のようなデータフレームになるはずです-
Gender Class
1 1
0 2
1 3
0 1
1 2
0 3
平均年齢は後で計算されます
次のようにデータフレームを作成しようとしました-
unique_gender = pd.DataFrame(df.Gender.unique())
unique_class = pd.DataFrame(df.Class.unique())
reqd_df = pd.merge(unique_gender, unique_class, how = 'outer')
しかし、得られる出力は -
0
0 3
1 1
2 2
3 0
誰かが希望の出力を得るのを手伝ってもらえますか?