パンダでゲームデータの統計分析をしようとしています。
私の生データは、「home_team」と「away_team」を使用してゲームごとに保存されます (実際、生データは、2 つのチームのリストである非正規化された「teams」プロパティを使用して mongDb に保存されます。すべてのゲームのチーム)
データを DataFrame に入れるときにデータのインデックスを作成する方法を決定しようとしています。
各ゲームのチームごとに行を入れると、各ゲームに 2 つの行があり、チームごとにゲームを簡単に見つけることができますが、すべてのゲームを集計しようとすると行が重複します。
基本的に、2 つの異なるサブセット (チーム A とのすべてのゲーム、および特定の期間内のすべてのゲーム) を取得しようとして立ち往生しています。
データをスライスするために必要なさまざまな方法のために、2 つの異なる DataFrame が必要ですか?