python - パンダでのゲームデータのモデリング

翻译自：https://stackoverflow.com/questions/17846500 2013-07-24T23:23:28.653

119 次

パンダでゲームデータの統計分析をしようとしています。

私の生データは、「home_team」と「away_team」を使用してゲームごとに保存されます (実際、生データは、2 つのチームのリストである非正規化された「teams」プロパティを使用して mongDb に保存されます。すべてのゲームのチーム)

データを DataFrame に入れるときにデータのインデックスを作成する方法を決定しようとしています。

各ゲームのチームごとに行を入れると、各ゲームに 2 つの行があり、チームごとにゲームを簡単に見つけることができますが、すべてのゲームを集計しようとすると行が重複します。

基本的に、2 つの異なるサブセット (チーム A とのすべてのゲーム、および特定の期間内のすべてのゲーム) を取得しようとして立ち往生しています。

データをスライスするために必要なさまざまな方法のために、2 つの異なる DataFrame が必要ですか?

1 に答える 1