たくさんのバスケットボール データを照合する大きなデータフレームがあります (下のスクリーンショット)。Opp Lineup の右側にあるすべての列は、そのプレーヤー (列名で示される) が現在のラインナップに含まれているかどうかを示すダミー変数です (列名の最後の部分はチーム名であり、対戦相手の列と比較する必要があります)。異なるチームで同じ番号と名前を持つ 2 人のプレイヤーが混乱しないようにしてください)。pandas データフレーム (iterrows、itertuples、iteritems) を反復処理するいくつかの方法を知っていますが、必要なことを達成する方法がわかりません。これは、各列の各行です。
- チーム (columnname.split()[2:]) を対戦相手の列と比較します (LSU プレーヤーを除く)。
- 名前 (columnname.split()[:2]) が Opp ラインナップにあるかどうか、または LSU プレーヤーの場合はラインナップにあるかどうかを確認します
- 上記の条件が満たされている場合、その値を 1 に置き換え、それ以外の場合は 0 のままにします
データフレームをループしてこのタスクを達成するための最良の方法は何ですか? この場合、速度はあまり重要ではありません。関連するすべてのロジックを理解していますが、パンダをループする方法を知るのに十分な知識がなく、Google で見たさまざまなことを試してもうまくいきません。