21 列の pandas データフレームがあります。各行に固有の 6 を除いて、まったく同じ列データ値を持つ行のサブセットに注目しています。これらの 6 つの値がアプリオリに対応する列見出しはわかりません。
各行を Index オブジェクトに変換してみ、2 つの行に対して set 操作を実行しました。元。
row1 = pd.Index(sample_data[0])
row2 = pd.Index(sample_data[1])
row1 - row2
これは、row1 に固有の値を含む Index オブジェクトを返します。次に、どの列に一意の値があるかを手動で推測できます。
初期データフレームでこれらの値が対応する列見出しをプログラムで取得するにはどうすればよいですか? または、2 つまたは複数のデータフレーム行を比較し、各行の 6 つの異なる列の値と対応する見出しを抽出する方法はありますか? 理想的には、一意の列を持つ新しいデータフレームを生成するとよいでしょう。
特に、集合演算を使用してこれを行う方法はありますか?
ありがとうございました。