python - 1 つの列の値の組み合わせに基づいて pandas データフレームを効率的に分割する

翻译自：https://stackoverflow.com/questions/67686479 2021-05-25T10:50:34.637

83 次

1つの列を持つデータフレームがあり、3つの一意の値があるとしましょう

import pandas as pd
df = pd.DataFrame(['a', 'b', 'c'], columns = ['string'])
df

各データフレームに2つの一意の値が含まれるように、このデータフレームをより小さなデータフレームに分割したいと考えています。上記の場合、3 つのデータフレーム 3c2(nCr) = 3.df1 - [ab] df2 - [ac] df3 - [bc] が必要です。以下のリンクをクリックして、現在の実装を確認してください。

現在のコードと出力を表示するには、ここをクリックしてください

import itertools
for i in itertools.combinations(df.string.values, 2):
    print(df[df.string.isin(i)], '\n')

パンダの groupby のようなものを探しています。ループ内のデータのサブセット化には時間がかかるためです。サンプルケースの 1 つでは、609 個の一意の値があり、ループを完了するのに約 3 分かかりました。したがって、実際のシナリオでは一意の値が最大 1000 になる可能性があるため、同じ操作を実行するための最適化された方法を探しています。

python - 1 つの列の値の組み合わせに基づいて pandas データフレームを効率的に分割する

1 に答える 1

Related

Reference