同じ長さであることがわかっている2つのパンダデータシリーズがあります。各 Series には、各要素に sets() が含まれています。これら 2 つのシリーズのセットの要素ごとの結合を取得する計算効率の良い方法を見つけたいと思います。以下で遊ぶために、偽の短いシリーズでコードの簡略化されたバージョンを作成しました。この実装は、これを行うには非常に非効率的な方法です。これを行うには、より高速な方法が必要です。私の実際のシリーズはもっと長く、この操作を何十万回も行わなければなりません。
import pandas as pd
set_series_1 = pd.Series([{1,2,3}, {'a','b'}, {2.3, 5.4}])
set_series_2 = pd.Series([{2,4,7}, {'a','f','g'}, {0.0, 15.6}])
n = set_series_1.shape[0]
for i in range(0,n):
set_series_1[i] = set_series_1[i].union(set_series_2[i])
print set_series_1
>>> set_series_1
0 set([1, 2, 3, 4, 7])
1 set([a, b, g, f])
2 set([0.0, 2.3, 15.6, 5.4])
dtype: object
シリーズをデータ フレームに結合して適用機能を使用しようとしましたが、セットはデータフレーム要素としてサポートされていないというエラーが表示されます。