私は現在、より大きな計算の中に次のパターンを埋め込んでいます
seq1.isin(seq2[seq3].unique().compute().values)
はseq3
ブール値シリーズです。パフォーマンスは許容できるように見えますが、見苦しく、compute()
強制評価の使用により、並列処理の機会が失われる可能性があります。簡単に言うと
seq1.isin(seq2[seq3].unique())
は機能せず、ドキュメントによると、への引数isin
は (Numpy だと思います) 配列でなければなりません。
上記のコードを書くためのより良い方法はありますか? seq1
とが同じ場合はどうなりseq2
ますか?