16

sklearn.pipeline.Pipeline特徴抽出器と分類器を連鎖させるために使用しています。複数の特徴選択クラス (たとえば のクラスsklearn.feature_selection.text) を並列に組み合わせて、それらの出力を結合する方法はありますか?

私のコードは次のようになります。

pipeline = Pipeline([
    ('vect', CountVectorizer()),
    ('tfidf', TfidfTransformer()),
    ('clf', SGDClassifier())])

その結果、次のようになります。

vect -> tfidf -> clf

次のようなパイプラインを指定できるようにしたいと考えています。

vect1 -> tfidf1 \
                 -> clf
vect2 -> tfidf2 /
4

1 に答える 1

17

これは最近、scikit-learn の master ブランチにFeatureUnion次の名前で実装されました。

http://scikit-learn.org/dev/modules/pipeline.html#feature-union

于 2012-10-04T09:36:26.597 に答える