sklearn.pipeline.Pipeline
特徴抽出器と分類器を連鎖させるために使用しています。複数の特徴選択クラス (たとえば のクラスsklearn.feature_selection.text
) を並列に組み合わせて、それらの出力を結合する方法はありますか?
私のコードは次のようになります。
pipeline = Pipeline([
('vect', CountVectorizer()),
('tfidf', TfidfTransformer()),
('clf', SGDClassifier())])
その結果、次のようになります。
vect -> tfidf -> clf
次のようなパイプラインを指定できるようにしたいと考えています。
vect1 -> tfidf1 \
-> clf
vect2 -> tfidf2 /