分類器のパラメーターを決定するために GridSearchCV を使用したいと思います。パイプラインを使用することは良い選択肢のようです。
このアプリケーションは、Bag-of-Word 機能を使用した画像分類用になりますが、問題は、トレーニング サンプルとテスト サンプルのどちらを使用するかによって、異なる論理パイプラインが存在することです。
トレーニング セットごとにKMeansを実行して、テストに使用される語彙を生成する必要がありますが、テスト データに対しては KMeans プロセスは実行されません。
パイプラインの動作のこの違いをどのように指定できるかわかりません。