machine-learning - 個別のテストセットを使用して、rapidminer で InformationGain を適用する方法は?

Question

私はrapidminerでテキスト分類を扱っています。私は別々のテストとトレーニングの分割を持っています。n 分割クロス検証を使用してデータセットに情報ゲインを適用しましたが、別のテストセットに適用する方法について混乱していますか? 以下添付画像ですここに画像の説明を入力

図では、トレーニングに使用される最初の「ファイルからのドキュメントの処理」からの単語リスト出力を、テストに使用される2番目の「ファイルからのドキュメントの処理」に接続しましたが、削減された機能を2番目の「ドキュメントからの処理」に適用したいと考えていますFiles」はおそらく「Select By Weight」（縮小された次元）演算子から返されるはずですが、2番目の「Process Documents From Files」に提供できない重みを返します。私はたくさん検索しましたが、私のニーズを満たすことができるものを見つけることができませんでしたか?

Rapidminer が個別のテスト/トレイン分割を行い、機能選択を適用することは本当に可能ですか?

これらの重みを単語リストに変換する方法はありますか? リポジトリに書き込むとは言わないでください (これはできません) ?

このようなシナリオでは、異なるテスト/トレーニング分割があり、機能選択を適用する必要がある場合、テスト/トレーニング分割に同じ次元ベクトルがあることを確認するにはどうすればよいですか?

私は本当にそれに閉じ込められています、親切に助けてください...

score 1 · Accepted Answer

下の演算子の直後に、.の前にProcess Documents新しい演算子を挿入します。演算子を使用して重みを演算子からコピーし、これを新しい演算子の入力に接続します。Select By WeightApply ModelMultiplyWeight By Information GainSelect By Weight

machine-learning - 個別のテスト セットを使用して、rapidminer で InformationGain を適用する方法は?

1 に答える 1

Related

Reference

machine-learning - 個別のテストセットを使用して、rapidminer で InformationGain を適用する方法は?