1) テキスト分類のために weka で LSI などの機能削減方法を適用するにはどうすればよいですか?
2) LSI などの機能削減手法を適用すると、分類の精度が向上しますか?
1) テキスト分類のために weka で LSI などの機能削減方法を適用するにはどうすればよいですか?
2) LSI などの機能削減手法を適用すると、分類の精度が向上しますか?
FilteredClassifierクラスまたはAttributeSelectedClassifierを見てください。FilteredClassifier を使用すると、主成分分析 (PCA) などの機能削減方法を使用できます。PCA を使用してデータセットをフィルタリングする方法のビデオを次に示します。これにより、削減されたデータセットでさまざまな分類子を試すことができます。
それは役に立ちますが、それについての保証はありません。冗長な機能を削除するか、何らかの方法で機能を変換すると (SVM や PCA のように)、分類タスクがより簡単になります。とにかく、多数の機能は通常、次元の呪いにつながり、属性選択はそれを回避する方法です。