machine-learning - weka で TF-IDF 以外の機能重み付け方法を使用するにはどうすればよいですか?

翻译自：https://stackoverflow.com/questions/21797930 2014-02-15T13:02:00.537

363 次

1) IG、MI などの機能の重み付け方法を適用して機能を重み付けしたいのですが、StringToWordVector では、weka の機能の重み付けに TF-IDf しか使用できません。

用語の重み付けに TF-IDF 以外の重み付け方法を適用する方法はありますか?

2) Java コードの各機能の TF-IDF 重みにアクセスするにはどうすればよいですか? コードをデバッグしたところ、すべての用語に重み 1.0 が割り当てられていることがわかりました。

 filterInstances.attribute(i).weight() // filter instances is set of instances after applying tf-idf

3) IG が 0 未満の用語は分類プロセスに役立たず、語彙から常に除外する必要がありますか?

事前にサンクス...

0 に答える 0