1) IG、MI などの機能の重み付け方法を適用して機能を重み付けしたいのですが、StringToWordVector では、weka の機能の重み付けに TF-IDf しか使用できません。
用語の重み付けに TF-IDF 以外の重み付け方法を適用する方法はありますか?
2) Java コードの各機能の TF-IDF 重みにアクセスするにはどうすればよいですか? コードをデバッグしたところ、すべての用語に重み 1.0 が割り当てられていることがわかりました。
filterInstances.attribute(i).weight() // filter instances is set of instances after applying tf-idf
3) IG が 0 未満の用語は分類プロセスに役立たず、語彙から常に除外する必要がありますか?
事前にサンクス...