4

もう一度簡単な質問: Ngrams (unigram/bigrams など) を単純なバイナリ機能として使用する方が良いですか?それとも、感情分析やテキストの分類/分類などの NLP タスクを実行するための Support Vectory Machines などの ML モデルで Tfidf スコアを使用する方がよいでしょうか?

4

1 に答える 1

3

スティーブがコメントで述べたように、最良の答え (および ML スタイルの方法) は ! を試すことです。

そうは言っても、バイナリ機能から始めます。SVM のような ML モデルの目標は、これらの機能の「重み」を決定することです。そのため、効率的であれば、事前にこの重みを設定する必要はありません (TFIDF などを使用)。

于 2013-01-27T14:42:22.600 に答える